İşletme Analitiği Dersi 8. Ünite Sorularla Öğrenelim

İşlemtabloları ile Veri Madenciliği

1. Soru

 Microsoft Excel ve SQL Server Analysis Services (SSAS)in veri madenciliğindeki önemi nedir?

Cevap

Microsoft Excel ile yapılan veri madenciliği işlemlerinde SQL Server Analysis Services (SSAS) arka planda veri madenciliği sihirbazlarının çalışmasına yardımcı olan bir motor görevi görürken Excel, veri madenciliği (data mining) eklentisi sayesinde bir istemci görevi görmektedir.


2. Soru

Microsoft Excel üzerinden veri madenciliği işlemlerini yapabilmek için kaç tane temel yazılıma ihtiyaç duyulmaktadır?

Cevap

Bunlar; 2007 ve sonrası sürüme sahip bir Microsoft Ofis yazılımı, Microsoft SQL Server 2005 ya da sonrası bir sürümü ve Microsoft Excel’in Data Mining eklentisidir. Bu ünitede Microsoft Excel 2013, Microsoft SQL Server 2012 ve Microsoft SQL Server 2012 Data Mining eklentisi kullanılacaktır.


3. Soru

Microsoft SQL Server 2012 Data Mining Eklentisi Kurulumunun başarılı bir şekilde gerçekleştirilmesi için hangi hususlara dikkat edilmelidir?

Cevap

Kurulumun başarılı bir şekilde gerçekleşebilmesi için kurulum yapılacak olan ofis sürümüne uygun olan eklentinin edinilmesi gerekmektedir. 32 bit olan bir ofis sürümü üzerine 64 bit olan bir eklenti kurulumu yapılamayacaktır.


4. Soru

Microsoft SQL Server 2012 Data Mining Eklentisi Kurulumunun aşamaları nelerdir?

Cevap

1. Öncelikle Microsoft’tan ücretsiz olarak edinilebilecek “Microsoft SQL Server 2012 Data Mining Add-ins for Office” eklentisinin indirilmesi gerekmektedir.

2. İndirilen dosya çalıştırılarak kuruluma başlanacaktır.

3. Kurulum sırasında ilerlemek için Next (İleri) düğmesinin kullanılması gerekmektedir. Bir sonraki adımda lisans sözleşmesinin “I accept the terms in the licence agreement” seçeneği seçilerek kabul edilmeli ve Next düğmesine basılmalıdır.

4.Kurulması gereken özelliklerin seçilmesi gerekmektedir. Bu bölümde “Table Analysis Tools for Excel”, “Data Mining Client for Excel” ve “Server Configuration Utility” kesinlikle seçilmelidir.

5.Next düğmesine tıklanarak yükleme işlemine hazır hâle gelinecektir ve bir sonraki adımda Install (Yükle) düğmesi aracılığı ile yükleme işlemi başlayacaktır.  Yükleme işlemi bittikten sonra Finish (Bitir) düğmesi ile kurulum tamamlanacaktır.

6. Kurulum başarılı bir şekilde tamamlanmış ise Microsoft Excel 2013 programı çalıştırıldığında Data Mining sekmesinin Excel sekmeleri arasına eklendiği görülecektir.

7.Data Mining eklentisi, Microsoft SQL Server 2012 Analysis Services’ın herhangi bir sürümü ile bağlantı kurmaya ihtiyaç duymaktadır.


5. Soru

Microsoft SQL Server 2012 Enterprise Edition’ın edinilmesi ve Analysis Services’ın yapılandırılmasına nereden ve nasıl başlanır?

Cevap

Excel’e eklenmiş olan Data Mining sekmesi altındaki Help bölümünde bulunan “Getting Started” aracı kullanılabilir. Bu araca aynı zamanda başlat menüsü altından da erişim mümkündür.


6. Soru

Microsoft SQL Server 2012 Kurulumu ve Analysis Services’ın (SSAS) Yapılandırılmasında Getting Started aracının sunduğu seçenekler nelerdir?

Cevap

Getting Started aracı bize yapılandırma konusunda üç farklı seçenek sunmaktadır. Eğer kullanılmakta olan sistem üzerinde daha önceden kurulmuş olan bir SSAS bulunmakta ise “Use an existing instance of Microsoft SQL Server 2008 (or later) Analysis Services that I administer” seçeneği ya da “Connect to a Microsoft SQL Server 2008 (or later) Analysis Services instance to which I have non-administrative access” seçeneği yardımı ile kurulum adımları atlanarak yapılandırma işlemine geçilebilir.


7. Soru

Microsoft SQL Server 2012 Enterprise Evaluation Edition Kurulumunun adımları nelerdir?

Cevap

1. .iso uzantılı olarak indirilen program herhangi bir DVD’ye yazdırılarak ya da bir sanal sürücü yardımı ile kullanılmalıdır.

2. Setup.exe dosyası çalıştırılarak kuruluma başlanacaktır.

3. Microsoft SQL Server 2012 Enterprise Evaluation Edition kurulumu için Installation (kurulum) bölümü altında bulunan “New SQL Server Standalone Installation or add features to an existing installation” seçeneği seçilmelidir.

4. Seçim yapıldıktan sonra kurulum sihirbazı, kurulum için gerekli olan yazılımları kontrol edecektir ve bu kontrolü tamamladıktan sonra bir rapor sunacaktır. Kontrol işleminde herhangi bir sorun tespit edilmesi durumunda kuruluma devam edebilmek için sorun bulunan kısımların düzeltilmesi gerekmektedir. Sorunlar düzeltildikten sonra OK (Tamam) düğmesine basılarak kuruluma başlanır.

5. Kurulum başlarken bir lisans anahtarına sahip olunup olunmadığı sorulacaktır. Bu ünite kapsamında ücretsiz deneme sürümü kullanılacağı için “Specify a free edition” bölümünden “Evaluation” sürümünün kullanılacağı belirtilmeli ve Next düğmesine basılmalıdır. Her ne kadar değerlendirme sürümü kullanılacak olsa da bu sürüm yazılımın gerekli bütün özelliklerini 180 gün boyunca ücretsiz olarak sunmaktadır.

6. License Terms adımında karşımıza bir lisans sözleşmesi çıkacaktır. Kuruluma devam edebilmek için “I accept the license terms” seçeneği seçilerek bu sözleşmenin kabul edilmesi ve daha sonra Next düğmesine basılması gerekmektedir.

7. Product Updates adımında yüklenebilecek güncellemelerin listesi sunulmaktadır. “Include SQL Server product updates” seçeneğinin seçilmesi ve Next düğmesine basılması gerekmektedir. Gerekli dosyalar indirildikten sonra kurulum başlayacaktır.


8. Soru

Microsoft SQL Server 2012 Enterprise Evaluation Edition Kurulumu sırasında işlemlerin sağlıklı bir şekilde yapılabilmesi için neye dikkat etmek gerekir?

Cevap

Eğer kurulum sırasında Multidimensional and Data Mining Mode yerine Tabular Mode seçilirse Excel üzerinden veri madenciliği işlemleri sağlıklı bir şekilde yapılamayacaktır.


9. Soru

Excel Data Mining eklentisi için SSAS’in yapılandırılmasının aşamaları nelerdir?

Cevap

1. Sihirbaz çalıştırılarak yapılandırmaya başlanılacaktır. Next düğmesine basılmalıdır.

2. Yapılandırma dört farklı adımdan oluşmaktadır. Birinci adımda Data Mining eklentisinin bağlanacağı sunucu bilgisi sorulmaktadır. SSAS aynı sistem üzerinde kurulu olduğu için bu alan “localhost” olmalıdır. Next düğmesine basılarak yapılandırmaya devam edilir.

3. Sunucuya erişim kontrol edildikten sonra ikinci adıma geçilir. Bu adımda geçici madencilik modellerinin kullanılıp kullanılamayacağı izni sorulmaktadır. Geçici madencilik modellerinin kullanılabilmesi için “Allow creating temporary mining models” seçili iken Next düğmesine basılmalıdır.

4. Üçüncü adımda kullanılacak olan veritabanının seçilmesi gerekmektedir.

a. Eğer ilk kez SSAS kullanılacak ise yeni bir veritabanı oluşturulması gerekir. Bunun için “Create new database” bölümünden oluşturulacak veritabanına bir isim verilmelidir. Varsayılan olarak önerilen “DMAddinsDB” adını kullanmakta herhangi bir sakınca yoktur. Next düğmesine basılmalıdır.

b. Eğer daha önceden oluşturulmuş bir veritabanı mevcut ise “Use existing database” seçeneği seçilerek ilgili listeden kullanılmak istenen veritabanı seçilebilir. Next düğmesine basılmalıdır.

5. Dördüncü adımda ise veritabanı erişimi için kullanıcı yetkilendirmesi yapılmaktadır. Bu kısım güvenlik ve verinin yönetimi açısından büyük önem taşımaktadır ve yetkilendirme işlemi titiz bir şekilde yapılmalıdır. Yapılandırma sihirbazı bu bölümde SSAS kurulumu sırasında yetki verilmiş olan kullanıcı listesini varsayılan olarak sunacaktır. Eğer bu listede değişiklik yapılmak istenirse “Add” ve “Remove” düğmeleri kullanılabilir. Finish düğmesi yardımı ile yapılandırma sonlandırılacaktır.

6. Yapılandırma tamamlandıktan sonra yapılandırma sırasında yapılan işlemlerin raporu sunulacaktır. Close düğmesine basılarak yapılandırma sihirbazı kapatılacaktır.


10. Soru

Excel Data Mining eklentisi için SSAS’in yapılandırılmasının son aşaması nedir?

Cevap

Son olarak veri madenciliği işlemlerinde istemci görevi görecek olan Microsoft Excel ile önceki adımlarda yapılandırılmış olan SSAS arasında bir bağlantı kurulması gerekmektedir. 


11. Soru

Microsoft Excel 2013’ün yapılandırılmasını açıklayınız?

Cevap

Microsoft Excel 2013’ü açarak Data Mining sekmesi altındaki Connection bölümünden Analysis Services Connections listesi açılarak New (yeni) düğmesi aracılığı ile yeni bir bağlantı oluşturulmalıdır. Server name olarak yapılandırma sırasında belirttiğimiz “localhost” kullanılmalıdır. Catalog name altında sunulan listeden yapılandırma sırasında oluşturulan yeni veritabanının ismi seçilmelidir. Bu işlemden sonra Friendly name otomatik olarak oluşturulacaktır. “OK” düğmesi yardımı ile yeni bağlantı kurulmuş olur ve artık Microsoft Excel 2013 Veri Madenciliği işlemlerine başlamak için hazır durumdadır.


12. Soru

Excel’in veri madenciliği eklentisinin önemi nedir?

Cevap

Excel’in veri madenciliği eklentisi, SSAS’ın veri madenciliği işlemleri konusundaki gücünü ortaya çıkarmaktadır. Bu eklenti, Excel tablolarındaki veriler ile SSAS altında bulunan birçok gelişmiş veri madenciliği algoritmalarını, yapılarını ve görüntüleyicilerini kullanarak veri madenciliği işlemlerinin yapılmasını sağlamaktadır. Bu eklenti yardımı ile karmaşık veri setlerinin analizi ve kestirimler kolaylıkla yapılabilmektedir. Ayrıca verilerin ve çıkarımların Excel’de tutulması sayesinde veri desenleri istenildiği zaman kolaylıkla belgelendirilebilmektedir


13. Soru

Excel veri madenciliği eklentisi altında bulunan sihirbazlar nelerdir?

Cevap

Excel veri madenciliği eklentisi altında bulunan sihirbazlar Data Preparation, Data Modeling, Accuracy and Validation, Model Usage, Management, Connection ve Help olmak üzere yedi bölüme ayrılmaktadır.


14. Soru

Excel veri madenciliği eklentisi altında bulunan sihirbazlardan Data Preparation nedir vehangi sihirbazları barındırmaktadır?

Cevap

Data Preparation, yani verinin hazırlanması bölümü madencilik işlemlerinin sağlıklı bir şekilde yapılabilmesi için büyük önem taşımaktadır. Excel veri madenciliği eklentisi altında bulunan Data Preparation bölümü, veri madenciliği işlemleri için kullanılacak olan verinin gözden geçirilmesi ve temizlenmesi işlemlerinde yardımcı olacak bazı sihirbazları barındırmaktadır.


15. Soru

Explore Data sihirbazı nedir?

Cevap

Explore Data sihirbazı, kullanılmak istenen veri setinde seçilmiş olan herhangi bir alan (sütun) için dağılımı ve değerleri grafiklerle ifade ederek veri setinde bulunan verilerin türünün ve miktarının daha belirgin bir şekilde anlaşılmasını sağlamaktadır.


16. Soru

Clean Data altında bulunan sihirbazların görevi nedir?

Cevap

Clean Data altında bulunan sihirbazlar, veri madenciliği işlemleri için kullanılmak istenen veri seti içerisindeki anormallikleri tespit etmeyi, yapılan tespitler sonucu veri setini tekrar organize etmeyi ve böylelikle kullanılmak istenen veri setini veri madenciliği işlemleri için hazır hâle getirmeyi sağlamaktadır.


17. Soru

Bir değeri aykırı olarak nitelendirebilme ölçütleri nelerdir?

Cevap

Bunlar:

- Değerin, beklenilen aralığın dışında olma durumu

- Verinin yanlış yazılmış olma ihtimali

- Değerin yazılmamış olma durumu

- Verinin boşluk karakterinden ya da boş bir dizinden (NULL string) oluşması

- Değerin, model dağılımını ciddi şekilde etkileme durumudur.


18. Soru

Verinin Örneklendirilmesi (Sample Data) nedir?

Cevap

Excel’in veri madenciliği eklentisinde bulunan Sample Data sihirbazı, veri setini yeniden örneklendirerek istenilen amaca daha uygun yeni bir veri seti oluşturmakta ya da bir model için kullanılacak olan veriyi istenilen oranda iki farklı gruba ayırabilmektedir. Bu gruplardan birisinde bulunan veri, desenleri incelenerek model oluşturulma aşamasında kullanılmakta, diğer grupta bulunan veri ise oluşturulacak olan modelin test edilmesi aşamasında kullanılabilmektedir.


19. Soru

Rastgele Örnekleme (Random Sampling) nedir?Açıklayınız.

Cevap

Excel tablolarında ya da dış bir veri kaynağında bulunan verileri Sample Data sihirbazının random sampling özelliği ile rastgele örneklemek mümkündür. Rastgele örnekleme yöntemi, oluşturulmuş bir model ile test edilen verilerin, modelin oluşturulması sırasında kullanılmış olan verileri açık bir şekilde temsil ettiğini göstermenin en iyi yoludur.


20. Soru

Amaçlı Örnekleme (Oversampling) nedir? Açıklayınız.

Cevap

Excel tablolarında bulunan verileri Sample Data sihirbazının oversampling özelliği ile istenilen kriterlere göre örneklemek mümkündür. Veri tablosunu oversampling özelliği ile istenilen oranda yeniden örneklendirerek tablo içerisinde nadir olan bir değerin oluşturulacak yeni örneklemde daha sık yer alması sağlanabilmektedir ve böylece seçilmiş olan verinin örneklem içerisindeki temsil yeteneği arttırılmış olacaktır.


21. Soru

Verinin Modellenmesi (Data Modeling) nedir?

Cevap

Data modeling, Data preparation işlemi sonrası hazırlanmış olan verilerin veri madenciliği fonksiyonları ve algoritmaları ile değerlendirilerek verilerin trendlerinin ve desenlerinin belirlendiği veri madenciliği adımıdır. 


22. Soru

Verinin Modellenmesi (Data Modeling) bölümünde bulunan sihirbazlar nelerdir?

Cevap

Sınıflandırma (Classify),Tahminleme (Estimate),Kümeleme (Cluster), Birliktelik (Associate),Öngörüleme (Forecast), İleri Düzey Yapılandırma ve Modelleme (Advanced)dir.


23. Soru

Tahminleme modeli ne zaman kullanılabilir?

Cevap

Tahminleme modeli, sonuç değerlerinin miktar, para birimi, tarih ya da zaman gibi sayısal değerler olduğu durumlarda kullanılabilmektedir.


24. Soru

Kümeleme modeli ne zaman kullanılabilmektedir?

Cevap

Kümeleme modeli her tür veri desenini araştırmak için kullanılabilmektedir.


25. Soru

Bağıl önem nedir?

Cevap

Bağıl önem, birbiriyle ilişkili olan ögeler arasındaki ilişkinin önemini ifade etmektedir.


26. Soru

Associate sihirbazının kullanılabilmesi neye bağlıdır?

Cevap

Associate sihirbazının kullanılabilmesi için kaynak veri tablosu kesinlikle bir kayıt-işleme tablosu (transaction table) şeklinde tasarlanmış olmalıdır.


27. Soru

Test Etme ve Geçerliliği Doğrulamanın (Accuracy and Validation) önemi nedir?

Cevap

Veri madenciliği çalışmalarında, oluşturulmuş olan ya da kullanılan modelin geçerli bir model olması büyük önem taşımaktadır. Bu yüzden modelin test edilmesi ve geçerliliğinin doğrulanması gerekmektedir. Tasarlanmış olan modeli endüstriyel alanda kullanıma sunmadan önce modelin gerçek veriler ile çalışıldığı durumlarda nelerle karşılaşılabileceğinin iyi bir şekilde bilinmesi gerekmektedir.


28. Soru

Accuracy and Validation bölümünde bulunan sihirbazlar nelerdir?

Cevap

Doğruluk Grafiği (Accuracy Chart), Sınıflandırma Matrisi (Classification Matrix), Kâr Grafiği (Profit Chart), Çapraz Doğrulama (Cross-Validation) dir.


29. Soru

İyileşme grafiği önemi nedir?

Cevap

İyileşme grafiği, birden fazla modeli tek bir grafik ile kıyaslama imkânı sunmaktadır.


30. Soru

Model Usage ve Management nedir ve altında bulunan sihirbazlar neler yapabilir?

Cevap

Model Usage ve Management bölümleri altında bulunan sihirbazlar, veri madenciliği süreci sırasında oluşturulmuş olan ve SSAS içerisindeki bir örnekte tutulan veri madenciliği modellerine göz atma, modeller üzerinde değişiklik yapma, bir sorgu oluşturma ve modelleri yönetme imkânı sunmaktadır. Kullanıcı yeterli yetkilere sahip olduğu sürece var olan modelleri Excel istemcisi aracılığı ile kolaylıkla silebilir, değiştirebilir, yeniden adlandırabilir ya da yönetebilir.


31. Soru

 Tahmin sorgusu nedir?

Cevap

Trendlerden yola çıkarak bir kestirim yapabilmek için yeni bir verinin var olan bir model üzerinde uygulanması sürecine tahmin sorgusu adı verilmektedir.


32. Soru

Modellerin Yönetimi (Manage Models) ile neyin yapılması mümkün değildir?

Cevap

Manage Models sihirbazı yardımı ile yeni bir veri madenciliği modeli ya da sorgusu oluşturulamamaktadır.


33. Soru

Bağlantı (Connection) altında bulunan sihirbazların görevi nedir?

Cevap

Connection bölümü altında bulunan sihirbazlar yardımıyla SSAS sunucu ile kurulmuş olan bağlantı yönetilmektedir.


34. Soru

Yardım (Help) bölümü altında neler bulunmaktadır?

Cevap

Help bölümü altında Excel veri madenciliği eklentisinin kurulumu ve kullanımı konusunda yardımcı olabilecek kaynaklar bulunmaktadır


Yaz Okulu Kayıt ve Ders Seçme
5 Temmuz 2021 Pazartesi