E-Perakendecilik Dersi 5. Ünite Sorularla Öğrenelim

Elektronik Alışveriş: Güvenlik Ve Ödeme Sistemleri

1. Soru

Veri (Data) nedir? 

Cevap

  Veri (Data), ham haldeki yani işlenmemiş kayıtlardır. Veri kelimesi Latince’de gerçek anlamına gelen datum kelimesine denk gelmektedir. Data olarak kullanılan kelime ise çoğul datum anlamına gelmektedir. Kavramsal anlamda veri, kayıt altına alınmış her türlü olay, durum, fikirdir.


2. Soru

Enformasyon (Information) nedir? 

Cevap

 Enformasyon (Information), verilerin düzenlenmiş, ilişkilendirilmiş ve anlamlandırılmış hali olarak tanımlanır. Enformasyonlar belirli bir amaç doğrultusunda yapılmaktadır. O nedenle enformasyon başka bir amaç için veri halini korumaktadır.


3. Soru

Bilgi (Knowledge) nedir? 

Cevap

 Bilgi (Knowledge), enformasyonun birey tarafından algılanması ve sonuç çıkarmasıyla oluşur. Birey bilgiye ulaşmak için Veri Madenciliği (data mining) teknolojisi içeren uygulamalar kullanarak, veri içerisindeki gizli eğilim ve örüntüleri belirler.


4. Soru

Ambar ne demektir? 

Cevap

 Ambar ürünlerin depolandığı binalardır. Ürünlerin belirli bir düzen içinde yerleştirilip, kullanılmak veya sevk etmek amacıyla tutulmasıdır.


5. Soru

Veri ambarı ne demektir? 

Cevap

 Veri ambarları basit olarak veri madenciliği işleminin yapılacağı verilerin oluşturulduğu özel veri tabanlarıdır. Veri tabanlarındaki veriler ile analiz yapmak ve karar destek aşamasında faydalanmak, veri madenciliği ile mümkün olabilmektedir. Madenciliği yapılacak olan verinin de bazı vasıflara sahip olması gerekir. Bu vasıflar veri ambarı (Data Warehouse) ile sağlanmaktadır.


6. Soru

Veri ambarlarının oluşturulması nasıl bir işlemdir? 

Cevap

  Veri ambarlarının oluşturulması işlemi, verinin çeşitli kaynaklardan toplanarak, veriler içerisindeki uyuşmazlıklar ve hatalardan arındırılmasıdır.


7. Soru

Ticari işlemlerde bilgi sistemleri kaç türlüdür?

Cevap

 Canlı ve karar destek sistemleri olmak üzere iki türlüdür.


8. Soru

 OLAP (Online Analytical Processing) programlarının kullanım amacı nedir? 

Cevap

 Veri ambarında veri oluşturulduktan sonra bu verinin elle veya gözle analizi yapılabilir. Bunun için OLAP (Online Analytical Processing) programları kullanılır. Bu programlar, veriye her boyutu veride bir alana karşılık gelen çok boyutlu bir küp olarak bakmayı ve incelemeyi sağlar. Böylece boyut bazında gruplama, boyutlar arasındaki korelasyonları inceleme ve sonuçları grafik veya rapor olarak sunma olanağı ortaya çıkar.


9. Soru

Veri ambarlarında sistemin tasarımı oluşturulurken hangi hususlara dikkat edilmesi gerekir?

Cevap

 • Sistemin çözmesi istenen problem ayrıntılı bir biçimde tanımlanmalıdır. • Sistemle ilgili hedefler, kısıtlamalar ve kritik başarı etkenleri sıralanmalıdır. • Başlıca sistem bileşenleri ve ara yüzler, bileşenler arasındaki bağlantı veya iletişim yolları iyice ortaya konulmalıdır. • Gelecekte yapılması olası iyileştirmeler, değişiklikler ve başka sistemlere geçişler hakkında öngörüler yapılmalıdır. • Bütünsel bir geliştirme ve bakım programı ve sisteme destek verecek personel kaynağı planlanmalıdır. • Sistemi programa uygun bir şekilde geliştirebilmek ve uzun vadede bakımını yapıp yönetebilmek için gerekli bilgi, beceri ve diğer destek araçları belirlenmelidir.


10. Soru

. Bir veri ambarı yapısı hangi alt bileşenlerden oluşur? 

Cevap

 • Operasyonel Veri Tabanı/Harici Veri Tabanı Katmanı • Enformasyon Ulaşım katmanı • Veri Ulaşım Katmanı • Veri Dizin (Metadata) Katmanı • İşlem (process) Yönetim Katmanı • Uygulama Haberleşmesi Katmanı • Veri Ambarı Katmanı • Veri Sunum Katmanı


11. Soru

Veri madenciliği nedir?

Cevap

 Veri madenciliği, veri tabanlarında saklanan çok çeşitli verilerden, daha önce keşfedilememiş bilgileri oraya çıkarmaktır. Veri madenciliği, kendi başına bir çözüm değil, çözüme ulaşmak için verilecek karar sürecini destekleyen, problemi çözmek için gerekli olan bilgileri sağlamaya yarayan bir araçtır.


12. Soru

Veri madenciliği, özel ve kamu sektörü kuruluşlarında hangi şekillerde kullanılabilmektedir? 

Cevap

  • Bir süpermarket müşterilerinin satın alım eğilimlerini irdeleyerek, promosyonlarını belli müşterilere yönlendirmesi, aynı kaynakla daha çok satış gerçekleştirmesine yardımcı olabilir. • Bankalar kredi kararlarında kredi isteyenlerin özelliklerini ve davranışlarını irdeleyerek batık kredi oranını azaltabilir. • Havayolları sürekli müşterilerinin davranış biçimlerini irdeleyerek daha etkin fiyatlandırma ile kârlılıklarını artırabilirler. PMY202U-E-PERAKENDECİLİK Ünite 5: Elektronik Perakendecilikte Veri Madenciliği 2 • Bir telefon şirketi müşteri davranışlarından öğrendikleri ile yeni hizmetler geliştirerek, müşteri bağlılığını ve kârlılığını artırabilir. • Maliye Bakanlığı Gelir İdaresi, şirketler için risk modelleri kurarak vergi incelemelerini daha etkin yönlendirip, vergi kaçaklarını azaltabilir. • Hastaların teşhis ve tedavi maliyetleri irdelenerek hastalık riskinin ilk aşamada tespiti; kontrol ve kaynak planlama açısından faydalı olur.


13. Soru

Veri madenciliği süreci hangi safhalardan oluşmaktadır? 

Cevap

 • Problemin tanımlanması • Verilerin seçilmesi ve hazırlanması • Verilerin keşfedilmesi ve analizi • Modelin oluşturulması • Modelin kullanılması • Modelin izlenmesi


14. Soru

Veri madenciliğinde kullanılan modeller kaç türlüdür?

Cevap

 Veri madenciliğinde kullanılan modeller, tahmin edici ve tanımlayıcı olmak üzere iki türlüdür.


15. Soru

Tahmin edici modellerin amacı nedir? 

Cevap

 Tahmin edici modellerde sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçları bilinmeyen veri kümeleri için sonuç değerlerinin tahmin edilmesi amaçlanır.


16. Soru

Tahmin edici modellerin temel iki türü nedir? 

Cevap

 Tahmin edici modellerin temel iki türü sınıflandırma ve regresyondur.


17. Soru

Tanımlayıcı modellerin amacı nedir? 

Cevap

 Tanımlayıcı modeller, bir konudaki herhangi bir durumu saptamayı hedefleyen araştırmalardır. Tanımlayıcı modeli kullanan araştırmalar, çeşitli pazarlama sorunlarının çözümlenmesinde pazarlama araştırmacılarının sık sık başvurduğu araştırmalardır. Yapılan pazarlama araştırmalarının büyük bir kısmı tanımlayıcı araştırmalar olarak düşünülebilir.


18. Soru

Veri madenciliği modelleri gördükleri işleve göre nasıl sınıflandırılmaktadır? 

Cevap

 • Sınıflama ve Regresyon. • Kümeleme. • Birliktelik Kuralları.


19. Soru

Sınıflama nedir? 

Cevap

 Sınıflama, verinin önceden belirlenen kriterlere (yaşa, gelir durumuna, eğitim durumuna, cinsiyetine vb.) uygun olarak ayrıştırılmasını sağlayan bir tekniktir.


20. Soru

Verinin önceden belirlenen kriterlere göre ayrıştırılmasının amacı nedir? 

Cevap

 Sınıflandırmanın ardından her kategoride yer alan kişilerin, nesnelerin, kurumların özelliklerini ortaya çıkarmaktır.


21. Soru

 Regresyon analizi nasıl bir yöntemdir? 

Cevap

 Regresyon analizi bir bağımlı değişken ile bir veya daha fazla sayıda bağımsız değişken arasındaki ilişkiyi sayısal hale dönüştürmek için kullanılan istatistiksel analiz yöntemidir.


22. Soru

Basit ve çoklu regresyon arasındaki fark nedir? 

Cevap

Bağımsız değişken olarak bir değişken kullanılırsa basit regresyon, iki veya daha fazla değişken kullanılırsa çoklu regresyon analizi olarak adlandırılır.


23. Soru

Regresyon analizinin amacı nedir? 

Cevap

 Regresyon analizinde amaç her bağımsız değişkenin bağımlı değişkendeki değişmeye katkısının hesaplanması, dolayısıyla tahmin değişkenlerinin değerinden hareketle bağımlı değişkenin değerinin tahmin edilmesidir.


24. Soru

Doğrusal ve lojistik regresyon arasındaki fark nedir?

Cevap

 Doğrusal regresyonda tahmin edilecek olan hedef değişken sürekli değer alırken; lojistik regresyonda hedef değişken kesikli bir değer almaktadır. Doğrusal regresyonda hedef değişkenin değeri; lojistik regresyonda ise hedef değişkenin alabileceği değerlerden birinin gerçekleşme olasılığı tahmin edilmektedir.


25. Soru

Sınıflamanın uygulama alanları nelerdir?

Cevap

  • Potansiyel müşteriler için düzenlenen kampanyalara dönüşler, • Mevcut müşterilerin belirli bir hizmeti almaktan vazgeçme olasılıkları, • Kredi başvurularının risk seviyeleri, • Çeşitli belirtilere göre hastalık ihtimalleri.


26. Soru

Sınıflama yöntemleri nelerdir? 

Cevap

 Yapay sinir ağları, Bayes sınıflandırması, K-en yakın komşu, zaman serisi analizi, karar ağaçları ve lojistik regresyondur.


27. Soru

Yapay sinir ağları nasıl bir modeldir?

Cevap

 Yapay sinir ağları insan beyninin sinir sistemine ve çalışma prensibine dayanan elektriksel bir modeldir. Bir anlamda insan beyninin ufak bir kopyası gibidir. İnsan beyninin öğrenme yoluyla yeni bilgiler üretebilme, keşfedebilme, düşünme ve gözlemlemeye yönelik yeteneklerini, yardım almadan yapabilen sistemler geliştirmek için tasarlanmışlardır. Yapay Sinir ağı ile hesaplamalarda istenilen dönüşüm için, adım adım yürütülen bir yöntem gerekmez. Sinir ağı ilişkilendirmeyi yapan iç kuralları kendi üretir ve bu kuralları, bunların sonuçlarını örneklerle karşılaştırarak düzenler. Deneme ve yanılma ile ağ kendi kendine işi nasıl yapması gerektiğini öğretir. Yapay sinir ağlarında bilgi saklama, verilen eğitim özelliğini kullanarak eğitim örnekleri ile yapılır.


28. Soru

Bayes sınıflama yöntemi nedir?

Cevap

 Hedef değişkenle bağımsız değişkenler arasındaki ilişkiyi analiz eden tahminci ve tanımlayıcı bir sınıflama algoritmasıdır. Bayes, modelin öğrenilmesi esnasında, her çıktının öğrenme kümesinde kaç kere meydana geldiğini hesaplar. Bulunan bu değer, öncelikli olasılık olarak adlandırılır.


29. Soru

Kümeleme ne demektir?

Cevap

 Kümeleme sahip olunan verileri gruplara ayırma işlemidir. Kümelemede sınıflar önceden belirli değildir. Kümelemede aynı grup elemanlarının olabildiğince birbirine benzer yani homojen, farklı grup elemanlarının birbirinden farklı yani heterojen olması istenmektedir. Belirlenen her bir grup küme olarak adlandırılmaktadır.


30. Soru

Kümeleme modellerinin amacı nedir?

Cevap

 Kümeleme modellerinde amaç, tanımlanan verileri kullanarak nesnelerin birbirlerine olan benzerlik ve farklılıklarına göre gruplara ayrılmasıdır.


31. Soru

Kümeleme ve sınıflandırma arasındaki fark nedir? 

Cevap

  Sınıflandırma işleminde sınıflar önceden belirli iken, kümelemede sınıflar önceden belirli değildir. Sınıflandırmada ne kadar grup oluşacağı belirliyken kümelemede belirli değildir.


32. Soru

Kümelemenin uygulama alanları nelerdir? 

Cevap

• Benzer hücreleri tanımlamak, • Benzer davranışlar gösteren perakende müşterilerini tanımlamak, • Gen ve protein analizleri, • Ürün gruplaması, • Hastalık belirtileri, • Metin madenciliği


33. Soru

Kümeleme yöntemlerinde hangi analizler kullanılmaktadır? 

Cevap

 • Bölme yöntemleri • Hiyerarşik yöntemler • Yoğunluk tabanlı yöntemler • Grid tabanlı yöntemler • Model tabanlı yöntemler


34. Soru

Birliktelik Kuralları nasıl bir yöntemdir?

Cevap

 Büyük veri kümeleri içinde farklı veriler arasındaki birliktelik ilişkilerini bulma işlemidir. Birliktelik analizi, belirli bir veri kümesinde yüksek sıklıkta birlikte görülen özellik değerlerine ait ilişkisel kuralların keşfidir.


35. Soru

Birliktelik kuralı madenciliğinde kullanılan yöntemler nelerdir?

Cevap

 Ardışık örüntüler, sepet analizi ve apriori yöntemleridir.


36. Soru

Veri madenciliğinin uygulama alanları kaç türlüdür?

Cevap

  Veri madenciliğinin uygulama alanları bilimsel ve sektörel olarak iki türlüdür.


37. Soru

Bilimsel çalışmalarda veri madenciliği kullanımının ardında yatan sebepler nelerdir? 

Cevap

 Gelişmiş veri toplama yöntemleri (otomatik istasyonlar, uydu ve uzaktan algılama sistemleri, teleskop taramaları, gen çözümlemeleri, vb.) ile işlenmek üzere ham olarak çok büyük boyutlarda veri toplanması, geleneksel tekniklerin ham verileri işlemede yetersiz kalması ve hipotezler oluşturma, sınıflandırma, karar alma gibi bilimsel çalışma adımlarında bilim insanlarına destek olmasıdır.


38. Soru

Sektörel veri madenciliği uygulamalarının kullanılmasının temel nedeni nedir? 

Cevap

 Müşteriyi tanıyarak (müşteri gibi düşünerek) müşteri memnuniyeti sağlamak ve bu şekilde rekabet ortamında hızlı ve doğru kararları alabilmektir.


39. Soru

Veri madenciliğinin yaygın olarak kullanıldığı sektörler nelerdir?

Cevap

Pazarlama, banka ve sigortacılık, borsa, telekomünikasyon, sağlık ve ilaç, endüstri ve bilim ve mühendisliktir.


40. Soru

Veri madenciliğinin bilgiye dayalı yönetime en fazla ihtiyaç duyan sektörlere yararı nedir?

Cevap

  Veri madenciliği bu sektörlerin; • Kaynakları daha verimli kullanma, • Potansiyeli artırma, • Güvenliği sağlama ihtiyaçlarını karşılamak için kullanılır.


41. Soru

Veri madenciliğinin sektörler açısından amaçları nelerdir? 

Cevap

 Riski en aza indirmek, müşteri kaybını önlemek, doğru kişiye doğru ürünü sunabilmek, çapraz satışlar yapabilmek, yeni müşteriler kazanmak ve kötü niyetli yaklaşımları engellemektir.


42. Soru

Veri madenciliğinin tam anlamıyla gerçekleştirilebileceği en uygun alan nedir?

Cevap

 Veri madenciliğinin tam anlamıyla gerçekleştirilebileceği en uygun alan, elektronik ticarettir.


43. Soru

Perakendecilik sektöründe veri madenciliğinin uygulamaları nelerdir? 

Cevap

 Müşteri bölümlendirmesi, müşteri değer bölümlendirmesi, müşteri davranış bölümlendirmesi, ihtiyaç odaklı bölümlendirme, terk edecek müşterilerin tahmini, çapraz satış önerileri, özel günler için kampanya, mağazaların bölümlendirilmesi ve mağaza satış  stratejilerinin belirlenmesi, veri zenginleştirme çalışmaları, yeni mağaza lokasyon seçimidir.


44. Soru

Veri tabanlı pazarlamanın perkandecilik sektöründeki kullanım amaçları nelerdir?

Cevap

 • Tutundurma amaçlı veya bilgilendirici maillerin müşterilere gönderilmesi,; • Müşterilerin kim olduklarının belirlenmesi, • Müşteri ilişkilerinin güçlendirilmesi, • Yeni müşterilere yapılacak harcamaların kısılması, • Müşteri hizmetlerinin geliştirilmesi, • Daha pahalı ürünün satılması, çapraz satışları, yeni pazarlara geçişlerin gerçekleştirilmesi, • Mağazanın iç tasarımının planlanmasıdır.


45. Soru

Veri tabanlı pazarlamanın perakendecilik sektöründeki faydaları nelerdir?

Cevap

 • Müşterilerle daha uzun süreli ilişkilerin kurulması. • Satış işlemlerinin daha etkin yönetilmesi. • Müşteriler hakkındaki bilgilerin genişletmesi. • Rakipler hakkında tutarlı bilgilere ulaşılması.


46. Soru

Veri tabanlı pazarlama oluşturma sürecinde hangi sorulara cevap aranmaktadır?

Cevap

  • Başlangıç için hangi verilere ihtiyaç duyulmaktadır? • Verilerde hangi bilgiler yer almalıdır? Veriler ne kadar sürede yenilenmelidir? • Veriler içeride mi toplanmalı yoksa dışarıdan mı alınmalıdır? • Hangi yazılım kullanılmalıdır? • Veri özellikleri, planlanması ve analizi nasıl gerçekleştirilmelidir?


47. Soru

Veri tabanı kullanan perakendeciler müşteri bölümlendirilmesini uygularken hangi iki prensibi göz önünde bulundurmaları gerekmektedir? 

Cevap

  • Müşteriler eşit değildir. • Müşteri davranışlarını bir takım hediyelerle ödüllendirebilmektedir.


48. Soru

Oluşturulmuş veri tabanındaki verilerin analiz edilmesinde ve yararlı verilere dönüştürülmesinde kullanılan çeşitli teknikler ve istatistiksel yöntemleri nasıl gruplandırılır? 

Cevap

 Oluşturulmuş veri tabanındaki verilerin analiz edilmesinde ve yararlı verilere dönüştürülmesinde kullanılan çeşitli teknikler ve istatistiksel yöntemler • Zaman serisi ve • Açıklamalı metotlar olmak üzere 2 gruptan oluşmaktadır.


49. Soru

Veri ve data kavramlarını açıklayınız.

Cevap

Veri (Data), ham haldeki yani işlenmemiş kayıtlardır. Veri kelimesi Latince’de gerçek anlamına gelen datum kelimesine denk gelmektedir. Data olarak kullanılan kelime ise çoğul datum anlamına gelmektedir. Kavramsal anlamda veri, kayıt altına alınmış her türlü olay, durum, fikirdir. Bu bağlamda çevremizdeki her nesne bir veri olarak algılanabilir. Veri, oldukça esnek bir yapıdadır. Temel olarak varlığı bilinen, işlenmemiş, ham haldeki kayıtlar olarak adlandırılırlar. Bu kayıtlar ilişkilendirilmemiş, düzenlenmemiş yani anlamlandırılmamışlardır. Ancak bu durum her zaman geçerli değildir. İşlenerek farklı bir boyut kazanan bir veri, daha sonra bu haliyle kullanılmak üzere kayıt altına alındığında, farklı bir amaç için veri halini koruyacaktır. Verilerin büyük bir kısmı, organizasyonun fonksiyonel süreçleri ile ilişkilidir.


50. Soru

Enformasyon kavramını açıklayınız.

Cevap

Enformasyon (Information), verilerin düzenlenmiş, ilişkilendirilmiş ve anlamlandırılmış hali olarak tanımlanır. Enformasyonlar belirli bir amaç doğrultusunda yapılmaktadır. O nedenle enformasyon başka bir amaç için veri halini korumaktadır. Son bir haftada hangi ürünlerin satıldığı, satılmış olan ürünlerin miktarları ve tutarları vs. şekline dönüştürülmüş veriler, enformasyona örnek olarak verilebilir. Örnekte satışlar ve satışların nitelikleri belirli bir zaman diliminde gerçekleşmelerine göre düzenlenmiştir.


51. Soru

Bilgi kavramını kısaca açıklayınız.

Cevap

Bilgi (Knowledge), enformasyonun birey tarafından algılanması ve sonuç çıkarmasıyla oluşur. Birey bilgiye ulaşmak için Veri Madenciliği (data mining) teknolojisi içeren uygulamalar kullanarak, veri içerisindeki gizli eğilim ve örüntüleri belirleyebilir. Enformasyonun bilgiye dönüşmesinde çalışmayı yapan bireyin algılama yeteneği, yaratıcılığı, deneyimi vb. kişisel özellikleri de çıkan sonuçlarda etkili olmaktadır.


52. Soru

Veri ambarı kavramını kısaca açıklayınız.

Cevap

Veri ambarları basit olarak veri madenciliği işleminin yapılacağı verilerin oluşturulduğu özel veri tabanlarıdır. Veri ambarlarının oluşturulması işlemi, verinin çeşitli kaynaklardan toplanarak, veriler içerisindeki uyuşmazlıklar ve hatalardan arındırılmasıdır. Verinin depolanması belirli bir düzen içinde dosyalanması, istendiğinde erişilebilir bir konumda yerleştirilmesi, gereken sıklıklarla güncellenmesi ve yazılımlar kullanarak bilgi elde etmek amacıyla tutulması ve korunmasıdır.


53. Soru

Veri ambarlarında sistemin tasarımı oluşturulurken nelere dikkat etmek gerekir?

Cevap


• Sistemin çözmesi istenen problem ayrıntılı bir biçimde tanımlanmalıdır.
• Sistemle ilgili hedefler, kısıtlamalar ve kritik başarı etkenleri sıralanmalıdır.
• Başlıca sistem bileşenleri ve ara yüzler, bileşenler arasındaki bağlantı veya iletişim yolları iyice
ortaya konulmalıdır.
• Gelecekte yapılması olası iyileştirmeler, değişiklikler ve başka sistemlere geçişler hakkında
öngörüler yapılmalıdır.
• Bütünsel bir geliştirme ve bakım programı ve sisteme destek verecek personel kaynağı
planlanmalıdır.

• Sistemi programa uygun bir şekilde geliştirebilmek ve uzun vadede bakımını yapıp
yönetebilmek için gerekli bilgi, beceri ve diğer destek araçları belirlenmelidir. Veri ambarları
uzun dönemli stratejik kararları destekler.


54. Soru

Veri madenciliğini tanımlayınız.

Cevap

Veri madenciliği, veri tabanlarında saklanan çok çeşitli verilerden, daha önce keşfedilememiş bilgileri
oraya çıkarmaktır. Veri madenciliği, kendi başına bir çözüm değil, çözüme ulaşmak için verilecek karar sürecini destekleyen, problemi çözmek için gerekli olan bilgileri sağlamaya yarayan bir araçtır.
Veri madenciliği büyük veri yığınlarında gizli olan örüntüleri ve ilişkileri ortaya çıkarmak için istatistik ve yapay zeka kökenli çok sayıda ileri veri çözümleme yönteminin tercihen görsel bir programlama ara yüzü üzerinden kullanıldığı bir süreçtir.


55. Soru

Veri madenciliği sürecindeki adımları sıralayınız.

Cevap

  • Problemin Tanımlanması
  • Verilerin Seçilmesi ve Hazırlanması
  • Verilerin Analizi
  • Modelin Oluşturulması
  • Modelin Kullanılması
  • Modelin İzlenmesi


56. Soru

Veri madenciliğinde verilerin seçilmesi ve hazırlanması hakkında bilgi veriniz.

Cevap

Veri madenciliğinin en önemli aşamalarından biri, verinin seçilmesi ve hazırlanması aşamasıdır. Bu aşama, analistin toplam zaman ve enerjisinin %50-%85’ini harcamasına neden olmaktadır. Bu aşamada firmanın mevcut bilgi sistemleri üzerinde ürettiği sayısal bilginin iyi analiz edilmesi, veriler ile mevcut iş problemi arasında ilişki olması gerekmektedir. Proje kapsamında kullanılacak sayısal verilerin, hangi iş süreçleri ile yaratıldığı da bu veriler kullanılmadan analiz edilmelidir, bu sayede analist veri kalitesi hakkında fikir sahibi olabilir. Birleştirme ve temizleme adımında toplanan verilerde bulunan farklılıklar giderilmeye çalışılır. Hatalı veya analizin yanlış yönlenmesine sebep olabilecek verilerin temizlenmesine çalışılır.


57. Soru

Veri madenciliğinde verilerin analizi aşaması hakkında bilgi veriniz.

Cevap

Veri madenciliğinin bu aşaması, değişkenlerin dağılımlarının incelendiği, verilerin kavranmaya başladığı ve çok değişkenli analizlerin planlanmasına yol gösteren bir aşamadır. Çok miktarda verinin öncelikle ham veri durumundan çıkarılması, bunun için ise bir metnin özetlenmesine benzer bir şekilde matematiksel, istatistiksel ve grafik yöntemlerle bazı özetlemeler yapmaya ihtiyaç bulunmaktadır. Bu aşamada verilerin frekans tabloları ve grafiklerle sunulması ve bazı istatistik özet bilgilerin hesaplanmasında yarar vardır. Bu aşamanın, amaca hizmet etmesi açısından çok önemli bir özelliği vardır. Bu aşamada problemin çözümüne katkı sağlayacak, hatta zaman zaman tamamen çözebilecek bir bulgu elde etme olasılığı söz konusudur. Bu işlevinden dolayı asla atlanmaması ve bulguların dikkatli bir şekilde yorumlanması gereken bir aşamadır.


58. Soru

Veri madenciliğinde modelin oluşturulması aşaması hakkında kısaca bilgi veriniz.

Cevap

Sürecin bu aşaması artık tahmin modellerinin oluşturulduğu aşamadır. Veri madenciliğini geleneksel bilgi sistemlerinin raporlamalarından ayıran en önemli özelliği esasen tahmin modellerinin oluşturulması ve “neler oldu”, “neden oldu” sorularına cevap vermekten ziyade “neler olacak” sorusuna cevap bulabilmektir.


59. Soru

Veri madenciliğinde kullanılan modelleri sınıflandırınız.

Cevap

Veri madenciliğinde kullanılan modeller, tahmin edici ve tanımlayıcı olmak üzere iki ana başlık altında incelenmektedir:


• Tahmin edici modeller, karar alma süreçlerinde önemli bir rol oynar. Tahmin edici modellerde sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçları bilinmeyen veri kümeleri için sonuç değerlerinin tahmin edilmesi amaçlanır. Tahmin edici modellerin temel iki türü sınıflandırma ve regresyondur.


• Tanımlayıcı modeller, bir konudaki herhangi bir durumu saptamayı hedefleyen araştırmalardır. Tanımlayıcı modeli kullanan araştırmalar, çeşitli pazarlama sorunlarının çözümlenmesinde pazarlama araştırmacılarının sık sık başvurduğu araştırmalardır. Yapılan pazarlama araştırmalarının büyük bir kısmı tanımlayıcı araştırmalar olarak düşünülebilir.


60. Soru

Veri madenciliği modellerini işleve göre sınıflandırınız.

Cevap


• Sınıflama ve Regresyon.
• Kümeleme.
• Birliktelik Kuralları.


61. Soru

Yapay sinir ağları kavramını açıklayınız.

Cevap

Yapay sinir ağları insan beyninin sinir sistemine ve çalışma prensibine dayanan elektriksel bir modeldir. Bir anlamda insan beyninin ufak bir kopyası gibidir. İnsan beyninin öğrenme yoluyla yeni bilgiler üretebilme, keşfedebilme, düşünme ve gözlemlemeye yönelik yeteneklerini, yardım almadan yapabilen sistemler geliştirmek için tasarlanmışlardır. Yapay Sinir ağı ile hesaplamalarda istenilen dönüşüm için, adım adım yürütülen bir yöntem gerekmez. Sinir ağı ilişkilendirmeyi yapan iç kuralları kendi üretir ve bu kuralları, bunların sonuçlarını örneklerle karşılaştırarak düzenler. Deneme ve yanılma ile ağ kendi kendine işi nasıl yapması gerektiğini öğretir. Yapay sinir ağlarında bilgi saklama, verilen eğitim özelliğini kullanarak eğitim örnekleri ile yapılır.


62. Soru

Bayes Sınıflandırması hakkında bilgi veriniz.

Cevap

Bu sınıflama yöntemi, hedef değişkenle bağımsız değişkenler arasındaki ilişkiyi analiz eden tahminci ve tanımlayıcı bir sınıflama algoritmasıdır. Bayes, modelin öğrenilmesi esnasında, her çıktının öğrenme kümesinde kaç kere meydana geldiğini hesaplar. Bulunan bu değer, öncelikli olasılık olarak adlandırılır. Örneğin; bir banka kredi kartı başvurularını “iyi” ve “kötü” risk sınıflarında gruplandırmak istemektedir. İyi risk çıktısı toplam 5 vaka içinde 2 kere meydana geldiyse iyi risk için öncelikli olasılık 0,4’tür. Bu durum, “Kredi kartı için başvuran biri hakkında hiçbir şey bilinmiyorsa, bu kişi 0,4 olasılıkla iyi risk grubundadır” olarak yorumlanır.


63. Soru

K-En Yakın Komşu yöntemi hakkında bilgi veriniz.

Cevap

İnsanlar yeni problemleri çözmeye çalışırken genellikle daha önce çözdükleri benzer problemlerin çözümlerine bakarlar. Bu yöntemin tercih edilme sebebi, sayısı bilinen veri kümeleri için hızlı ve verimli olmasıdır. Kayıtlar, bir veri uzayındaki noktalar olarak düşünülürse, birbirine yakın olan kayıtlar, birbirinin civarında (yakın komşusu) olur. K-en yakın komşuluğunda temel düşünce “komşunun yaptığı gibi yap” tır. Eğer belirli bir kişinin davranışı tahmin edilmek isteniyorsa, veri uzayında o kişiye yakın, örneğin on kişinin davranışlarına bakılır.


64. Soru

Karar Ağaçları yöntemi hakkında kısaca bilgi veriniz.

Cevap

Karar ağaçları veri madenciliğinde en sık kullanılan yöntemlerin başında gelmektedir. Bunun başlıca sebepleri ucuz olması, yorumlamalarının oldukça kolay olması ve veritabanı sistemleri ile entegre edilebilmeleridir. Karar ağaçları düğümler ve dallardan oluşan, anlaşılması oldukça kolay olan bir tekniktir. Karar ağacında bulunan her bir dalın belirli bir olasılığı mevcuttur. Bu sayede son dallardan köke veya istediğimiz yere ulaşana dek olasılıkları hesaplamamız mümkündür.


65. Soru

Kümeleme işlemi hakkında bilgi veriniz.

Cevap

Kümeleme, sınıflandırmada olduğu gibi sahip olunan verileri gruplara ayırma işlemidir. Sınıflandırma
işleminde sınıflar önceden belirli iken, kümelemede sınıflar önceden belirli değildir. Sınıflandırmadan
farklı olarak kümelemede ne kadar grup oluşacağı da belirli değildir. Kümeleme modellerinde amaç, tanımlanan verileri kullanarak nesnelerin birbirlerine olan benzerlik ve farklılıklarına göre gruplara ayrılmasıdır. Kümelemede aynı grup elemanlarının olabildiğince birbirine benzer yani homojen, farklı
grup elemanlarının birbirinden farklı yani heterojen olması istenmektedir. Belirlenen her bir grup küme olarak adlandırılmaktadır.


66. Soru

Veri madenciliğinin uygulama alanlarını sıralayınız.

Cevap

  • Pazarlama
  • Banka ve Sigortacılık
  • Borsa
  • Telekomünikasyon
  • Sağlık ve İlaç
  • Endüstri
  • Bilim ve Mühendislik


67. Soru

Veri madenciliğinin borsadaki kullanımına örnekler veriniz.

Cevap

• Hisse senedi fiyat tahmininde,
• Genel piyasa analizlerinde,
• Alım-satım stratejilerinin uygunluğunda,
• Hisse tespitlerinde


68. Soru

Veri madenciliğinin sağlık ve ilaç alanında kullanımına örnekler veriniz.

Cevap


• Test sonuçlarının tahmininde,
• Ürün geliştirmede,
• Tıbbi teşhiste,
• Tedavi sürecinin belirlenmesinde,
• Yeni ilaç türlerini keşfi ve sınıflandırılması.


Bahar Dönemi Dönem Sonu Sınavı
25 Mayıs 2024 Cumartesi