E-Perakendecilik Dersi 5. Ünite Sorularla Öğrenelim
Elektronik Alışveriş: Güvenlik Ve Ödeme Sistemleri
- Özet
- Sorularla Öğrenelim
Veri (Data) nedir?
Veri (Data), ham haldeki yani işlenmemiş kayıtlardır. Veri kelimesi Latince’de gerçek anlamına gelen datum kelimesine denk gelmektedir. Data olarak kullanılan kelime ise çoğul datum anlamına gelmektedir. Kavramsal anlamda veri, kayıt altına alınmış her türlü olay, durum, fikirdir.
Enformasyon (Information) nedir?
Enformasyon (Information), verilerin düzenlenmiş, ilişkilendirilmiş ve anlamlandırılmış hali olarak tanımlanır. Enformasyonlar belirli bir amaç doğrultusunda yapılmaktadır. O nedenle enformasyon başka bir amaç için veri halini korumaktadır.
Bilgi (Knowledge) nedir?
Bilgi (Knowledge), enformasyonun birey tarafından algılanması ve sonuç çıkarmasıyla oluşur. Birey bilgiye ulaşmak için Veri Madenciliği (data mining) teknolojisi içeren uygulamalar kullanarak, veri içerisindeki gizli eğilim ve örüntüleri belirler.
Ambar ne demektir?
Ambar ürünlerin depolandığı binalardır. Ürünlerin belirli bir düzen içinde yerleştirilip, kullanılmak veya sevk etmek amacıyla tutulmasıdır.
Veri ambarı ne demektir?
Veri ambarları basit olarak veri madenciliği işleminin yapılacağı verilerin oluşturulduğu özel veri tabanlarıdır. Veri tabanlarındaki veriler ile analiz yapmak ve karar destek aşamasında faydalanmak, veri madenciliği ile mümkün olabilmektedir. Madenciliği yapılacak olan verinin de bazı vasıflara sahip olması gerekir. Bu vasıflar veri ambarı (Data Warehouse) ile sağlanmaktadır.
Veri ambarlarının oluşturulması nasıl bir işlemdir?
Veri ambarlarının oluşturulması işlemi, verinin çeşitli kaynaklardan toplanarak, veriler içerisindeki uyuşmazlıklar ve hatalardan arındırılmasıdır.
Ticari işlemlerde bilgi sistemleri kaç türlüdür?
Canlı ve karar destek sistemleri olmak üzere iki türlüdür.
OLAP (Online Analytical Processing) programlarının kullanım amacı nedir?
Veri ambarında veri oluşturulduktan sonra bu verinin elle veya gözle analizi yapılabilir. Bunun için OLAP (Online Analytical Processing) programları kullanılır. Bu programlar, veriye her boyutu veride bir alana karşılık gelen çok boyutlu bir küp olarak bakmayı ve incelemeyi sağlar. Böylece boyut bazında gruplama, boyutlar arasındaki korelasyonları inceleme ve sonuçları grafik veya rapor olarak sunma olanağı ortaya çıkar.
Veri ambarlarında sistemin tasarımı oluşturulurken hangi hususlara dikkat edilmesi gerekir?
• Sistemin çözmesi istenen problem ayrıntılı bir biçimde tanımlanmalıdır. • Sistemle ilgili hedefler, kısıtlamalar ve kritik başarı etkenleri sıralanmalıdır. • Başlıca sistem bileşenleri ve ara yüzler, bileşenler arasındaki bağlantı veya iletişim yolları iyice ortaya konulmalıdır. • Gelecekte yapılması olası iyileştirmeler, değişiklikler ve başka sistemlere geçişler hakkında öngörüler yapılmalıdır. • Bütünsel bir geliştirme ve bakım programı ve sisteme destek verecek personel kaynağı planlanmalıdır. • Sistemi programa uygun bir şekilde geliştirebilmek ve uzun vadede bakımını yapıp yönetebilmek için gerekli bilgi, beceri ve diğer destek araçları belirlenmelidir.
. Bir veri ambarı yapısı hangi alt bileşenlerden oluşur?
• Operasyonel Veri Tabanı/Harici Veri Tabanı Katmanı • Enformasyon Ulaşım katmanı • Veri Ulaşım Katmanı • Veri Dizin (Metadata) Katmanı • İşlem (process) Yönetim Katmanı • Uygulama Haberleşmesi Katmanı • Veri Ambarı Katmanı • Veri Sunum Katmanı
Veri madenciliği nedir?
Veri madenciliği, veri tabanlarında saklanan çok çeşitli verilerden, daha önce keşfedilememiş bilgileri oraya çıkarmaktır. Veri madenciliği, kendi başına bir çözüm değil, çözüme ulaşmak için verilecek karar sürecini destekleyen, problemi çözmek için gerekli olan bilgileri sağlamaya yarayan bir araçtır.
Veri madenciliği, özel ve kamu sektörü kuruluşlarında hangi şekillerde kullanılabilmektedir?
• Bir süpermarket müşterilerinin satın alım eğilimlerini irdeleyerek, promosyonlarını belli müşterilere yönlendirmesi, aynı kaynakla daha çok satış gerçekleştirmesine yardımcı olabilir. • Bankalar kredi kararlarında kredi isteyenlerin özelliklerini ve davranışlarını irdeleyerek batık kredi oranını azaltabilir. • Havayolları sürekli müşterilerinin davranış biçimlerini irdeleyerek daha etkin fiyatlandırma ile kârlılıklarını artırabilirler. PMY202U-E-PERAKENDECİLİK Ünite 5: Elektronik Perakendecilikte Veri Madenciliği 2 • Bir telefon şirketi müşteri davranışlarından öğrendikleri ile yeni hizmetler geliştirerek, müşteri bağlılığını ve kârlılığını artırabilir. • Maliye Bakanlığı Gelir İdaresi, şirketler için risk modelleri kurarak vergi incelemelerini daha etkin yönlendirip, vergi kaçaklarını azaltabilir. • Hastaların teşhis ve tedavi maliyetleri irdelenerek hastalık riskinin ilk aşamada tespiti; kontrol ve kaynak planlama açısından faydalı olur.
Veri madenciliği süreci hangi safhalardan oluşmaktadır?
• Problemin tanımlanması • Verilerin seçilmesi ve hazırlanması • Verilerin keşfedilmesi ve analizi • Modelin oluşturulması • Modelin kullanılması • Modelin izlenmesi
Veri madenciliğinde kullanılan modeller kaç türlüdür?
Veri madenciliğinde kullanılan modeller, tahmin edici ve tanımlayıcı olmak üzere iki türlüdür.
Tahmin edici modellerin amacı nedir?
Tahmin edici modellerde sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçları bilinmeyen veri kümeleri için sonuç değerlerinin tahmin edilmesi amaçlanır.
Tahmin edici modellerin temel iki türü nedir?
Tahmin edici modellerin temel iki türü sınıflandırma ve regresyondur.
Tanımlayıcı modellerin amacı nedir?
Tanımlayıcı modeller, bir konudaki herhangi bir durumu saptamayı hedefleyen araştırmalardır. Tanımlayıcı modeli kullanan araştırmalar, çeşitli pazarlama sorunlarının çözümlenmesinde pazarlama araştırmacılarının sık sık başvurduğu araştırmalardır. Yapılan pazarlama araştırmalarının büyük bir kısmı tanımlayıcı araştırmalar olarak düşünülebilir.
Veri madenciliği modelleri gördükleri işleve göre nasıl sınıflandırılmaktadır?
• Sınıflama ve Regresyon. • Kümeleme. • Birliktelik Kuralları.
Sınıflama nedir?
Sınıflama, verinin önceden belirlenen kriterlere (yaşa, gelir durumuna, eğitim durumuna, cinsiyetine vb.) uygun olarak ayrıştırılmasını sağlayan bir tekniktir.
Verinin önceden belirlenen kriterlere göre ayrıştırılmasının amacı nedir?
Sınıflandırmanın ardından her kategoride yer alan kişilerin, nesnelerin, kurumların özelliklerini ortaya çıkarmaktır.
Regresyon analizi nasıl bir yöntemdir?
Regresyon analizi bir bağımlı değişken ile bir veya daha fazla sayıda bağımsız değişken arasındaki ilişkiyi sayısal hale dönüştürmek için kullanılan istatistiksel analiz yöntemidir.
Basit ve çoklu regresyon arasındaki fark nedir?
Bağımsız değişken olarak bir değişken kullanılırsa basit regresyon, iki veya daha fazla değişken kullanılırsa çoklu regresyon analizi olarak adlandırılır.
Regresyon analizinin amacı nedir?
Regresyon analizinde amaç her bağımsız değişkenin bağımlı değişkendeki değişmeye katkısının hesaplanması, dolayısıyla tahmin değişkenlerinin değerinden hareketle bağımlı değişkenin değerinin tahmin edilmesidir.
Doğrusal ve lojistik regresyon arasındaki fark nedir?
Doğrusal regresyonda tahmin edilecek olan hedef değişken sürekli değer alırken; lojistik regresyonda hedef değişken kesikli bir değer almaktadır. Doğrusal regresyonda hedef değişkenin değeri; lojistik regresyonda ise hedef değişkenin alabileceği değerlerden birinin gerçekleşme olasılığı tahmin edilmektedir.
Sınıflamanın uygulama alanları nelerdir?
• Potansiyel müşteriler için düzenlenen kampanyalara dönüşler, • Mevcut müşterilerin belirli bir hizmeti almaktan vazgeçme olasılıkları, • Kredi başvurularının risk seviyeleri, • Çeşitli belirtilere göre hastalık ihtimalleri.
Sınıflama yöntemleri nelerdir?
Yapay sinir ağları, Bayes sınıflandırması, K-en yakın komşu, zaman serisi analizi, karar ağaçları ve lojistik regresyondur.
Yapay sinir ağları nasıl bir modeldir?
Yapay sinir ağları insan beyninin sinir sistemine ve çalışma prensibine dayanan elektriksel bir modeldir. Bir anlamda insan beyninin ufak bir kopyası gibidir. İnsan beyninin öğrenme yoluyla yeni bilgiler üretebilme, keşfedebilme, düşünme ve gözlemlemeye yönelik yeteneklerini, yardım almadan yapabilen sistemler geliştirmek için tasarlanmışlardır. Yapay Sinir ağı ile hesaplamalarda istenilen dönüşüm için, adım adım yürütülen bir yöntem gerekmez. Sinir ağı ilişkilendirmeyi yapan iç kuralları kendi üretir ve bu kuralları, bunların sonuçlarını örneklerle karşılaştırarak düzenler. Deneme ve yanılma ile ağ kendi kendine işi nasıl yapması gerektiğini öğretir. Yapay sinir ağlarında bilgi saklama, verilen eğitim özelliğini kullanarak eğitim örnekleri ile yapılır.
Bayes sınıflama yöntemi nedir?
Hedef değişkenle bağımsız değişkenler arasındaki ilişkiyi analiz eden tahminci ve tanımlayıcı bir sınıflama algoritmasıdır. Bayes, modelin öğrenilmesi esnasında, her çıktının öğrenme kümesinde kaç kere meydana geldiğini hesaplar. Bulunan bu değer, öncelikli olasılık olarak adlandırılır.
Kümeleme ne demektir?
Kümeleme sahip olunan verileri gruplara ayırma işlemidir. Kümelemede sınıflar önceden belirli değildir. Kümelemede aynı grup elemanlarının olabildiğince birbirine benzer yani homojen, farklı grup elemanlarının birbirinden farklı yani heterojen olması istenmektedir. Belirlenen her bir grup küme olarak adlandırılmaktadır.
Kümeleme modellerinin amacı nedir?
Kümeleme modellerinde amaç, tanımlanan verileri kullanarak nesnelerin birbirlerine olan benzerlik ve farklılıklarına göre gruplara ayrılmasıdır.
Kümeleme ve sınıflandırma arasındaki fark nedir?
Sınıflandırma işleminde sınıflar önceden belirli iken, kümelemede sınıflar önceden belirli değildir. Sınıflandırmada ne kadar grup oluşacağı belirliyken kümelemede belirli değildir.
Kümelemenin uygulama alanları nelerdir?
• Benzer hücreleri tanımlamak, • Benzer davranışlar gösteren perakende müşterilerini tanımlamak, • Gen ve protein analizleri, • Ürün gruplaması, • Hastalık belirtileri, • Metin madenciliği
Kümeleme yöntemlerinde hangi analizler kullanılmaktadır?
• Bölme yöntemleri • Hiyerarşik yöntemler • Yoğunluk tabanlı yöntemler • Grid tabanlı yöntemler • Model tabanlı yöntemler
Birliktelik Kuralları nasıl bir yöntemdir?
Büyük veri kümeleri içinde farklı veriler arasındaki birliktelik ilişkilerini bulma işlemidir. Birliktelik analizi, belirli bir veri kümesinde yüksek sıklıkta birlikte görülen özellik değerlerine ait ilişkisel kuralların keşfidir.
Birliktelik kuralı madenciliğinde kullanılan yöntemler nelerdir?
Ardışık örüntüler, sepet analizi ve apriori yöntemleridir.
Veri madenciliğinin uygulama alanları kaç türlüdür?
Veri madenciliğinin uygulama alanları bilimsel ve sektörel olarak iki türlüdür.
Bilimsel çalışmalarda veri madenciliği kullanımının ardında yatan sebepler nelerdir?
Gelişmiş veri toplama yöntemleri (otomatik istasyonlar, uydu ve uzaktan algılama sistemleri, teleskop taramaları, gen çözümlemeleri, vb.) ile işlenmek üzere ham olarak çok büyük boyutlarda veri toplanması, geleneksel tekniklerin ham verileri işlemede yetersiz kalması ve hipotezler oluşturma, sınıflandırma, karar alma gibi bilimsel çalışma adımlarında bilim insanlarına destek olmasıdır.
Sektörel veri madenciliği uygulamalarının kullanılmasının temel nedeni nedir?
Müşteriyi tanıyarak (müşteri gibi düşünerek) müşteri memnuniyeti sağlamak ve bu şekilde rekabet ortamında hızlı ve doğru kararları alabilmektir.
Veri madenciliğinin yaygın olarak kullanıldığı sektörler nelerdir?
Pazarlama, banka ve sigortacılık, borsa, telekomünikasyon, sağlık ve ilaç, endüstri ve bilim ve mühendisliktir.
Veri madenciliğinin bilgiye dayalı yönetime en fazla ihtiyaç duyan sektörlere yararı nedir?
Veri madenciliği bu sektörlerin; • Kaynakları daha verimli kullanma, • Potansiyeli artırma, • Güvenliği sağlama ihtiyaçlarını karşılamak için kullanılır.
Veri madenciliğinin sektörler açısından amaçları nelerdir?
Riski en aza indirmek, müşteri kaybını önlemek, doğru kişiye doğru ürünü sunabilmek, çapraz satışlar yapabilmek, yeni müşteriler kazanmak ve kötü niyetli yaklaşımları engellemektir.
Veri madenciliğinin tam anlamıyla gerçekleştirilebileceği en uygun alan nedir?
Veri madenciliğinin tam anlamıyla gerçekleştirilebileceği en uygun alan, elektronik ticarettir.
Perakendecilik sektöründe veri madenciliğinin uygulamaları nelerdir?
Müşteri bölümlendirmesi, müşteri değer bölümlendirmesi, müşteri davranış bölümlendirmesi, ihtiyaç odaklı bölümlendirme, terk edecek müşterilerin tahmini, çapraz satış önerileri, özel günler için kampanya, mağazaların bölümlendirilmesi ve mağaza satış stratejilerinin belirlenmesi, veri zenginleştirme çalışmaları, yeni mağaza lokasyon seçimidir.
Veri tabanlı pazarlamanın perkandecilik sektöründeki kullanım amaçları nelerdir?
• Tutundurma amaçlı veya bilgilendirici maillerin müşterilere gönderilmesi,; • Müşterilerin kim olduklarının belirlenmesi, • Müşteri ilişkilerinin güçlendirilmesi, • Yeni müşterilere yapılacak harcamaların kısılması, • Müşteri hizmetlerinin geliştirilmesi, • Daha pahalı ürünün satılması, çapraz satışları, yeni pazarlara geçişlerin gerçekleştirilmesi, • Mağazanın iç tasarımının planlanmasıdır.
Veri tabanlı pazarlamanın perakendecilik sektöründeki faydaları nelerdir?
• Müşterilerle daha uzun süreli ilişkilerin kurulması. • Satış işlemlerinin daha etkin yönetilmesi. • Müşteriler hakkındaki bilgilerin genişletmesi. • Rakipler hakkında tutarlı bilgilere ulaşılması.
Veri tabanlı pazarlama oluşturma sürecinde hangi sorulara cevap aranmaktadır?
• Başlangıç için hangi verilere ihtiyaç duyulmaktadır? • Verilerde hangi bilgiler yer almalıdır? Veriler ne kadar sürede yenilenmelidir? • Veriler içeride mi toplanmalı yoksa dışarıdan mı alınmalıdır? • Hangi yazılım kullanılmalıdır? • Veri özellikleri, planlanması ve analizi nasıl gerçekleştirilmelidir?
Veri tabanı kullanan perakendeciler müşteri bölümlendirilmesini uygularken hangi iki prensibi göz önünde bulundurmaları gerekmektedir?
• Müşteriler eşit değildir. • Müşteri davranışlarını bir takım hediyelerle ödüllendirebilmektedir.
Oluşturulmuş veri tabanındaki verilerin analiz edilmesinde ve yararlı verilere dönüştürülmesinde kullanılan çeşitli teknikler ve istatistiksel yöntemleri nasıl gruplandırılır?
Oluşturulmuş veri tabanındaki verilerin analiz edilmesinde ve yararlı verilere dönüştürülmesinde kullanılan çeşitli teknikler ve istatistiksel yöntemler • Zaman serisi ve • Açıklamalı metotlar olmak üzere 2 gruptan oluşmaktadır.
Veri ve data kavramlarını açıklayınız.
Veri (Data), ham haldeki yani işlenmemiş kayıtlardır. Veri kelimesi Latince’de gerçek anlamına gelen datum kelimesine denk gelmektedir. Data olarak kullanılan kelime ise çoğul datum anlamına gelmektedir. Kavramsal anlamda veri, kayıt altına alınmış her türlü olay, durum, fikirdir. Bu bağlamda çevremizdeki her nesne bir veri olarak algılanabilir. Veri, oldukça esnek bir yapıdadır. Temel olarak varlığı bilinen, işlenmemiş, ham haldeki kayıtlar olarak adlandırılırlar. Bu kayıtlar ilişkilendirilmemiş, düzenlenmemiş yani anlamlandırılmamışlardır. Ancak bu durum her zaman geçerli değildir. İşlenerek farklı bir boyut kazanan bir veri, daha sonra bu haliyle kullanılmak üzere kayıt altına alındığında, farklı bir amaç için veri halini koruyacaktır. Verilerin büyük bir kısmı, organizasyonun fonksiyonel süreçleri ile ilişkilidir.
Enformasyon kavramını açıklayınız.
Enformasyon (Information), verilerin düzenlenmiş, ilişkilendirilmiş ve anlamlandırılmış hali olarak tanımlanır. Enformasyonlar belirli bir amaç doğrultusunda yapılmaktadır. O nedenle enformasyon başka bir amaç için veri halini korumaktadır. Son bir haftada hangi ürünlerin satıldığı, satılmış olan ürünlerin miktarları ve tutarları vs. şekline dönüştürülmüş veriler, enformasyona örnek olarak verilebilir. Örnekte satışlar ve satışların nitelikleri belirli bir zaman diliminde gerçekleşmelerine göre düzenlenmiştir.
Bilgi kavramını kısaca açıklayınız.
Bilgi (Knowledge), enformasyonun birey tarafından algılanması ve sonuç çıkarmasıyla oluşur. Birey bilgiye ulaşmak için Veri Madenciliği (data mining) teknolojisi içeren uygulamalar kullanarak, veri içerisindeki gizli eğilim ve örüntüleri belirleyebilir. Enformasyonun bilgiye dönüşmesinde çalışmayı yapan bireyin algılama yeteneği, yaratıcılığı, deneyimi vb. kişisel özellikleri de çıkan sonuçlarda etkili olmaktadır.
Veri ambarı kavramını kısaca açıklayınız.
Veri ambarları basit olarak veri madenciliği işleminin yapılacağı verilerin oluşturulduğu özel veri tabanlarıdır. Veri ambarlarının oluşturulması işlemi, verinin çeşitli kaynaklardan toplanarak, veriler içerisindeki uyuşmazlıklar ve hatalardan arındırılmasıdır. Verinin depolanması belirli bir düzen içinde dosyalanması, istendiğinde erişilebilir bir konumda yerleştirilmesi, gereken sıklıklarla güncellenmesi ve yazılımlar kullanarak bilgi elde etmek amacıyla tutulması ve korunmasıdır.
Veri ambarlarında sistemin tasarımı oluşturulurken nelere dikkat etmek gerekir?
• Sistemin çözmesi istenen problem ayrıntılı bir biçimde tanımlanmalıdır.
• Sistemle ilgili hedefler, kısıtlamalar ve kritik başarı etkenleri sıralanmalıdır.
• Başlıca sistem bileşenleri ve ara yüzler, bileşenler arasındaki bağlantı veya iletişim yolları iyice
ortaya konulmalıdır.
• Gelecekte yapılması olası iyileştirmeler, değişiklikler ve başka sistemlere geçişler hakkında
öngörüler yapılmalıdır.
• Bütünsel bir geliştirme ve bakım programı ve sisteme destek verecek personel kaynağı
planlanmalıdır.
• Sistemi programa uygun bir şekilde geliştirebilmek ve uzun vadede bakımını yapıp
yönetebilmek için gerekli bilgi, beceri ve diğer destek araçları belirlenmelidir. Veri ambarları
uzun dönemli stratejik kararları destekler.
Veri madenciliğini tanımlayınız.
Veri madenciliği, veri tabanlarında saklanan çok çeşitli verilerden, daha önce keşfedilememiş bilgileri
oraya çıkarmaktır. Veri madenciliği, kendi başına bir çözüm değil, çözüme ulaşmak için verilecek karar sürecini destekleyen, problemi çözmek için gerekli olan bilgileri sağlamaya yarayan bir araçtır.
Veri madenciliği büyük veri yığınlarında gizli olan örüntüleri ve ilişkileri ortaya çıkarmak için istatistik ve yapay zeka kökenli çok sayıda ileri veri çözümleme yönteminin tercihen görsel bir programlama ara yüzü üzerinden kullanıldığı bir süreçtir.
Veri madenciliği sürecindeki adımları sıralayınız.
- Problemin Tanımlanması
- Verilerin Seçilmesi ve Hazırlanması
- Verilerin Analizi
- Modelin Oluşturulması
- Modelin Kullanılması
- Modelin İzlenmesi
Veri madenciliğinde verilerin seçilmesi ve hazırlanması hakkında bilgi veriniz.
Veri madenciliğinin en önemli aşamalarından biri, verinin seçilmesi ve hazırlanması aşamasıdır. Bu aşama, analistin toplam zaman ve enerjisinin %50-%85’ini harcamasına neden olmaktadır. Bu aşamada firmanın mevcut bilgi sistemleri üzerinde ürettiği sayısal bilginin iyi analiz edilmesi, veriler ile mevcut iş problemi arasında ilişki olması gerekmektedir. Proje kapsamında kullanılacak sayısal verilerin, hangi iş süreçleri ile yaratıldığı da bu veriler kullanılmadan analiz edilmelidir, bu sayede analist veri kalitesi hakkında fikir sahibi olabilir. Birleştirme ve temizleme adımında toplanan verilerde bulunan farklılıklar giderilmeye çalışılır. Hatalı veya analizin yanlış yönlenmesine sebep olabilecek verilerin temizlenmesine çalışılır.
Veri madenciliğinde verilerin analizi aşaması hakkında bilgi veriniz.
Veri madenciliğinin bu aşaması, değişkenlerin dağılımlarının incelendiği, verilerin kavranmaya başladığı ve çok değişkenli analizlerin planlanmasına yol gösteren bir aşamadır. Çok miktarda verinin öncelikle ham veri durumundan çıkarılması, bunun için ise bir metnin özetlenmesine benzer bir şekilde matematiksel, istatistiksel ve grafik yöntemlerle bazı özetlemeler yapmaya ihtiyaç bulunmaktadır. Bu aşamada verilerin frekans tabloları ve grafiklerle sunulması ve bazı istatistik özet bilgilerin hesaplanmasında yarar vardır. Bu aşamanın, amaca hizmet etmesi açısından çok önemli bir özelliği vardır. Bu aşamada problemin çözümüne katkı sağlayacak, hatta zaman zaman tamamen çözebilecek bir bulgu elde etme olasılığı söz konusudur. Bu işlevinden dolayı asla atlanmaması ve bulguların dikkatli bir şekilde yorumlanması gereken bir aşamadır.
Veri madenciliğinde modelin oluşturulması aşaması hakkında kısaca bilgi veriniz.
Sürecin bu aşaması artık tahmin modellerinin oluşturulduğu aşamadır. Veri madenciliğini geleneksel bilgi sistemlerinin raporlamalarından ayıran en önemli özelliği esasen tahmin modellerinin oluşturulması ve “neler oldu”, “neden oldu” sorularına cevap vermekten ziyade “neler olacak” sorusuna cevap bulabilmektir.
Veri madenciliğinde kullanılan modelleri sınıflandırınız.
Veri madenciliğinde kullanılan modeller, tahmin edici ve tanımlayıcı olmak üzere iki ana başlık altında incelenmektedir:
• Tahmin edici modeller, karar alma süreçlerinde önemli bir rol oynar. Tahmin edici modellerde sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçları bilinmeyen veri kümeleri için sonuç değerlerinin tahmin edilmesi amaçlanır. Tahmin edici modellerin temel iki türü sınıflandırma ve regresyondur.
• Tanımlayıcı modeller, bir konudaki herhangi bir durumu saptamayı hedefleyen araştırmalardır. Tanımlayıcı modeli kullanan araştırmalar, çeşitli pazarlama sorunlarının çözümlenmesinde pazarlama araştırmacılarının sık sık başvurduğu araştırmalardır. Yapılan pazarlama araştırmalarının büyük bir kısmı tanımlayıcı araştırmalar olarak düşünülebilir.
Veri madenciliği modellerini işleve göre sınıflandırınız.
• Sınıflama ve Regresyon.
• Kümeleme.
• Birliktelik Kuralları.
Yapay sinir ağları kavramını açıklayınız.
Yapay sinir ağları insan beyninin sinir sistemine ve çalışma prensibine dayanan elektriksel bir modeldir. Bir anlamda insan beyninin ufak bir kopyası gibidir. İnsan beyninin öğrenme yoluyla yeni bilgiler üretebilme, keşfedebilme, düşünme ve gözlemlemeye yönelik yeteneklerini, yardım almadan yapabilen sistemler geliştirmek için tasarlanmışlardır. Yapay Sinir ağı ile hesaplamalarda istenilen dönüşüm için, adım adım yürütülen bir yöntem gerekmez. Sinir ağı ilişkilendirmeyi yapan iç kuralları kendi üretir ve bu kuralları, bunların sonuçlarını örneklerle karşılaştırarak düzenler. Deneme ve yanılma ile ağ kendi kendine işi nasıl yapması gerektiğini öğretir. Yapay sinir ağlarında bilgi saklama, verilen eğitim özelliğini kullanarak eğitim örnekleri ile yapılır.
Bayes Sınıflandırması hakkında bilgi veriniz.
Bu sınıflama yöntemi, hedef değişkenle bağımsız değişkenler arasındaki ilişkiyi analiz eden tahminci ve tanımlayıcı bir sınıflama algoritmasıdır. Bayes, modelin öğrenilmesi esnasında, her çıktının öğrenme kümesinde kaç kere meydana geldiğini hesaplar. Bulunan bu değer, öncelikli olasılık olarak adlandırılır. Örneğin; bir banka kredi kartı başvurularını “iyi” ve “kötü” risk sınıflarında gruplandırmak istemektedir. İyi risk çıktısı toplam 5 vaka içinde 2 kere meydana geldiyse iyi risk için öncelikli olasılık 0,4’tür. Bu durum, “Kredi kartı için başvuran biri hakkında hiçbir şey bilinmiyorsa, bu kişi 0,4 olasılıkla iyi risk grubundadır” olarak yorumlanır.
K-En Yakın Komşu yöntemi hakkında bilgi veriniz.
İnsanlar yeni problemleri çözmeye çalışırken genellikle daha önce çözdükleri benzer problemlerin çözümlerine bakarlar. Bu yöntemin tercih edilme sebebi, sayısı bilinen veri kümeleri için hızlı ve verimli olmasıdır. Kayıtlar, bir veri uzayındaki noktalar olarak düşünülürse, birbirine yakın olan kayıtlar, birbirinin civarında (yakın komşusu) olur. K-en yakın komşuluğunda temel düşünce “komşunun yaptığı gibi yap” tır. Eğer belirli bir kişinin davranışı tahmin edilmek isteniyorsa, veri uzayında o kişiye yakın, örneğin on kişinin davranışlarına bakılır.
Karar Ağaçları yöntemi hakkında kısaca bilgi veriniz.
Karar ağaçları veri madenciliğinde en sık kullanılan yöntemlerin başında gelmektedir. Bunun başlıca sebepleri ucuz olması, yorumlamalarının oldukça kolay olması ve veritabanı sistemleri ile entegre edilebilmeleridir. Karar ağaçları düğümler ve dallardan oluşan, anlaşılması oldukça kolay olan bir tekniktir. Karar ağacında bulunan her bir dalın belirli bir olasılığı mevcuttur. Bu sayede son dallardan köke veya istediğimiz yere ulaşana dek olasılıkları hesaplamamız mümkündür.
Kümeleme işlemi hakkında bilgi veriniz.
Kümeleme, sınıflandırmada olduğu gibi sahip olunan verileri gruplara ayırma işlemidir. Sınıflandırma
işleminde sınıflar önceden belirli iken, kümelemede sınıflar önceden belirli değildir. Sınıflandırmadan
farklı olarak kümelemede ne kadar grup oluşacağı da belirli değildir. Kümeleme modellerinde amaç, tanımlanan verileri kullanarak nesnelerin birbirlerine olan benzerlik ve farklılıklarına göre gruplara ayrılmasıdır. Kümelemede aynı grup elemanlarının olabildiğince birbirine benzer yani homojen, farklı
grup elemanlarının birbirinden farklı yani heterojen olması istenmektedir. Belirlenen her bir grup küme olarak adlandırılmaktadır.
Veri madenciliğinin uygulama alanlarını sıralayınız.
- Pazarlama
- Banka ve Sigortacılık
- Borsa
- Telekomünikasyon
- Sağlık ve İlaç
- Endüstri
- Bilim ve Mühendislik
Veri madenciliğinin borsadaki kullanımına örnekler veriniz.
• Hisse senedi fiyat tahmininde,
• Genel piyasa analizlerinde,
• Alım-satım stratejilerinin uygunluğunda,
• Hisse tespitlerinde
Veri madenciliğinin sağlık ve ilaç alanında kullanımına örnekler veriniz.
• Test sonuçlarının tahmininde,
• Ürün geliştirmede,
• Tıbbi teşhiste,
• Tedavi sürecinin belirlenmesinde,
• Yeni ilaç türlerini keşfi ve sınıflandırılması.