aofsoru.com

Öğrenme Yönetim Sistemleri Dersi 8. Ünite Özet

Öğrenme Yönetim Sistemlerinde Öğrenme Analitikleri

Giriş

Analitikler, en basit ifadeyle, bilgisayarlar yardımıyla farklı dijital ortamlarda yer alan, genellikle internet üzerinden üretilen ve paylaşılan farklı şekil ve boyutlardaki enformasyonun bir araya getirilmesi, düzenlenmesi, analiz edilmesi ve raporlanması olarak tanımlanabilir.

Öğrenme analitiğini, analitiklerin öğretimin kalitesinin artırılması amacıyla kullanılması olarak düşünebiliriz. Bu amaçla öncelikle öğrencinin konumu, internette harcadığı süre, etkinliklerdeki doğru-yanlış sayısı, sistemde kaldığı zaman aralıkları gibi farklı tür verilerin toplanması gerekir. Elde edilen bilgiler analiz edilerek başarılı öğrenenlerin öğretim sisteminden nasıl faydalandıkları, nasıl öğrendikleri ve hangi özelliklere sahip oldukları raporlanabilir. Bu raporlardan yola çıkılarak öğretim sistemi iyileştirilebilir, başarısız öğrencilere daha başarılı olmaları için öneriler sunulabilir. Sadece verdiğimiz örnekle sınırlı olmayan, çok farklı uygulama alanlarına sahip veri ve öğrenme analitikleri, kurumlar açısından çok değerli ve gittikçe daha da değer kazanan çalışma alanlarıdır.

Öğrenme Analitiğine İlişkin Temel Kavramlar

Büyük Veri

Çevremizdeki akıllı cihazların, insanların ve kurumların ürettiği bilginin ne kadar çeşitli ve büyük olduğunu örneklemek gerekirse, bir araştırmaya göre 2016 yılında bir dakikada 9.678 tweet atılmış, Google çeviri üzerinden 69.500.000 kelime başka bir dile çevrilmiş, Youtube üzerinden 400 saatlik yeni video paylaşılmış, Facebook Messenger üzerinden 216.302 fotoğraf paylaşılmış, Dropbox’a 833.333 yeni dosya yüklenmiş ve The Weather Channel üzerinden 13.888.889 hava durumu sorgusu gerçekleşmiştir. Büyük veri (Big Data), ortaya çıkan bu muazzam verinin üretilmesindeki büyük hızı, üretilen verinin inanılmaz boyutlarını ve yapısını anlatmak için kullanılan bir kavramdır. Büyük verinin bazı anahtar özellikleri vardır. Bunlar hacim (volume), hız (velocity), doğruluk (veracity) ve çeşitlilik (variety) olarak sıralanabilir.

  • Hacim: Büyük veri genellikle depolanması, işlenmesi, aktarılması, analiz edilmesi ve sunulması zor olan enformasyon miktarına sahiptir. Bugün sahip olduğumuz verinin %90’ı son iki yıl içinde üretilmiştir.
  • Hız: Verinin paylaşılması ve dolaşımı çok hızlıdır. Küresel olarak veri o kadar hızlı hareket etmektedir ki küresel internet trafiğinin 2018 yılında saniyede 50.000 GB olması beklenmektedir.
  • Doğruluk: Elde edilen veride yanlılık, kirlilik ve düzensizlik olabilir. Bu şekildeki veriler, analizleri ve dolayısıyla analiz sonuçlarını etkiler. Bu nedenle verilerin temizlenmeleri ve/veya düzenlenmeleri gerekir.
  • Çeşitlilik: Veri yapılandırılmış ve yapılandırılmamış olarak farklı şekillerde sunulabilir. Yapılandırılmış veri belirli bir düzeni olan, aynı yapıya sahip verilerdir. Büyük verinin ise belirli bir yapısı yoktur. Büyük verinin içinde yorumlar, ses dosyaları, görseller ve videolar bulunabilir. Bu veri türlerinin hepsi hem birbirinden hem de kendi içinde farklı yapılarda olabilir.

Eğitimde Veri Madenciliği

Büyük veri tabanlarından, farklı analiz yöntemleriyle gizli desenlerin ortaya çıkarılması süreci veri madenciliğidir. Veri madenciliğinin temelinde istatistik, yapay zekâ ve makine öğrenmesi bulunur. Veri madenciliği iletişim, eğitim, bankacılık, sigortacılık, üretim gibi farklı alanlarda kullanılmaktadır. Veri madenciliğinin eğitimde kullanılması eğitimde veri madenciliği (educational data mining, EDM) olarak adlandırılır.

Öğrenme analitikleri, öğrenenlere ilişkin verinin, öğrenme süreçlerinin ve öğrenme ortamlarının anlaşılması ve iyileştirilmesi amacıyla ölçülmesi, toplanması ve analiz edilmesi olarak tanımlanabilir. Öğrenme analitikleri çerçevesinde değerlendirdiğimizde, veri analizini, veri üzerinde yapılan matematiksel ya da istatistiksel analizler yoluyla verinin bilgiye dönüştürülmesi olarak düşünebiliriz. Analitik ise analizlerin öngörü çerçevesinde gerçekleştirilmesi olarak değerlendirilebilir.

EDM ile öğrenme analitiklerinin çok yakın kavramlardır. EDM ile öğrenme analitikleri arasındaki farklılıkların kullanılan metotlardan çok, araştırma soruları ve odaklanılan konulardan kaynaklandığını söyleyebiliriz. Öğrenme analitiği daha çok verinin insanlar tarafından yorumlanması ve görselleştirilmesi ile ilgilenirken EDM otomatikleştirilmiş analizlere yoğunlaşmaktadır. Yani EDM’nin, özellikle öğrenme ile ilgili büyük veriden desenlerin ortaya çıkarılmasına ilişkin teknik zorluklara odaklandığını düşünebiliriz. Örneğin öğrenme analitikleri araştırmaları genellikle ders başarısızlığı, dersi bırakma gibi büyük yapılara eğilirken, EDM araştırmaları öğrenenin sıkılması ya da kısa-süreli öğrenme gibi daha küçük yapıları incelemektedir. EDM araştırmalarında metin analizi, metin madenciliği ve söylem analizinin nadiren görülmesine karşın öğrenme analitikleri için bunlar önde gelen analizlerdir.

Öğrenme analitikleri ile yakın bir diğer kavram ise akademik analitiklerdir. Akademik analitik, öğretim kurumlarının kurumsal performanslarının artırılması ya da kurumsal politikalarının oluşturulmasına yardımcı olmak amacıyla kullanılabilir. Campbell ve Oblinger (2007) akademik analitikleri beş aşamada işleyen bir yapı olarak tanımlamışlardır. Bu aşamalar yakalama (capture), raporlama (report), tahmin (predict), eylem (act) ve iyileştirme (refine) olarak sıralanabilir.

Öğrenme Analitikleri

Öğrenme analitiklerinin dört uygulama seviyesi bulunmaktadır. Bu seviyeler betimsel (descriptive) analitik, tanılayıcı (diagnostik) analitik, öngörücü (predictive) analitik ve yönerge (prescriptive) analitiği olarak sıralanabilir. Betimsel analitikten yönerge analitiğine gidildikçe üretilen değer arttığı gibi zorluk seviyesi de artmaktadır (bkz. Şekil 8.3).

“Ne oldu?” sorusunun cevabını aradığımız aşama betimsel analitik aşamasıdır. Öğrenme analitikleri açısından bakıldığında betimsel analitiği, öğrenme yönetim sisteminde öğrencilerin neler yaptıkları, sistemin nasıl işlediği gibi, neler olup bittiğini özetleyen analitik türü olarak düşünebiliriz. Öğrencilerin soruların ne kadarını cevapladıkları ne kadar öğrenme yönetim sisteminde kaldıkları, hangi saat aralıklarında sisteme eriştikleri gibi genel olarak “ne oldu?” sorusunu ortalama, yüzde gibi basit istatistik teknikleri ile analiz ettiğimiz yaklaşım betimsel analitik olarak adlandırılabilir. Betimsel analitikler genellikle öğrencilerin ya da öğreticilerin bu bilgilere erişmek için kullandıkları paneller aracılığıyla sunulur.

“Neden oldu?” sorusunun cevabını aradığımız aşama tanılayıcı analitik aşamasıdır. Tanılayıcı öğrenme analitiği, hangi olay ya da olaylar birlikteliğinin öğrenenlerin başarılı olmasını sağladığı ya da başarısızlıklarına neden olduğunu anlamamıza yardımcı olabilir.

Öngörücü analitik, “ne olacak/ne olur?” sorusunu cevaplamamızda bize yardımcı olabilir. Öngörücü analitiği edindiğimiz tecrübeler sonucunda gelecekteki olaylara ilişkin aldığımız kararlar gibi düşünebiliriz.

Yönerge analitiği “…’nın olmasını nasıl sağlayabiliriz?” sorusunu cevaplamaya çalışır. Yani “öğrenenlerin başarı puanlarını beş puan nasıl artırabiliriz”, ya da “kayıtlı öğrenenlerin mezuniyet oranlarını 10 puan nasıl artırabiliriz” gibi bir eylem planı oluşturacak yanıtların alınmasında yardımcı olabilecek bir analitik uygulamasıdır. Yönerge analitiği sonuçları, öğrenenlerle kendi kişiselleştirilmiş öğrenme süreçlerini belirlemeleri ya da öğreticilerin öğrencilere uygun öğrenme kaynaklarını sunmaları amacıyla paylaşılabilir.

Chatti vd. öğrenme analitikleri için dört boyutlu bir model önermişlerdir. Her bir boyut “Ne?”, “Kim?”, “Neden?” ve “Nasıl?” sorularını cevaplamaktadır (bkz. Tablo 8.2).

Ne?: Öğrenme analitikleri için öğrenenlere ait veriler çok farklı kaynaklardan toplanabilir. Öğrenen verisi tek bir merkezde toplanıyorsa merkezileştirilmiş öğretim sistemleri, eğer öğrenen verileri farklı kaynaklardan toplanıyorsa dağıtık öğrenme ortamları olarak adlandırabiliriz. Öğrenme yönetim sistemlerinde, öğrenenlerin bütün etkinlikleri genellikle sistem içinde gerçekleşir. Bu nedenle öğrenme yönetim sistemleri merkezileştirilmiş öğretim sistemlerine örnek verilebilir. Öğrenenlerin kendi öğrenme süreçleri için, kendi ihtiyaçlarına uygun şekilde geliştirdikleri kişisel öğrenme ortamlarını ise dağıtık öğrenme ortamları olarak adlandırabiliriz.

Kim?: Öğrenme analitikleri farklı paydaşların faydalanması için geliştirilebilir. Bu paydaşlar öğrenenler, öğreticiler, yöneticiler, araştırmacılar ve tasarımcılar olabilir. Dolayısıyla her paydaşın farklı ihtiyaç ve beklentileri olacaktır.

Neden?: Öğrenme analitiklerinin tasarımlanırken ve analizler yapılırken hatalı yönlendirmelere neden olma olasılığı nedeniyle dikkat edilmesi gerekir. Öğrenme analitiklerinin amacının belirlenmesi ise diğer bir önemli unsurdur. Öğrenme analitiklerinin amaçlarının doğru belirlenmesi öğrenme analitiklerinin görevlerinin de net bir şekilde ortaya konmasına yardımcı olur. Öğrenme analitikleri öğrenenlerin etkinliklerini takip etmek için kullanılabilir. Öğrenenlerin takibi sonrasında ortaya çıkan raporlar öğretim süreçlerinin iyileştirilmesi için kullanılabilir. Aynı zamanda bu raporlar öğreticilere yol gösterici olabilir. Öğrenme analitiği öğrenenlerin hali hazırda toplanan verilerinden yola çıkarak öngörüde bulunabilir. Bu sayede belki başarısız olmadan önce başarısız olma olasılığı yüksek olan bir öğrenene yardım edilebilir. Öğretici ve kurumlar, olası öğrenme analitiğinin amaçları doğrultusunda (yeni kayıt, ders başarısı, ders tercihi) önceden bilgilendirilebilir. Öğrenme yönetim sistemleri, öğrenenlerin özelliklerine, ihtiyaç ve beklentilerine göre kişiselleştirilebilir. Ders tercihi ya da öğrenme kaynağı gibi öneriler sunulabilir.

Nasıl?: Öğrenme analitiklerinde çok farklı yöntemlerden faydalanılabilir. Bunlar istatistik, veri görselleştirme, veri madenciliği, sosyal ağ analizi vb. olabilir.

Etik

Öğrenme analitiklerinin kullanılmasında etik kuralların belirlenmesi ve göz önünde bulundurulması önemli bir boyuttur. Öğrenme yönetim sistemlerinde öğrenme analitiklerinin kullanılma oranının giderek artmasına karşın, etik kuralların uyarlanması aynı hızda gerçekleşememektedir. Paydaşlar (öğrenciler ve öğretim kurumları gibi) öğrenenlerin verilerinin toplanması, analiz edilmesi ve kullanılması süreçlerinde (doğacak fayda ve zararların neler olduğu konusunda) aynı fikirde olmayabilirler.

Slade ve Prinsloo öğrenme analitikleri ile ilgili etik konularının

  • Verinin konumu ve yorumlanması,
  • Bilgilendirilmiş onay formu, verinin gizliliği ve anonimleştirilmesi,
  • Verinin yönetilmesi, sınıflandırılması ve depolanması,

olmak üzere temelde üç kategoride değerlendirilebileceğini belirtmişlerdir.

Verinin konumuna ilişkin etik konuların temelinde analitik süreçlerinde kullanılacak verilerin farklı kaynaklardan derlenmesi yatmaktadır. Öğrenenlerin öğrenme süreçlerine ilişkin bilgilerin toplandığı kurum dışı kaynaklar farklı standart ve yapılara sahip olabilir. Bu nedenle toplanan verilerin etik kullanımına ilişkin geliştirilen bir yönerge bütün veri kaynakları için geçerli olmayabilir. Aynı zamanda toplanan veriler eksik ya da hatalı olabilir. Dolayısıyla bu veriler üzerinden yapılan analizler hatalı yorumlanabilir. Verileri yorumlayan personelin önyargıları bilinçsiz bir şekilde taraflı yorumlara neden olabilir.

Ürettiğimiz verilerin toplanması konusunda web sayfalarında ya da programlarda dikkat etmediğimiz ve çoğunlukla okumadığımız izin/onay formları ve bilgilendirici metinler yer alır. Örneğin Google etkinliklerinizi, yazıp gönderdiğiniz e-postaları, takvim etkinliklerinizi, yaşadığınız şehir ve telefon numaranız gibi birçok veriyi toplamaktadır. Google toplanan verileri kullanırken topladığı verileri anonimleştirmektedir. Yani kullanılan veriler kimin olduğu belirlenemeyecek hale getirilmektedir. Onay formu, verinin gizliliği ve anonimleştirilmesine ilişkin genel etik kurallar öğrenme yönetim sistemleri ve öğrenme analitikleri için de geçerlidir.

Öğrenme analitiklerinde kullanılan verilere ilişkin farklı düzeylerde güvenlik gereksinimi gerekli olabilir. Örneğin öğrenenin kimlik numarası ve fakültesine ilişkin veriler aynı güvenlik seviyelerine ihtiyaç duymayabilir. Bir öğretim elemanı ya da bir analistin, öğrenenin fakülte bilgilerine erişebilirken, kimlik bilgilerine erişememesi daha doğru olabilir. Dolayısıyla toplanan veriler farklı düzeylerde kategorize edilmeli ve yönetilebilmelidir.

Araçlar ve Analizler

Yazılımlar (Araçlar)

Veri madenciliği ve veri analitiği araştırmalarında RapidMiner, R ve NLTK gibi çok farklı yazılımlar kullanılmaktadır.

  • RapidMiner: Java programlama dili üzerine inşa edilmiş en çok kullanılan veri analitiği yazılımlarından biridir. RapidMiner kullanıcının kod yazmasına gerek kalmadan, şablonları kullanarak analiz süreçleri üretebilmesini sağlayan bir ara yüze sahiptir. Yazılımda veri düzenleme ve analizi amacıyla kullanılabilecek 1500’den fazla operatör bulunmaktadır. RapidMiner kullanılarak farklı türlerdeki veri kaynaklarından farklı türlerdeki veri çekilebilmektedir. RapidMiner faklı türlerdeki verilerin öngörücü analizleri yapılabilir şekilde düzenlenmesini sağlayabilir. Yapılandırılmış (ör. Excel tabloları) ve yapılandırılmamış (ör. Facebook yorumları) verileri birleştirebilir. Üretilen veri düzenleme süreçleri daha sonra kullanılmak üzere kaydedilebilir.
  • R: İstatistiksel hesaplamalar için geliştirilmiş bir programlama dili ve yazılım ortamıdır. Farklı paketler eklenerek R’ın özellikleri artırılabilir. R normal şartlar altında basit bir pencere dışında geliştirme ortamı sunmaz. Bu nedenle genellikle R Studio geliştirme ortamı kullanılır.
  • NLTK (Natural Language Toolkit): Dil işleme için kullanılan en kuvvetli araçlardan biridir. NLTK veri madenciliği, makine öğrenmesi, veri temizleme, duygu analizi ve dil işleme araçlarına sahiptir. NLTK, Python programlama dili ile yazılmıştır. Bu sayede üzerine yeni uygulamalar üretilebilmektedir.

Öngörücü ve Açıklayıcı Analitik

Öğrenme analitiklerini bazı durumları (öğrencilerin başarılı olup olmayacakları, dersi tamamlayıp tamamlamayacakları gibi) öngörmek için kullanabiliriz. Öngörücü analitik olarak tanımlayabileceğimiz bu analitik türü, bilinen veriler kullanılarak gerçekleştirilir. Açıklayıcı analitik ise bir durumun nedenlerini bulmak için eldeki bütün verilerin kullanılması olarak ifade edilebilir. Eğer öğrenci başarı ya da başarısızlığı, çalışma alışkanlıkları gibi bilgilerimiz varsa öngörücü analitikten faydalanabiliriz. Eğer öğrencinin başarısızlığının nedenlerini bulmak istiyorsak açıklayıcı analitikten faydalanabiliriz.

Öğrenme İçeriği Analitikleri

Öğrenme süreçlerinde kullanılan her türlü malzemeyi öğrenme içeriği olarak düşünebiliriz. Kovanovic vd. öğrenme içerikleri analitiğini “Üreticisi kim olursa olsun (ör. öğrenci, öğretici) öğrenme etkinliklerini anlamak ve eğitim uygulamalarını ve araştırmalarını geliştirmek amacıyla, dijital öğrenme içeriklerinin farklı formlarının otomatik bir şekilde incelenmesi, değerlendirilmesi, indekslenmesi, önerilmesi ve görselleştirilmesi” olarak tanımlamışlardır. İçerik analitiklerinin ilgilendiği konular öğrenme kaynakları, öğrenenlerin ürettikleri ve öğrenenlerin sosyal etkileşimleri olmak üzere üç başlıkta incelenebilir.

Öğrenme Kaynakları

Öğrenme içeriği analitikleri, öğrenenlere seviye ve ilgilerine uygun öğrenme içeriklerinin önerilmesi için kullanılabilir. Kaynaklardan faydalanma şekilleri örtüşen öğrenenler aynı ilgi alanlarına sahip olabilirler ya da büyük kitleler tarafından birlikte kullanılan malzemeler benzer olabilir.

Öğrenenlerin Ürettikleri

Öğrenenin kullandığı malzemeleri takip ederek, benzer malzemeler önerilebilir.

Öğrenme içeriği analitiklerinin kullanıldığı bir diğer uygulama ise otomatik bir şekilde öğrenme içeriklerine ilişkin anahtar kavramların ortaya çıkarılması, içeriklerin etiketlenmesi ve kümelemelerin yapılmasıdır. Bu sayede öğrenme içerikleri uygun bir şekilde organize edilebilir ya da farklı değişkenler çerçevesinde sınıflandırılabilir.

Öğrenenlerin Sosyal Etkileşimleri

Öğrenenlerin ürettikleri ürünlere ilişkin öğrenme içeriği analitikleri genellikle öğrencilerin yazdıkları metinlerin değerlendirilmesi ve geribildirim verilmesi şeklinde gerçekleşir. Yani bir konuda öğrenci bir metin yazar ve sistem otomatik bir şekilde metni analiz ederek bir puanlama yapabilir ya da öğrenene kendisini geliştirmesi için öneriler verebilir. Bu amaçla genellikle örtük anlam bilimsel çözümlemeden (latent semantic analysis) faydalanılır. Bu yaklaşımda daha önceden veri tabanında bulunan metinler ile yeni metinde ortak bulunan kelimelerin anlam bilimsel benzerlikleri hesaplanarak bir değer ortaya konur. Öğrenenlerin ürettikleri içeriklerin incelenmesinde kelimelerin birlikte bulunma durumları analiz edildiği gibi, doğal dil işleme (Natural Language Processing) tekniklerinden de faydalanılabilir.

Öğrenenlerin forumlarda ya da sosyal ağlardaki etkinlikleri de öğrenme içerikleri analitiklerinin bir diğer boyutunu oluşturmaktadır. Sosyal ağ analizi (Social Network Analysis) ve örtük anlam bilimsel çözümlemeler kullanılarak örneğin öğrenenlerin bir konuya katkıları, sorun yaşadıkları kavramlar ya da ilgi alanları belirlenebilir. Aynı zamanda öğrenenlerin derse olan ilgileri de sosyal ağlar üzerinde ya da forumlarda ne kadar aktif olduklarının, gönderilerinin içeriklerinin çözümlenmesi ile tahmin edilebilmektedir. Öğrenenlerin sosyal ağlar ve forumlar gibi çevrim içi ortamlarda gerçekleştirdikleri sosyal etkileşimlerin içerik analitikleri yöntemleri ile analiz edilmesi öğrenenlerin motivasyonlarının, ilgilerinin, duygu, ihtiyaç, beklenti ve düşüncelerinin anlaşılmasını ve bu doğrultuda müdahalelerde bulunulmasını sağlayabilmektedir.

Duygusal Öğrenme Analitikleri

Öğrenenlerin derse olan ilgi ve başarılarını etkileyen kavramlardan biri de duygularıdır. Pekrun ve Stephens öğrencilerin yaşadıkları duygulara “akademik duygular” adını vermiş ve dört kategoriye ayırmışlardır. Bunlar kazanım (achievement), konu (topic), sosyal (social) ve epistemik (epistemic) duygulardır.

Kazanım duyguları öğrenme etkinlikleri ve bu etkinliklerin sonuçları ile ilgili duygulardır. Öğrenme etkinlikleri ev ödevleri, sınav ya da bitirme projeleri olabilir. Kazanım duygularına heyecan, endişe ya da hayal kırıklığını örnek verebiliriz. Konu duyguları, öğrenme içeriğinin kapsadığı konulara ilişkin duygulardır. Öğrenme ortamındaki etkileşimler sonucunda ortaya çıkan utanma, kıskançlık ya da gururlanma gibi duygular ise sosyal duygular olarak adlandırılır. Öğrenmeye karşı hissedilen duygular ise epistemik duygulardır. Örneğin merak, bilinmeyene karşı duyulan korku, öğrenmeye karşı duyulan heyecan epistemik duygulara örnek verilebilir.

Öğrenenlerin duygu durumları tıklama verileri, etkileşim örüntüleri, vücut dilleri ya da sensörlerden toplanan veriler kullanılarak tahmin edilebilmektedir.

Analizler

Öğrenme analitikleri ve veri madenciliğinde farklı analizlerden faydalanılmaktadır. Öngörücü ve açıklayıcı analitiklerde kullanılan analizlerden bazılarını aşağıdaki gibi sıralayabiliriz:

  1. Açıklayıcı Analitik
    1. Kümeleme
    2. Birliktelik Kuralları
  2. Öngörücü Analitik
    1. Regresyon
    2. Sınıflama

Veri analizlerini çok farklı soruları cevaplamak için yapabiliriz. Örneğin, öğrenenlerin …’nın/nin … etkileyip etkilemediğini merak ediyoruz diyelim. Cümlede boş bırakılan alanları anlamlı bir şekilde doldurabildiğimiz kavramlara değişken diyoruz. Değişken, farklı araştırma ya da gözlemlerde farklı değerler alabilen nesne, özellik ya da durumdur (bkz. Şekil 8.12). Değişkenleri, aralarında bir ilişki olma olasılığı olan, birbirleri üzerindeki etkileri merak ettiğimiz kavramlar olarak düşünebiliriz. Eğer bir değişkenin diğerine bağlı olduğunu, diğerinden etkilendiğini düşünüyorsak bu değişken bağımlı, diğeri ise bağımsız değişken olarak adlandırılır.

Bir değişkeni boy, ağırlık, hız gibi iki değer arasını kuramsal olarak sonsuz parçaya ayırabiliyorsak ve bunu sürekli yapabiliyorsak nicel (sayısal); cinsiyet, medeni durum ya da tuttuğu takım gibi biri ya da diğeri diye ayırıyorsak süreksiz (kategorik) değişken olarak adlandırabiliriz. Eğer sayısal değişkeni oluşturan bileşenlerini sayarak ölçüyorsak yani tam sayı olmak zorundaysa kesikli değişken olarak adlandırılır.

Kümeleme Analizi

Kümeleme analizinde amaç verideki benzer noktaları bir araya getirerek kümeler oluşturmaktır. Bir kümenin elemanı kendi kümesinde yer alan elemanlara diğer kümelerdekilerden daha çok benzer. Kümeleme genellikle veriyi oluşturan kategoriler bilinmediğinde kullanılan bir analiz yöntemidir. Kümeleme analizini, veride saklı bulunan doğal grupları bulmak için yapılan analiz olarak tanımlayabiliriz. Kümeleme için kullanılan algoritmalara K-Ortalama ve hiyerarşik yığın kümelemesi örnek verilebilir.

Birliktelik Kuralları

Veride yer alan nesnelerin birlikte bulunma kurallarını ortaya çıkaran bir analizdir. Birliktelik kurallarının belirlenmesinde önsel (Apriori) algoritma kullanılır.

Regresyon

Regresyonda sürekli bir değişkene ilişkin bir öngörüye ulaşılmaya çalışılır. Bağımlı değişken sürekli ise eğitim veri madenciliğinde genellikle doğrusal regresyondan faydalanılır. Regresyon; bir gözlemin, ortalamaya ya da veri setindeki bütün noktaların ortasından geçtiği düşünülen hayali bir çizgiye (bağlanım çizgisi) ne kadar yakın olduğunu tahmin etmek olarak tanımlanabilir.

Sınıflama

Sınıflandırma analizinde kümelemeden farklı olarak verinin hangi gruplarda oldukları bilinmektedir. Örneğin risk altındaki öğrenciler ve risk altında olmayan öğrenciler olmak üzere iki grubumuz var ve yeni gelen öğrencinin hangi grupta olduğunu öngörmek istiyoruz. Sınıflama analizini kullanarak risk altında olan, başarısız olma olasılığı bulunan öğrencileri önceden fark edip yardımcı olabiliriz. Sınıflamada kullanılan algoritmalara sinir ağları, karar ağaçları, K-En yakın komşu ve Bayes Ağları örnek verilebilir.


Yukarı Git

Sosyal Medya'da Paylaş

Facebook Twitter Google Pinterest Whatsapp Email