Veri Madenciliği Dersi 3. Ünite Sorularla Öğrenelim
Verinin Hazırlanması
- Özet
- Sorularla Öğrenelim
Nicel değişkenlerin ölçümünde kullanılır. Belirli bir başlangıç noktası olmamakla birlikte ölçü birimi vardır. İfadeleri sayısal olarak sıralanabilmesine olanak vermektedir. Her ne kadar eşir aralıklı ölçekte ilgilenilen değişken matematiksel sonuçlar verse de kullanılan ölçüm için belirli bir yokluk anlamına gelmeyen sıfır ölçme düzeyi bulunabilen değişkenler nasıl değişkenlerdir?
Aralıklı Ölçümlendirilmiş Değişkenler
Veri dönüşümünde verilerin veri madenciliği için uygun formlara dönüştürülmesi düzeltme, bir araya getirme, genelleme, normalleştirme işlemlerinden başka bir de hangi işlemle gerçekleştirilir?
Özellik oluşturma işlemiyle
Veritabanlarında yer alan verilerin mükemmel olması çoğu zaman mümkün değildir. Veri madenciliği tekniklerinin çoğu verilerdeki kusurları göz ardı edebilmesine rağmen veri kalitesini anlamak ve iyileştirmek konusuna odaklanmak veri madenciliğinin neyini arttırır?
Çıktı kalitesini arttırır.
Oldukça karmaşık olan ve çok büyük veri kümelerinin madenciliğinin yapılması çok uzun zaman aldığından bu tür verilerin olduğu gibi alınarak analiz edilmesi uygulanabilir ve pratik olmamaktadır. Bu nedenle veri indirgeme yöntemleri hangi veri kümelerinin oluşturulması için kullanılır?
Çok daha küçük hacimde indirgenmiş veri kümelerinin oluşturulması için kullanılır.
Veri madeninde bulunan veri insan tarafından oluşturulmuş bir bilgisayar dosyasından, verileri tasarlamak ve yönetmek için kullanılan bir işletme veri tabanı yönetim sisteminden, standart bir veri tabanı sisteminden ve de bunlara benzer şekilde hangi kaynaklardan gelmiş olabilir?
Otomatik bilgi kaydı oluşturan bir araçtan veya uydu üzerinden gelmiş olabilir.
İsimsel değişkenlerin özel bir şekli olan ikili değişkenler 0 ve 1, doğru ve yanlış, pozitif ve negatif, cinsiyet özelliğinde olduğu gibi erkek ve kadın gibi sonuçları sadece kaç şekilde ortaya çıkan değişkenlerdir?
Sadece iki şekilde ortaya çıkan değişkenlerdir.
Market çalışanlarının yönetim katından en alt kademeye kadar sıralanması örneği ile öğrencilerin üniversite bitirme dereceleri yönünden sıralanması örneği bize hangi değişkenleri anlatmaktadır?
Sıra Gösteren Değişkenleri
Verilerde yer alan büyük sayların daha küçük şekilleri seçilerek veri hacminin indirgenmesi için uygulanan yöntemlere ne ad verilir?
Büyük Sayıların İndirgenmesi
Hakkında bilgi edinilmek istenen canlı, cansız varlıklar veya olayların sahip oldukları ve birbirinden ayırt edilmesine yardımcı olan değişkenler veri madenciliğinde bir veri setinin sunumunda kullanılan tablo gösteriminde sütunlarda yer alır ve ne olarak adlandırılır?
Özellik olarak adlandırılır.
En büyük özelliği yokluk anlamına gelen belirli bir sıfır değerini barındırıyor olması bu nedenle ölçme düzeyleri arasında oransal analizler yapılabilmesine olanak tanıyor olmasıdır denildiğinde hangi değişkenlerden bahsedilmektedir?
Oranlı Ölçümlendirilmiş Değişkenler
Bazı durumlarda orijinal veri kümelerindeki özellikler gerekli enformasyonu içerdiği halde neler için uygun yapıda olmayabilirler?
Veri madenciliği algoritmaları için uygun yapıda olmayabilirler.
Gözlem değerlerinin tek tek nitel kategori ya da sınıflara atanması sonucu oluşan ölçek nasıl bir ölçektir?
Sınıflayıcı ölçektir.
Alacağı değerler 0, 1, 2, ... gibi tamsayılar olarak belirtilebilen ve asla ondalıklı değerler alması söz konusu olmayan markette bir gün içinde satılan ekmek sayısı, belli bir depodaki koli sayısı ya da palet sayısı, bir ailedeki çocuk sayısı örnek olarak gösterilebilen değişkenler nasıl değişkenlerdir?
Tam Sayılı Değişkenler
Veri madenciliğinde bir veri setinin sunumunda kullanılan tablo gösteriminde satırlarda neler yer alır?
Nesneler yer alır.
Veri madenciliğinde veri kalite problemlerini engellemek için önce veri kalitesi problemlerinin farkına varılarak doğrulanması ve zayıf veri kalitesini göz ardı edebilen algoritmaların kullanılması üzerinde odaklanılır. Veri kalitesi problemlerinin farkına varılması ve doğrulanması ne olarak adlandırılır?
Veri temizleme
Değişken tipleri özelliklerine göre kategorik ve sürekli değişkenler olarak iki grupta toplanabilir. Kategorik değişkenler grubuna isimsel değişkenler, ikili değişkenler ve sıra gösteren değişkenler girerken sürekli değişkenler grubuna hangi değişkenler girer?
Tam sayılı değişkenler, aralıklı ölçümlendirilmiş değişkenler ve ora ölçümlendirilmiş değişkenler girer.
Orijinal veri üzerinde doğrusal bir dönüşüm yapan bu yöntem veri içindeki en büyük ve en küçük sayısal değerin belirlenerek diğer değerleri buna uygun bir şekilde dönüştürülmesiyle yapılır. Ne sonucunda veri sıfır (en küçük değer) ile bir (en büyük değer) arasında sayısal bir değere dönüşür?
Enk-Enb Normalleştirme
Veri madenciliği Radyo Frekansı ile Tanımlama (RFID), barkod, karekod, veri depolama araçları gibi teknolojilerle birlikte hangi yıllardan beri gelişmektedir?
1990’lı yıllardan beri gelişmektedir.
Birimlerin sahip olduğu özelliklerin derecesinin belirlenerek sonuçların sayısal olarak ifade edilmesine ne adı verilir?
Ölçme adı verilir.
Hareket ettirilecek ondalık bölüm değişkenin maksimum mutlak değeri ile bağlantılıdır. Hangi yöntemde değişkene (özellik) ilişkin gözlem değerlerinin ondalık bölümü hareket ettirilerek normalleştirme gerçekleştirilir?
Ondalık ölçekleme yönteminde