Programlamada Yeni Eğilimler Dersi 7. Ünite Sorularla Öğrenelim

Büyük Veri İle Programlama

1. Soru

Büyük veri nedir?

Cevap

Büyük veri; geleneksel yöntemlerle işlenmesi zor olan, hacimsel olarak büyük olan ve karmaşık yapıdaki veridir.


2. Soru

Büyük veri kaynaklarını nelerdir?

Cevap

Web sunucu loğları, bloglar, elektronik postalar, sosyal medyadaki fotoğraf, video gibi paylaşımlar, çeşitli sensörlerden gelen sürekli bilgiler, GSM operatörlerindeki arama kayıtları, çeşitli mobil uygulamalardaki demografik bilgiler, meteorolojik bilgiler ve uydu görüntüleridir.


3. Soru

Büyük verinin temel bileşenleri nelerdir?

Cevap

Bunlar çeşitlilik (variety), değer (value), doğrulama (verification), veri büyüklüğü (volume) ve hızdır (velocity).


4. Soru

Büyük verinin temel bileşenleri başka nasıl adlandırılmaktadır?

Cevap

Bu bileşenler İngilizce isimlerinin baş harflerinin aynı olmasından dolayı 5V olarak adlandırılmaktadır.


5. Soru

Büyük veri bileşenlerinden “Çeşitlilik” nedir?

Cevap

Büyük veri analizinde veri, birçok farklı kaynaklardan derlendiği için kendi içinde çeşitlilik ve farklılık göstermektedir. Farklı kaynaklardan elde edilen verilerin birlikte kullanılması gerektiğinde, veri tipleri birbirine dönüştürülerek işlem yapılmalıdır.


6. Soru

Büyük veri bileşenlerinden “Hız” nedir?

Cevap

Büyük verinin önemli karakteristiklerinden biri üretilme hızıdır. Hızla gelen veriyi işleyebilmek için, aynı zamanda uygulamaların işlem yapabilme hızının da artması gerekmektedir. Bazı uygulamalar için verinin ömrü kısadır. Ömrü dâhilinde işlenemeyen veri geçerliğini yitirecektir.


7. Soru

Büyük veri bileşenlerinden “Veri büyüklüğü” nedir?

Cevap

Veri her yerden ve hızlı bir şekilde geldiği için verinin büyüklüğü katlanarak artmaktadır. Bu nedenle, organizasyonların her geçen yıl artan büyük hacimdeki verileri nasıl depolayacağını, uygulamalarında nasıl kullanacağını planlaması gerekmektedir.


8. Soru

Büyük veri bileşenlerinden “Doğrulama” nedir?

Cevap

Veriler hızlı bir şekilde gelip büyük bir hacim oluşturduğu için, verinin güvenilirliğinin önemi de artmaktadır. Verinin kaynağı bilinmeli ve yalnızca doğru kişilerle paylaşılmalıdır, istenmeyen kişilerden gizlenmelidir. Ayrıca doğrulanmamış bilgilerin kullanılması, hem kullanıcılar hem de servis sağlayıcılar açısından sorunlara neden olabilir. Bu nedenle, özellikle kişilerin kontrolünden geçmeyen otomatik sistemlerde veri güvenilirliğinin önemi de artmaktadır.


9. Soru

Büyük veri bileşenlerinden “Değer” nedir?

Cevap

Doğru ve güvenilir bir şekilde edinilmiş verinin servis sağlayıcılar için önemi büyüktür. Elbette ki saf veri kendi başına pek bir anlam ifade etmemektedir. Büyük veri birtakım üretim analiz işlemlerinden geçtikten sonra ortaya çıkan sonuçlar servis sağlayıcılar için önemlidir.


10. Soru

Büyük veri toplayan başlıca sosyal ağlar hangileridir?

Cevap

Bilindiği gibi Facebook ve Twitter gibi sosyal ağların milyonlarca kullanıcısı vardır. Kişilerin bu ağlardaki paylaşımları, beğenileri, üye oldukları gruplar ve arkadaşları vb. birçok bilgi kayıt altında tutulmakta ve analiz edilmektedir.


11. Soru

Bankalar müşterilerinin hangi verileri kayıt altına alır?

Cevap

Bankalar da müşterileri ile ilgili bütün verileri saklamaktadırlar. Kişilerin hesap hareketleri, para transferleri, ödemeleri, kredi geçmişleri, İnternet bankacılığını kullanma saatleri ve ne tür işlemler gerçekleştirdikleri gibi birçok veri kayıt altındadır.


12. Soru

Büyük veri analitiği nedir?

Cevap

Büyük veri analitiği, çeşitli tiplerdeki verileri içeren büyük veri setlerini işleyerek bu veri setlerinden çeşitli örüntüleri, veriler arasındaki ilişkileri, müşteri tercihlerini, market eğilimleri gibi yararlı iş bilgilerini açığa çıkarma işlemidir.


13. Soru

Büyük veri analitiğinin ana amacı nedir?

Cevap

Büyük veri analitiğinin ana amacı, büyük veriyi analiz ederek veri sahiplerine işleri hakkında daha doğru kararlar verebilmelerine yardımcı olmaktır.


14. Soru

Büyük veri analitiği işlemleri aşamaları hangileridir?

Cevap

Veri Toplama ve Kayıt, Çıkartım Temizleme ve Belirtim, Birleştirme ve Gösterim, Modelleme ve Analiz ve Anlamlandırmadır.


15. Soru

Büyük veri analitiği işlemleri aşamalarından “Veri toplama ve kayıt” nedir?

Cevap

İlk olarak verilerin, veri kaynağından toplanması gerekmektedir. Sosyal ağ, sensörler, ses kayıt cihaz vb. çeşitli kaynaklardan gelen veriler toplanmakta ve kayıt altına alınmaktadır. Bu toplama ve kayıt işlemlerinin otomatik olarak nasıl yapılacağı büyük veri analizinde ilk ve önemli adımdır.


16. Soru

Büyük veri analitiği işlemleri aşamalarından “Çıkartım, temizleme ve belirtim” nedir?

Cevap

Genellikle toplanan veri, analiz için hazır bir formatta değildir. Örneğin, hastane kayıtlarında tomografi cihazından alınan veriler ya da bir kan basıncı sensöründen alınan veriler ilk hâliyle kullanıma hazır değildir. Bu verilerden öncelikle analizde kullanılabilecek özelliklerin çıkarılması gerekmektedir. Eğer verilerde çeşitli hava koşullarından ya da kayıt sırasındaki başka nedenlerden kaynaklanan gürültü varsa bu gürültünün temizlenmesi gerekmektedir. Sonrasında bu özellikler veri analizinde kullanılabilir.


17. Soru

Büyük veri analitiği işlemleri aşamalarından “Birleştirme ve gösterim” nedir?

Cevap

Veriler genellikle farklı kaynaklardan geldikleri için, kullanıma hazır hale getirmek amacıyla öncelikle birleştirilmeleri gerekmektedir. Örneğin, bir araştırmacının elinde bilimsel kaynaklı bir veri seti olsun. Yine başka bir araştırmacı da benzer çalışmalarında, benzer bir veri seti kullansın. Bu iki veri setini birlikte kullanacak bir çalışma yapılmak istendiğinde, bu verileri anlamlı bir şekilde birleştirmek gerekmektedir. Verilerin boyutu çok büyük olduğunda bu işlemi hatasız bir şekilde birleştirebilecek otomatik sistemlere ihtiyaç duyulmaktadır.


18. Soru

Büyük veri analitiği işlemleri aşamalarından “Modelleme ve analiz” nedir?

Cevap

Büyük veri üzerinde analiz ve sorgu yapmak, küçük örnekler üzerinde istatistik analiz yapmaktan farklıdır. Çünkü büyük veri genellikle gürültülü, dinamik olarak değişen ve homojen olmayan bir yapıya sahiptir. Ayrıca büyük veri, küçük örnek setlerinden daha değerlidir. Çeşitli veri modelleme teknikleri kullanılarak sıklıkla kullanılan örüntüler ve veriler arasındaki ilişkiler bulunabilir. Bu şekilde büyük veri üzerinden ilişkisel bilgi çıkarımı yapılır. Bu ilişkiler veri sahipleri için önemli bir bilgi kaynağıdır.


19. Soru

Büyük veri analitiği işlemleri aşamalarından “Anlamlandırma” nedir?

Cevap

Büyük veri analizinde son aşama modelleme ya da sorgu sonucunda açığa çıkan sonuçların anlamlandırılarak ilgili kişilere (örneğin; şirket yöneticisi, pazarlama direktörü vb.) sunulmasıdır. Modelden çıkan sonuçları olduğu gibi sunmak yeterli değildir. Karar verici kişilerin sonuçları yorumlaması ve doğrulaması gerekmektedir.


20. Soru

Hadoop nedir?

Cevap

Hadoop; büyük veri setlerinin dağıtık olarak saklanması ve üzerinde işlem yapılması için gerçekleştirilmiş bir yazılım çerçevesidir.


Bahar Dönemi Dönem Sonu Sınavı
25 Mayıs 2024 Cumartesi