Veri Madenciliği Dersi 8. Ünite Sorularla Öğrenelim

Web Madenciliği Ve Sosyal Medya Madenciliği

1. Soru

Veri madenciliği nedir?

Cevap

Temelde veri madenciliği, e-ticaret uygulamalarındaki işlem verileri ya da biyoinformatik alanında genetik ifadeler gibi farklı veri türlerinden oluşan büyük miktarda veri yığını içerisinden, anlamlı ve yararlı bilginin ortaya çıkarılması anlamına gelir.


2. Soru

Veri madenciliğinin amacı nedir?

Cevap

Verinin türü ne olursa olsun veri madenciliğinin temel amacı, mevcut veri yığını içerisindeki gizli veya daha önce farkedilmemiş bilginin açığa çıkarılması yani keşfedilmesidir


3. Soru

Web madenciliği nedir ve hangi yöntemleri temel almaktadır?

Cevap

Web madenciliği ise, web dokümanlarından bilginin ayıklanması veya keşfedilmesini sağlayan bir veri madenciliği tekniğidir. Web madenciliğinde kullanılan yöntemler sayısal zeka olarak da bilinen ve genel olarak veritabanı, veri madenciliği, otomatik öğrenme ve bilgi çıkarsama vb. gibi geniş bir uygulama alanına sahip akıllı hesaplama yaklaşımlarına dayanmaktadır.


4. Soru

Veritabanı nedir?

Cevap

Veritabanı, büyük miktardaki bilgileri depolamada yetersiz kalan dosya-işlem sistemine alternatif olarak geliştirilen ve birbirleriyle ilişkili bilgilerin depolandığı alandır.


5. Soru

Veri madenciliğinin adımları nelerdir?

Cevap

Veri madenciliği,

i. Verinin elde edilmesi

ii. Verinin saklanması ve yönetimi

iii. Veri erişiminin sağlanması

iv. Verinin analiz edilmesi

v. Analiz sonuçlarının anlaşılır bir biçimde sunulması

temel adımlarından oluşan bir süreçtir


6. Soru

Veri ambarı nedir?

Cevap

Veri ambarı, veritabanı üzerindeki yükü hafifletmek için oluşturulmuş, birbiriyle ilişkili verileri kolay, hızlı ve doğru bir biçimde sorgulama ve analiz yapabilmek için gerekli işlemlerin yapılabildiği bir veri deposudur.


7. Soru

Web madenciliği sürecinin adımları nelerdir?

Cevap

İnternet ortamından yararlı bilginin keşfi için, web madenciliği sürecini dört temel adımda ele alabiliriz.

1. Kaynakların Tespiti: İlgilenilen konuda bilgi içeren web dokümanlarının belirlenmesi ve elde edilmesi.

2. Bilgi Seçimi ve Ön İşleme: Elde edilen kaynaklardan ihtiyaç duyulan bilginin otomatik olarak seçilmesi ve kullanılabilir hâle getirilmesi.

3. Genelleştirme: Bireysel web sitelerindeki örüntü (pattern) veya kuralların otomatik olarak çıkarılması ve diğer web siteleri ile karşılaştırarak genellenmesi.

4. Analiz: Elde edilen genel örüntü veya kuralların doğruluklarının onaylanması ve / veya yorumlanması.


8. Soru

Webden bilgi çıkarım uygulamalarında karşılaşılan sorunlar nelerdir?

Cevap

Webden bilgi çıkarım uygulamalarında genel olarak karşılaşılan sorunlar izleyen biçimde açıklanabilir:

  • Araştırılan konuyu bulma
  • İstenilen bilgiyi bulma
  • Yararlı bilgi keşfi
  • Bilgiyi kişiselleştirme
    • Web toplulukları ve sosyal ağlar

9. Soru

Web madenciliğinde kullanılan ver türleri nelerdir?

Cevap

Web madenciliğinde kullanılan verileri dört başlıkta inceleyebiliriz:

  • İçerik verisi
  • Yapı verisi
  • Kullanım verisi
  • Kullanıcı profil verisi

10. Soru

Sunucu nedir?

Cevap

Yapılandırılan bir ağ üzerindeki diğer ağ bileşenlerinin(kullanıcıların) erişebileceği, kullanıma ve/ veya paylaşıma açık kaynakları barındıran, güçlü donanım ve yazılım bileşenlerinden oluşan bilgisayar birimine sunucu (server)denir.


11. Soru

İstemci nedir?

Cevap

Bir ağ üzerinde sunucu bilgisayarlardan hizmet alan, bilgiye erişim yetkileri sunucu tarafından belirlenen kullanıcı bilgisayarlara istemci (client) denir.


12. Soru

Vekil (Proxy) nedir?

Cevap

Bir ağ üzerinde sunucu ile istemci bilgisayarlar arasındaki bilgi akışına aracı - güvenlik duvarı, önbellekleme sistemi v.b. -olarak görev gören ara sunuculara vekil sunucu(proxy server) ya da kısaca vekil (proxy) denir.


13. Soru

Web verisinin özellikleri nelerdir?

Cevap

Genel olarak web üzerinde var olan veriler izleyen özelliklere sahiptir:

  • Web ortamındaki veri miktarı aşırı büyüklüktedir. 
  • Web ortamındaki veri dağınık ve heterojen bir yapıdadır.
  • Web ortamındaki veri yapılandırılmamıştır. 
  • Web ortamındaki veri dinamiktir.

14. Soru

Web madenciliği kullanılan veri tipine göre nasıl sınıflandırılmaktadır?

Cevap

İnternette yer alan bilgiler farklı veri türlerini barındırdıkları için web madenciliği, veri madenciliği sürecinde kullanılan web verilerinin türüne göre Web İçerik Madenciliği, Web Yapı Madenciliği ve Web Kullanım Madenciliği şeklinde sınıflandırılır.


15. Soru

Web kullanım madenciliğinin uygulama alanları nelerdir?

Cevap

Web kullanım madenciliği, son yıllarda yoğun ilgi gören ve birçok güncel uygulama alanına sahip bir web madenciliği türüdür. Özellikle arama motorlarındaki çeşitlilik ve rekabet ortamı, kullanıcı odaklı arama performansını geliştirmek için araştırmacıları web kullanım madenciliğine yönlendirmiştir. Kişiselleştirme, sistem geliştirme, web sitesi güncelleme, iş zekası, kullanım karakteristiği gibi alanlarda uygulanmaktadır.


16. Soru

Web İçerik Madenciliği, Web Yapı Madenciliği ve Web Kullanım Madenciliği kullandıkları yöntemler açısından nasıl farklılaşmaktadır?

Cevap

Web İçerik Madenciliği,

  • Otomatik öğrenme
  • İlişki kuralları
  • Özel algoritmalar
  • İstatistiksel yöntemler

Web Yapı Madenciliği,

  • Özel algoritmalar

Web Kullanım Madenciliği ise

  • İstatistiksel yöntemler
  • Otomatik öğrenme

yöntemlerini kullanmaktadır


17. Soru

Sosyal medya olarak adlandırılan hizmetlerin ortak özellikleri nelerdir?

Cevap

Sosyal medya olarak adlandırılan hizmetler izleyen ortak özelliklere sahiptir.

  • Sosyal medya hizmetleri, (günümüz koşullarında) Web 2.0 internet tabanlı uygulamalardır.
  • Sosyal medya hizmetleri, kullanıcı tarafından oluşturulan ve değiştirilebilen bir içeriğe sahiptir.
  • Sosyal medya hizmetlerinde, site veya uygulama için güvenliği, tasarımı ve bakımı hizmet sağlayıcı tarafından sağlanan bireysel veya grup profilleri oluşturulabilir.
  • Sosyal medya hizmetleri, bir kullanıcı ile diğer kullanıcılar ve/veya gruplar arasında bağlantılar kurarak çevrim içi sosyal ağlar oluşturulmasını kolaylaştırır.

18. Soru

Sosyal medya hizmetleri kullanım amacına göre nasıl sınıflandırılmaktadır?

Cevap

Günümüzde kullanılmakta olan sosyal medya hizmetlerini temel olarak izleyen biçimde sınıflandırmak mümkündür.

1. Genel amaçlı veya arkadaş tabanlı: Bu hizmetler belirli bir konu üzerine odaklanmayan arkadaşlık temeline dayanan paylaşım hizmetleridir.

2. Bilgilendirici: Bu hizmetlerin amacı günlük sorunlara yanıtlar sunmaktır.

3. Mesleki: Bu hizmetler kariyer veya meslek planlamasında yeni fırsatlar edinmek için kullanılır.

4. Eğitim: Bu hizmetler öğrencinin deneyimini geliştirmek için kullanılır.

5. Hobiler: Bu hizmetler aynı şeylere ilgi duyan insanlar için bir buluşma noktasıdır.

6. Akademik: Bu hizmetler akademik ve bilimsel çalışmalar için güncel bilgi kaynağına erişim sunan hizmetlerdir.

7. Haberler: Bu hizmetler tüm toplumu ilgilendiren haber yayıncılığına ilişkin hizmetlerdir


19. Soru

R ile Twitter verilerinin analizinde kullanılabilecek veriler nelerdir?

Cevap

Twitter verileri ile R’de birçok farklı analiz gerçekleştirmek mümkündür. Ancak yapılacak analizlerde kullanılacak Twitter verilerini kullanıcının kendi verileri ve tüm kullanıcıların verileri olmak üzere iki kısımda incelemek yerinde olacaktır.


20. Soru

API (Application Programming Interface / Uygulama Programlama Arayüzü) nedir?

Cevap

API (Application Programming Interface / Uygulama Programlama Arayüzü), bir yazılımın başka bir yazılımda tanımlanmış fonksiyonlarını kullanabilmesi için uygulama oluşturmada kullanılan alt program, protokol ve araçlar bütünüdür.


Bahar Dönemi Dönem Sonu Sınavı
25 Mayıs 2024 Cumartesi