Sosyal Ağ Analizi Dersi 2. Ünite Sorularla Öğrenelim
Temel Kavramlar
- Özet
- Sorularla Öğrenelim
Ağ büyüklüğü, karmaşıklık ve bağlantı kavramlarını formülize ederek açıklayınız.
Bir ağdaki düğüm (sosyolojik anlamda aktör) sayısı, “ağ büyüklüğü” adını alır ve ağ büyüklüğü N ile gösterilir. Bir ağın düğüm sayısı arttıkça o ağdaki karmaşıklık artar. Yönlü
bir ağ için maksimum bağlantı sayısı N(N-1) ile yönsüz bir ağ için ise maksimum bağlantı
sayısı N(N-1) / 2 ile hesaplanır. N(N-1) / 2 sayısı bize aynı zamanda bir ağdaki düğüm
çii sayısını gösterir.
Tek parçalı ağ kavramını açıklayınız.
Biz genelde aynı türden düğümlerden oluşan ağlarla ilgileniriz. Örneğin; insanların oluşturdukları sosyal ağlarda düğümler aynı türden olduğu için bu ağlar “tek parçalı ağ” adını
alır.
Ağ yoğunluğu kavramını açıklayınız.
Sosyolojik açıdan ağdaki uyumluluk, birliktelik, dayanışma ve aidiyet ağ yoğunluğu (density) ile ölçülür. Yoğunluk, düğümler arasındaki karşılıklı bağlantılı olmanın düzeyini ölçen bir ölçüdür.
Yönlü ağlarda iki düğüm arasında kaç tür bağlantı olabilir? Açıklayınız.
Ağ analizlerinde diadik ilişkiler iki düğüm arasındaki ikili ilişkilerdir. Yine ağ analizinde
üç düğüm arasındaki bağlantılar ise triadik bağlantılar olarak adlandırılır. Yönlü ağlarda iki düğüm arasında üç tür bağlantı olabilir:
• İki düğüm arasında hiçbir bağlantı olmayabilir
• İki düğüm arasında tek yönlü bir bağlantı olabilir.
• İki düğüm arasında karşılıklı (reciprocal) bir bağlantı olabilir.
İki parçalı ağ kavramını açıklayınız.
Kullanıcıları kullanıcılara veya dokümanları dokümanlara bağlayan ağlar tek parçalı
ağlardır. Ancak bir ağda müşteriler ve ürünler gibi iki tür düğüm söz konusu ise o zaman bu ağ “iki parçalı ağ” adını alır.
Bir ağda derece dağılımı neyi ifade eder ve nasıl hesaplanır?
Derece dağılımı pk ise bize bir ağda rassal olarak seçilen bir düğümün k derecesine sahip
olması olasılığını verir. N’nin bir ağdaki toplam düğüm sayısı ve Nk’nın bir ağda k derecesine sahip düğüm sayısı olduğunu hatırlayarak, Nk değerlerini N’ye bölerek bu değerleri
normalize edip olasılık toplamlarını 1 yapabiliriz:
pk = Nk / N
Ağlar için derece dağılımı pk çok önemlidir çünkü bu dağılım ağın dirençli bir ağ olup
olmadığından, ağda virüslerin yayılmasına kadar birçok gelişmeyi belirler. Ayrıca derece
dağılımı, ağların türünün belirlenmesinde kullanılan ağın DNA’sı gibidir.
Patika kavramını tanımlayınız.
Bir ağda iki düğüm arasındaki, bağlantıların birbirine eklenmesinden oluşan yol patika
adını alır.
Sosyal ağlarda "üçlü kapanma" kavramını açıklayınız.
Eğer bir sosyal ağda iki kişi ortak bir arkadaşa sahip ise, o iki kişinin de gelecekte artan
bir olasılıkla arkadaş olmaları beklenir ve bu olguya “üçlü kapanma”(Triadic closure) adı
verilir. Eğer A düğümünün B ve C düğümleri ile bağlantıları varsa ve eğer bu bağlantılar
kuvvetli bağlarsa, özellikle B-C bağının oluşması olasıdır (Leskovec, 2007).
Ortalama patika uzunluğu kavramını tanımlayınız.
Ortalama patika uzunluğu, bütün düğüm çiftleri arasındaki en kısa patikaların ortalaması olarak tanımlanabilir.
Sosyal ağ analizinde "merkezi düğüm" kavramını açıklayınız.
En yüksek dereceye sahip olan düğümler, bir anlamda ağdaki akışı kontrol edebilecek güce
sahip olan “merkezî düğümler”dir (hubs). Merkezî düğümlerin gelen ve giden bağlantıları
yüksektir. Eğer bir merkezî düğümün gelen bağlantı derecesi yüksek ise, bunun anlamı o
düğüme çok fazla danışıldığı olabilir. Yine bir merkezî düğümün giden bağlantı derecesi
yüksek ise, o zaman da bunun anlamı, bu düğümün sağa sola çok fazla talimat verdiği, görüş
bildirdiği veya haber verdiği anlamında olabilir. Merkezî düğümler bir ağdaki önemli düğümlerdir. Sosyal ağ analizinde merkezî düğümlerin belirlenmesi önemlidir.
i ve j düğümleri arasındaki en kısa patika arasındaki ilişkiyi yönlü ve yönsüz ağlar açısından karşılaştırınız.
i ve j düğümleri arasındaki en kısa
patikayı dij ile gösteriyoruz. Yönsüz ağlarda dij= dji olmakla birlikte yönlü ağlarda genelde
bu eşitlik söz konusu değildir: dij ? dji . Yönlü ağlarda i’den j’ye bir patika olması j’den i’ye
de bir patika olmasını garantilemez. İki düğüm arasında birden çok sayıda en kısa patika
olması da mümkündür.
Bir ağın yönlü veya yönsüz olması durumunu açıklayınız ve örneklendiriniz.
Yönlü ağlarda, düğümlerden gönderilen soyut veya somut bir şeyler söz konusudur ve çizgelerde, bunlar oklarla gösterilir. Yönlü ağlarda bağlantı
tek yönlü olabileceği gibi iki yönlü de olabilir. Buna karşılık, yönsüz ağlarda ise, sadece paylaşılan ortak özellikler vardır ve bağlantılar ok işaretinin yer almadığı bir çizgi şeklindedir.
Yönsüz ağlarda bağlantılar simetriktir. Yönlü ağlara örnek olarak, Twitter ve telefon açmak;
yönsüz ağlara örnek olarak ise, Facebook ve akrabalık, arkadaşlık ilişkileri verilebilir
Granovetter'in "yasaklanmış üçlü" kavramını ve bu durumun görülme olasılığını açıklayınız.
Granovetter, “Zayıf Bağların Gücü” adlı makalesinde Şekil 2.4’teki (sayfa 23) 201 no’lu üçlünün sık görülmediğini bunun “yasaklanmış üçlü” olduğunu belirtir (Granovetter, 1973). Diğer bir deyişle üç arkadaştan B ve C kişileri A ile karşılıklı bağlantılar içindeyse, örneğin birbirlerine telefon açıyorlarsa; B ile C’nin arasında bağlantı olmaması olasılığı düşüktür.
Tartılı ve tartısız ağ kavramlarını açıklayınız.
Ağlar, tartılı (weighted) olabilecekleri gibi tartısız (unweighted) da olabilirler. Eğer i ve j düğümlerinin arasındaki bağlantı wij =1 ise ve diğer bütün düğümler arasındaki bağlantıların
değeri 1’e eşitse bu ağ tartısız bir ağdır. Oysa cep telefonu ile konuşan iki kişinin konuştukları
süreler veya bu sürelerin toplamı, ağda tartı olarak alınabilir ve bu tür ağlar tartılı ağlar olarak
adlandırılırlar. Benzer şekilde, verilen borç miktarları ve yapılan ithalat/ihracat miktarları da
tartı olarak alınabilir
Sosyal ağ analizinde "derece" kavramını açıklayınız.
Derece, bir düğümün bağlantılı olduğu komşu sayısıdır. Yönlü ağlarda bir ağdaki düğümlerin gelen dereceleri, giden dereceleri ve toplam dereceleri söz konusudur.
Gerçek ağların seyrek olması durumunu düğüm ve bağlantı sayıları bağlamında açıklayınız.
Gerçek ağların düğüm (N) ve bağlantı sayıları (L) birbirinden çok farklıdır. Bir ağdaki
bağlantı sayısı L=0 ile LMaks arasında değişir. Tam bir çizgede, maksimum bağlantı sayısını gösteren LMaks sayıda bağlantı bulunur.
Gerçek ağlarda L değeri LMaks değerinden çok küçüktür ve bu durum bize gerçek ağların seyrek olduğunu gösterir. Seyrekliğin özellikle ağların bilgisayar belleklerinde saklanmasında bize kolaylıklar sağlayabileceği unutulmamalıdır.
Gerçek ağların seyrek ağlar olması olgusu ile Metcalfe yasası arasındaki ilişkiyi açıklayınız.
Gerçek ağların seyrek ağlar olması olgusu, Metcalfe yasasını da etkiler. Ağların çoğunda tam bağlantı sayısının (maksimum bağlantı sayısı) sadece küçük bir oranının gerçekte
yer alması, ağların değerinin N2 ile büyümediğini, belki de N sayısı ile doğrusal bir şekilde
büyüdüğünü bize anlatır. Diğer yandan, ağlardaki bağlantıların değerleri birbirlerine eşit
değildir. Öte yandan, bazı bağlantıların ağırlıklarının diğerlerine göre çok büyük olması
da Metcalfe yasasının geçerliliğini etkiler.
Komşuluk matrisi kavramını, matrisin elemanları arasındaki bağlantılar bağlamında açıklayınız.
Komşuluk matrisini bir Aij matrisi şeklinde düşünürsek ve bu matrisin bağlantılarının
değerleri 1 ise, bu matrisin elemanları şu şekilde olur:
Eğer j’den i’ye bir bağlantı varsa Aij =1
Eğer j’den i’ye bir bağlantı yoksa Aij = 0 olur.
Eğer komşuluk matrisi yönsüz bir ağın komşuluk matrisiyse, bu matris simetrik bir
matristir Aij = Aji ve Aii =0 olur ve ayrıca derecelerin satır toplamları, sütun toplamlarına eşit olur.
Buna karşılık, yönlendirilmiş ağların komşuluk matrisi simetrik olmak zorunda değildir. Yönsüz ağlarda Aij ? Aji ve Aii =0 olur ve satır toplamları sütun toplamlarına eşit
olmak zorunda değildir. Gelen ve giden bağlantıların sayısı veya değerlerinin toplamı aynı
olmak zorunda değildir.
Çok parçalı ağ kavramını açıklayınız.
Düğüm türleri eğer ikiden de fazla ise o zaman bu ağ “çok parçalı ağ” adını alır. İki veya daha çok parçalı ağlarda düğüm türleri, farklı renk ve şekillerle
gösterilebilir. Ağ ölçülerinin çoğunluğu tek parçalı ağlar için geçerli olduğundan, iki veya
çok parçalı ağları analiz etmek için önce bu ağlar tek parçalı biçime dönüştürülür ve hesaplamalar daha sonra yapılır.
Ağların komşuluk matrislerinin seyrek matris olmasının avantajı nedir?
Gerçek ağların sahip oldukları bağlantı sayıları L, maksimum bağlantı sayılarından
küçüktür. Örneğin; web, sahip olabileceği maksimum bağlantı sayısının sadece 1/106 kadarına sahiptir. Diğer gerçek ağlar için de bu oran değişebilir ama ağların seyrek (sparse) olma olgusu değişmez. Ağların komşuluk matrislerinin seyrek matris olması olgusu, kullanılan bilgisayar algoritmasında gereksiz alanları saklamadan sadece sıfır olmayan elemanları saklayarak önemli bir kazanım sağlamamıza yol açar