Розглянемо політичний зріз останнього тижня (з 30 січня по 5 лютого). За цей період із новиннєвих джерел було отримано більше 5000 текстів. Перейдемо до основного графа.
Цього разу я трохи змінив спосіб відбору слів для кінцевої карти. Спочатку була порахована міжсловесна централізація кожного слова (betweeness centrality) в графі. За цією величиною в даному випадку відбираються слова, які містять концепції, виражені в графі. Було відібрано 200 найбільших слів-концепцій. Колір слова, як і раніше, позначає сентиментну складову. А колір вершин (і їх зв'язків) визначає модульність (об'єднаність) груп слів між собою, тобто, тематичні групи графа.
Як бачимо, найбільш щільною є група темно-жовтого кольору, в якій основними концепціями є "думать" (+0.046), "скажи" (-0.085), "дмитро" (+0.251), "віктор" (-0.236), "ситуація" (+0.174).
Другою за розміром є червона частина графу. Тут знаходяться здебільшо українські слова. Найбільш значимі серед них: "люди" (+0.119), "право" (+0.008), "давати" (+0.034), "хоче" (+0.201), "зробити" (-0.108), "янукович" (-0.067), "пиратский" (-0.127), "конституційний" (+0.035).
Наступна група теж є україномовною і здебільшо негативною. Основні з них: "україна" (-0.040), "перший" (-0.125), "влада" (-0.155), "питання" (+0.013), "політичний" (-0.020), "тимошенко" (-0.007).
Основна російськомовна частина в свою чергу позначена синіми зв'язками між вершинами. Головні концепції тут: "украина" (-0.022), "страна" (-0.038), "власть" (+0.021), "первый" (+0.018), "вопрос" (+0.233), "понимать" (-0.022), "человек" (-0.061), "должный" (-0.031).
Також можна відмітити невеличку відокремлену тематичну групу із словами "газ" (+0.168), "газпром" (+0.209), "поставка" (-0.023), "объем" (+0.008), "европа" (+0.037), "российский" (+0.247).
Є ще кілька невеликих розрізнених частин (наприклад, верхня частина із "температурою" і "морозом"), які кожен може дослідити самостійно.
На цей тиждень це все. Далі буде.
Немає коментарів:
Дописати коментар