Поглянемо, що цікавого приніс нам новий тиждень (4-10 квітня).
Загальний розмір словника тижня був на рівні попереднього - 60К слів, що є на 30% менше ніж за всі інші тижні. Можливо, це пов'язано із відсутністю протягом останніх двох тижнів постів із форуму сайту FOR-UA у корпусі текстів. Цей форум переїжджав на інший хостинг і був не надто активний за цей період. Хоча, звісно, третина всього розміру - це значна частина словника і малоімовірно, щоб будь-яке джерела інформації в нашому випадку могло зхаповнювати таку частину контекстного середовища... Подивимось, яка картина буде в наступні тижні. Кількість вживань кожного слова зросла до 15. Процент нових слів був на рівні минулих тижнів - 4%. Отже, швидше за все нас чекає дещо збільшені взаємозалежності між основними найвживанішими словами.
А такими словами були наступні:
"Кучма", як і два минулих тижні, посідає перше місце. Хоча, напевне, це ненадовго. В першому десятку присутні нові слова "ндс" і "налог". Також новим є слово "послание". До 30 найвживаніших слів потрапили також "зарплата" і "вто". "Земля" присутнє практично у всіх тижнях.
Тепер подивимось на граф тижня.
Цього тижня немає такого вираженого негативного сегменту, як у попередньому. Граф є досить сильно зв'язаним, а основними центрами є слова "президент" (+0.23), "украина" (+0.21), "янукович" (+0.38), "глава" (+0.28), "государство" (+0.28), "будет" (+0.27) і "виктор" (+0.36). Скоріш за все це пов'язано із виступом Президента у Верховній Раді зі щорічним посланням ("послан" +0.57). Основними центрами із негативним сентиментним значенням є як і раніше "кучма" (-0.18) - "гонгадзе" (-0.31), а також "уголовный" (-0.99), "убийство" (-0.46), "обвиняемый" (-0.66), "ознакомлен" (-0.89), следователь" (-0.58). Ще одним не таким явним є негативний центр із словом "проблема" (-0.99), яке поєднане з "реформа" (+0.97), "янукович", "будут" (+0.34), "система" (+0.34), "украина", "страна" (+0.28), "вто" (+0.32), "экономика" (+0.51), "барьер" (+0.85), "модернизация" (+0.77) і "качественный" (+0.97).
Поглянемо ще на деякі цікаві слова окремо.
Слово "зарплата" (+0.23), найбільш пов'язана із "газ" (+0.10), "налог" (+0.01), "будут", "закон" (+0.07), "товар" (+0.28), "фонд" (+0.28), "конверт" (+0.07), "плата" (+0.34), "пенси(і)я" (+0.20) і "выплата" (+0.03). "Налог" же в свою чергу має контекст із "зарплата", "бюджет" (+0.10), "доход" (-0.22), "млрд" (+0.12), "расход" (-0.05), "размер" (-0.08), "сбор" (-0.11), "уплата" (-0.55).
"Земля" найбільш асоціюється із "люди" (+0.08), "одна" (+0.13), "друго(и)й" (+0.22), "день" (+0.20), "житель" (+0.25), "таких" (+0.08), "товар", "нефть" (+0.31), "банк" (+0.31), "кредит" (+0.38), "земельны(и)й" (+0.61), "центральны(и)й" (+0.27), "брать(и)" (-0.21).
Про "вто" пишуть разом із "проблема", "свободный" (+0.95), "соглашение" (+0.49), "политический" (+0.12), "задача" (+0.42), "вступление" (+0.50), "требует" (-0.05), "ставить" (+0.19), "последствия" (-0.18), "секретариат" (+0.23) і "наличие" (+0.59).
Наразі це все. Далі буде.