Спроба проаналізувати, які слова використовують українські та закордонні мас-медіа, коли пишуть про вітчизняну політику

неділя, 17 квітня 2011 р.

Тиждень 1115. Кучма-3.

Поглянемо, що цікавого приніс нам новий тиждень (4-10 квітня).

Загальний розмір словника тижня був на рівні попереднього - 60К слів, що є на 30% менше ніж за всі інші тижні. Можливо, це пов'язано із відсутністю протягом останніх двох тижнів постів із форуму сайту FOR-UA у корпусі текстів. Цей форум переїжджав на інший хостинг і був не надто активний за цей період. Хоча, звісно, третина всього розміру - це значна частина словника і малоімовірно, щоб будь-яке джерела інформації в нашому випадку могло зхаповнювати таку частину контекстного середовища... Подивимось, яка картина буде в наступні тижні. Кількість вживань кожного слова зросла до 15. Процент нових слів був на рівні минулих тижнів - 4%. Отже, швидше за все нас чекає дещо збільшені взаємозалежності між основними найвживанішими словами.

А такими словами були наступні:

"Кучма", як і два минулих тижні, посідає перше місце. Хоча, напевне, це ненадовго. В першому десятку присутні нові слова "ндс" і "налог". Також новим є слово "послание". До 30 найвживаніших слів потрапили також "зарплата" і "вто". "Земля" присутнє практично у всіх тижнях.

Тепер подивимось на граф тижня.

Цього тижня немає такого вираженого негативного сегменту, як у попередньому. Граф є досить сильно зв'язаним, а основними центрами є слова "президент" (+0.23), "украина" (+0.21), "янукович" (+0.38), "глава" (+0.28), "государство" (+0.28), "будет" (+0.27) і "виктор" (+0.36). Скоріш за все це пов'язано із виступом Президента у Верховній Раді зі щорічним посланням ("послан" +0.57). Основними центрами із негативним сентиментним значенням є як і раніше "кучма" (-0.18) - "гонгадзе" (-0.31), а також "уголовный" (-0.99), "убийство" (-0.46), "обвиняемый" (-0.66), "ознакомлен" (-0.89), следователь" (-0.58). Ще одним не таким явним є негативний центр із словом "проблема" (-0.99), яке поєднане з "реформа" (+0.97), "янукович", "будут" (+0.34), "система" (+0.34), "украина", "страна" (+0.28), "вто" (+0.32), "экономика" (+0.51), "барьер" (+0.85), "модернизация" (+0.77) і "качественный" (+0.97).

Поглянемо ще на деякі цікаві слова окремо.

Слово "зарплата" (+0.23), найбільш пов'язана із "газ" (+0.10), "налог" (+0.01), "будут", "закон" (+0.07), "товар" (+0.28), "фонд" (+0.28), "конверт" (+0.07), "плата" (+0.34), "пенси(і)я" (+0.20) і "выплата" (+0.03). "Налог" же в свою чергу має контекст із "зарплата", "бюджет" (+0.10), "доход" (-0.22), "млрд" (+0.12), "расход" (-0.05), "размер" (-0.08), "сбор" (-0.11), "уплата" (-0.55).

"Земля" найбільш асоціюється із "люди" (+0.08), "одна" (+0.13), "друго(и)й" (+0.22), "день" (+0.20), "житель" (+0.25), "таких" (+0.08), "товар", "нефть" (+0.31), "банк" (+0.31), "кредит" (+0.38), "земельны(и)й" (+0.61), "центральны(и)й" (+0.27), "брать(и)" (-0.21).

Про "вто" пишуть разом із "проблема", "свободный" (+0.95), "соглашение" (+0.49), "политический" (+0.12), "задача" (+0.42), "вступление" (+0.50), "требует" (-0.05), "ставить" (+0.19), "последствия" (-0.18), "секретариат" (+0.23) і "наличие" (+0.59).

Наразі це все. Далі буде.

 

середа, 13 квітня 2011 р.

Тиждень 1114. Кучма-2.

Які нові слова та взаємозв'язки між ними приніс нам тиждень №14 (28 березня -3 квітня)? Подивимось.

Спочатку загальні дані.

За цей тиждень було використано всього близько 63К унікальних слів, що на 30% менше ніж у попередні тижні. Середня кількість повторів кожного слова також була найнижчою від початку року - 13.8. Процент нових слів серед відібраних знаходився на рівні попередніх тижнів - 4.4%. Тобто говорили не багато, використовуючи ті самі слова з невеликою кількістю нових.

Як і попереднього тижня, із великим відривом лідирує слово "кучма". Також серед впізнаваних слів-прізвищ є "тимошенко", "мельниченко", "янукович", "гонгадзе" і "луценко". З першої тридцятки зникли слова, що відносяться до подій у Японії та Лівії.

Поглянемо тепер на загальний граф найцікавіших слів.

Цього тижня також, як і попереднього присутній яскраво виражений сектор негативних слів. Можна сказати, що ця частина графу є найбільшою із наведених 200 найвиразніших слів. Найбільш зв'язаним із іншими знову виступає слово "кучма" (-0.40). Найбільш поєднаними із ним є слова "экс" (-0.27), "тимошенко" (+0.17), "янукович" (+0.29), "гонгадзе" (-0.39), "ющенко" (+0.38), "прокуратура" (-0.37), "реформа" (+0.91), "свобода" (+0.99), "рейтинг" (+0.71), "хорошо(ий)" (+0.91), "фарс" (-0.83).. За бажання, тут можна знайти ще кілька цікавих зв'язків в інших частинах графа..)

Наведу ще кілька цікавих графів окремих слів.

Тут про поїздку нашого президента до Брунею. "Бруней" (+0.31) має найсильніші зв'зки із "янукович", "проводит" і "нефть" (+0.10).

 

Наразі це все. Далі буде.

 

вівторок, 5 квітня 2011 р.

Тиждень 1113. Кучма.

Подивимось, що нам приніс новий тиждень (21-27 березня).

Кількість задіяних слів становила понад 88К слів, середня кількість повторів слів - більше 16. Відносна кількість нових слів зменшилась до 3.5%.

Найголовнішими цього тижня були такі слова.

Як бачимо, безаперечним лідером повідомлень минулого тижня було слово "кучма". Крім нього іншими (та прямо пов'язаними із ним) словами-прізвищами були "мельниченко" і "гонгадзе". Всі вони ознаменовують гучну тему порушення кримінальної справи троти екс-президента Л.Кучми кримінальної справи щодо службової халатності, яка призвела до загибелі журналіста Г.Гонгадзе. А також пов'язані із цією справою спічі колишнього охоронця М.Мельниченка. Також доволі актуальною в нашому медійному просторі була лівійська тема: "ливия" і "каддафі(и)" займають відповідно 7-е та 21-е місця.

Подивимось тепер на граф найцікавіших слів.

У графа цього тижня було два основних слова, які мають найбільшу кількість зв'язків і навколо яких побудовані два основних кластери - це "украина" (-0.13) і "кучма" (-0.56). Перше стосується різноманітних сторін життя держави, як то "россия" (+0.22), "грузі(и)я" (+0.28), "русь" (+0.28), "парті(и)я" (+0.26), "дело" (-0.36), "хорошо" (+0.92), "лучше" (+0.95), "против" (-0.36), "плохо" (-0.93), "развитие" (+0.96), "белорусский" (+0.41) тощо. Друге відноситься до теми зазначеної вище. Практично всі слова цього кластеру мають негативний сентиментний відтінок. Наведу лише слова, які означають прізвища пов'язаних персонажів: "гонгадзе" (-0.74), "мельниченко" (-0.46), "литвин" (-0.42), "пукач" (-0.54), "чорновил" (-0.47), "кравченко" (-0.62), "кузьмин" (-0.79), "ульянченко" (-0.56), "мороз" (-0.43), "салов" (-0.62). Більшість цих слів також зв'язані між собою. Наприклад, "литвин" поєднане із "кучма", "гонгадзе", "мельниченко", "кравченко", "ульянченко", "запис(ь)" (-0.52) і "генпрокурор" (-0.72). Маємо щільний клубок із прізвищ і подій...

Поглянемо на граф найбільше з'єднаних слів.

Тут можна побачити групи слів, які мають найсильніші зв'язки. Наприклад, можна побачити, що "кучма", крім всього іншого, поєднане також із "президент" (-0.13), "тимошенко" (-0.09), "янукович" (+0.12), "каддафі(и)" (+0.19), "ющенко" (-0.06)...

Поки що все. Далі буде.