Спроба проаналізувати, які слова використовують українські та закордонні мас-медіа, коли пишуть про вітчизняну політику

вівторок, 26 липня 2011 р.

Тиждень 1129.

Розглянемо, що відбувалось 29-го тижня року (11.07 - 17.07).

Граф найцікавіших слів цього тижня має кілька згуртованих районів:

  • найбільший вгорі, пов'язаний із "найцікавішими" подіями у відчизняному політикумі (той що лівіше до уваги не беремо, оскільки він стосується до вербальних боїв на форумах, хоча це теж можна проаналізувати окремо): "суд"(-0.16) - "судебный"(-0.21) - "заседание"(-0.27) - "дело"(-0.26) - "уголовный"(-0.99) - "прокуратура"(-0.49);
  • інший, що також стосується судових подій (і так само негативний) розташований справа внизу, він значно менший, проте з більш міцними зв'язками: "засідання"(-0.23) - "головуючий"(-0.76) - "розпорядження"(-0.51) - "порушення"(-1.0) - "порядку"(-0.32) - "встановлено"(-0.83) - "неповага"(-0.73);
  • деякі інші невеликі підграфи:
    • "мельниченко"(-0.39) - "сбу"(-0.52) - "доказ"(+0.76) - "злочин"(-0.79);
    • "правила"(-0.54) - "снип"(+0.56) - "строительный"(+0.58) - "нормативный"(+0.64) - "независимый"(+1.0) - "правильный"(+0.94) - "неправильный"(-1.0);
    • "теплоход"(-0.33) - "трагедия"(-0.97) - "судно"(-0.30) - "катастрофа"(-1.0) - "высылка"(-1.0) - "посольство"(-0.45) - "атташе"(-1.0) - "сотрудник"(-0.54);

Тепер глянемо на найміцніші зв'язки між словами.

Тут групи слів практично такі ж, як і в попереднього графа. Кожен може оцінити його сам.

Далі буде.

понеділок, 25 липня 2011 р.

Тижні 26-28.

Спробуймо оглянути останні три тижні. Вони цікаві деякими гучними і не дуже подіями.

 

Тиждень 1126 (20.06 - 26.06).

Цього тижня можна виділити кілька груп із різними кольорами. Кілька відокремлених груп зверху та знизу представляють дискусії на форумах. Вони відзначаються щільністю розташування і протилежністю емоційного забарвлення слів, які там використовуються. Основний граф характеризується різноманітністю вживаних слів у центральній і лівій його частинах і монолітним семантичним та емоційним наповненням в правій його частині, яка описує початок гучного (чи просто шумного?) процесу над екс-прем'єром. Тут використовуються слова "тимошенко" (-0.08), "дело" (-0.22), "уголовный" (-0.94), "газовый" (-0.32), "контракт" (-0.48) тощо. Серед цікавинок основного графа, наприклад, можна відмітити зв'язок слів "мвф" (+0.47), "программа" (+0.60), "поддержка" (+0.91), "получить" (+0.60) і "угроза" (-0.89).

Варто відмітити, що використання підрахунку сили зв'язків між словами, описаного мною в попередньому пості (коли обчислюється коефіцієнт кореляції кількості використань слів в кожному тексті) дозволяє разом із словами, що нас цікавлять спостерігати і авторів (наприклад, на форумах), які найчастіше ці слова використовують.

Граф за цей тиждень трохи схожий на п-в Крим, хіба ні?)

Тепер поглянемо на граф із найміцнішими зв'язками між словами. Це дозволить оцінити найвживаніші сполучення слів за тиждень.

Найбільш щільною є хмарина слів в лівому нижньому куті. Це об'єднання різноманітних часто повторюваних слів із форумів. В основній же частині найміцніше зв'язаними, в основному, є ланцюжки слів, які описують новини про гучні кримінальні справи в країні:

  • "мельниченко"(-0.43) - "кучма"(+0.10);
  • "заведомо"(-0.16) - "ложный"(+0.17);
  • "кримінальна"(-0.29) - "справа"(-0.04) - "екс"(-0.10);
  • "уголовное"(-0.94) - "дело"(-0.22);
  • "юлия"(-0.11) - "тимошенко"(-0.08) - "суд"(-0.02) - "печерский"(-0.24) - "районный"(-0.15).

Проте, зважаючи на дати, які охоплює цей тиждень, також досить вживаним був наступний ланцюжок слів:

  • "ссср"(+0.12) - "германия"(+0.11) - "гитлер"(+0.05) - "польша"(+0.22) - "франция"(+0.23).

 

Тиждень 1127 (27.06 - 03.07).

Цей тиждень виявився менше структурованим, ніж попередній. Тут немає яких-небудь строго визначених під-графів (окрім форумних, в нижній частині). Слова використовувались із більшим різноманіттям. Мабуть, це пов'язано із виступами президента того тижня. У верхній частині можна спостерігати досить розгалужену частину графа, слова в якій мають переважно позитивне забарвлення і пов'язані в основному із загально-політичною риторикою. Серед цих слів найбільш з'єднаними є "будет", "страна" і "янукович". Навіть "тимошенко"(+0.14) має з'єднання лише із "фролов"(-0.60). Ще можна відмітити четвірку добре з'єднаних між собою слів "луценко"(-0.21) - "имущество"(-0.30) - "наложение"(-0.48) - "гаврилюк"(-0.73).

Тепер поглянемо на найсильніше з'єднані слова.

Найтовстіші зв'язки мають поєднання слів, які стосуються вже відомих кримінальних справ:

  • "имущество"(-0.30) - "наложение"(-0.48) - "арест"(-0.18) - "гаврилюк"(-0.73);
  • "юлия"(+0.05) - "тимошенко"(+0.14) - "суд"(+0.07).

Розгалужена верхня частина з дещо слабшими зв'язками, серед яких найсильнішими є:

  • "янукович"(+0.20) - "реформа"(+0.88);
  • "есть"(+0.11) - "будет"(+0.22) - "будут"(+0.03) - "вопрос"(+0.07);

Ще один міцний ланцюжок: "казак"(-0.44) - "крест"(+0.13) - "милиция"(-0.28).

 

Тиждень 1128 (04.07 - 10.07).

Цього тижня граф найцікавіших слів також виявився досить одноманітним. Хіба що в правому верхньому кутку виділяється структурований під-граф  позитивних слів із законотворчою тематикою, зокрема, прийнятої цього тижня Пенсійної реформи. В нижній частині зосередились в основному негативно забарвлені слова. Наприклад, такі поєднання:

  • "самсоненко"(-0.56) - "семенюк"(-0.56) - "превышение"(-0.82) - "полномочий"(-0.41) - "рнбо"(-1.0);
  • "теплоход"(-0.58) - "булгария"(-0.48) - "мчс"(-0.62).

Також варто відзначити ще одну знакову подію цього тижня: "луганский"(-0.38) - "ландик"(-0.50) - "инцидент"(-0.89) - "драка"(-0.64).

Подивимось на сполучення слів.

Тут, окрім у згаданих ланцюжків про кримінальні події, несподівано організованим та міцним виявився під-граф: "русский"(-0.03) - "народ"(+0.12) - "призыв"(-0.73) - "кавказ"(-0.22) - "украинцы"(+0.29) - "государство"(+0.35) - "национальный"(+0.29) - "украинский"(+0.12) - "россия"(-0.08) - "украина"(-0.03).

 

Поки що все. Сподіваюсь, надалі випуски будуть виходити більш вчасно.)

Далі буде.