Спроба проаналізувати, які слова використовують українські та закордонні мас-медіа, коли пишуть про вітчизняну політику

середа, 7 березня 2012 р.

Тиждень 2012.09.

Розглянемо основні теми попереднього тижня (27 лютого - 4 березня).

Всього було опрацьовано 5200 повідомлень із новин. Найвживанішими словами були:

Серед 30-ти перших слів є три прізвища: Янукович, Луценко і Тимошенко (що і не дивно). Поглянемо на загальний граф тижня.

Серед найбільших концепцій цього тижня можна назвати: "больше", "говорить", "дело", "должны", "может", "власть", "политический", "регион", "страна".

Найтіснішими тематичними циркуляціями тут були:

  • "регион" (-0.007) - "организация" (-0.004) - "партия" (-0.069) - "проводить" (-0.055);
  • "уголовный" (-0.196) - "Луценко" (-0.012) - "приговор" (-0.054) - "экс" (-0.172) - "Юрий" (-0.240) - "судебный" (+0.020);
  • "посада" (-0.028) - "державний" (+0.076) - "закон" (-0.001) - "служба" (+0.076) - "новий" (-0.011);
  • "Владимир" (-0.299) - "Путин" (-0.241) - "Россия" (+0.006) - "российский" (-0.286) - "газета" (+0.004).

Як бачимо, переважна більшість слів в основних темах мали негативне емоційне забарвлення.

Наостанок, витяги деяких цікавих частин графа.

На сьогодні це все. В мене є одна задумка спробувати замість окремих слів відбирати найвживаніші пари слів і з них формувати загальний граф. Взагалі-то це давно відомий прийом в технології обробки текстової інформації - використання бі-грам. Що з цього вийде - наступного разу.

Далі буде.

Немає коментарів:

Дописати коментар