Розглянемо основні теми попереднього тижня (27 лютого - 4 березня).
Всього було опрацьовано 5200 повідомлень із новин. Найвживанішими словами були:
Серед 30-ти перших слів є три прізвища: Янукович, Луценко і Тимошенко (що і не дивно). Поглянемо на загальний граф тижня.
Серед найбільших концепцій цього тижня можна назвати: "больше", "говорить", "дело", "должны", "может", "власть", "политический", "регион", "страна".
Найтіснішими тематичними циркуляціями тут були:
- "регион" (-0.007) - "организация" (-0.004) - "партия" (-0.069) - "проводить" (-0.055);
- "уголовный" (-0.196) - "Луценко" (-0.012) - "приговор" (-0.054) - "экс" (-0.172) - "Юрий" (-0.240) - "судебный" (+0.020);
- "посада" (-0.028) - "державний" (+0.076) - "закон" (-0.001) - "служба" (+0.076) - "новий" (-0.011);
- "Владимир" (-0.299) - "Путин" (-0.241) - "Россия" (+0.006) - "российский" (-0.286) - "газета" (+0.004).
Як бачимо, переважна більшість слів в основних темах мали негативне емоційне забарвлення.
Наостанок, витяги деяких цікавих частин графа.
На сьогодні це все. В мене є одна задумка спробувати замість окремих слів відбирати найвживаніші пари слів і з них формувати загальний граф. Взагалі-то це давно відомий прийом в технології обробки текстової інформації - використання бі-грам. Що з цього вийде - наступного разу.
Далі буде.
Немає коментарів:
Дописати коментар