Це чудове слово - "відпустка"...:)
Отож, продовжу. В цьому пості наведу набір діаграм типу Bubble для 30 найвживаніших слів за всі 22 тижні, в яких діаметр бульбашки відповідає величині значення TFIDF для даного слова в даному джерелі.
Кола синього кольору - це українські джерела, червоного - російські, жовтого - західні, зеленого - форуми.
В такому вигляді зручніше оцінювати співвідношення між різними джерелами та групами джерел у використанні того чи іншого слова.
Наприклад, можна зробити висновок, що найпопулярніше слово "украина" найбільше вживали у закордонних джерелах та на форумах і восновному в перші тижні спостережень (початку передвиборної кампанії).
Для українських джерел найбільш притаманними є слова "президент", "тимошенко" (в першій половині періоду), "янукович" (в другій половині), "выбор" (в першій половині), "слово", "одно", "заявил".
На форумах найбільш вживаними є слова "украина", "россия", "страна", "вопрос", "одно", "люди", "русский" (в першій половині періоду і яке більше ніде практично не вживалось), "дело", "политик". Разом з тим, такі слова як "президент", "тимошенко", "янукович", "ющенко", "выбор", "україна", "кандидат", "депутат", "юлия" застосовуються досить рідко...
Решта висновків кожен зробить сам.
В наступному пості я подам результати за 23-24 тижні.
Далі буде...
Немає коментарів:
Дописати коментар