Спроба проаналізувати, які слова використовують українські та закордонні мас-медіа, коли пишуть про вітчизняну політику

понеділок, 28 травня 2012 р.

Тиждень 2012.20

Після більш ніж місячної паузи ми продовжимо спостерігати за політичним медіа-простором країни. Подивимось на 200 найважливіших слів за останні 5 тижнів.

Серед позитивних слів можна виділити: "Украина", "Янукович", "первый", "Донецк", "Азаров".

Слова із нейтральним емоційним навантаженням: "Україна", "Тимошенко", "украинский", "Верховный", "ЄС", "политический", "Евро", "США".

Із негативних можна зазначити такі слова: "новый", "говорить", "Россия", "европейский", "Москва", "газовый", "социальный".

Тепер поглянемо на сумарне семантичне забарвлення всіх текстів за тиждень. Подивимось на це показник протягом всіх двадцяти тижнів цього року.

Як можна побачити, емоційне забарвлення повідомлень ЗМІ з кожним тижнем восновному знижувалось і від значення +0.30 на початку року впало до позначки -0.35 у 18-му тижні. Останнього тижня цей показник зріс до нейтральної позначки -0.01.

Подивимось на значимість та емоційне забарвлення деяких окремих слів з початку року.

Як бачимо, слово "Тимошенко" мало порівняну і навіть більшу значимість ніж "Янукович". Емоційне забарвлення протягом періоду найсильніше змінювалось в "Азаров". Від негативного -0.38 4-го тижня до +0.43 7-го тижня та +0.38 і +0.56 18-го і 20-го відповідно. Решта ж слів мали білянейтральне забарвлення.

Тут у двох із трьох слів ("Евро" і "Европа") за останні три тижні значимість зросла. А от семантичне навантаження найбільш яскравим було у слова "Москва": від нейтрального в першій половині періоду і до -0.52 15-го тижня та -0.16 20-го. "Евро" також в кінці періоду почало набувати негативних значень: -0.18 17-го тижня і -0.15 20-го. "Евро" тут позначає відношення до підготовки та проведення в Україні європейської першості із футболу 2012.

В цьому випадку значимість всіх трьох слів протягом всього періоду знижувалась, що свідчить про зменшення уваги до цих тем. Емоційне забарвлення ж було досить різним у всіх трьох слів. І якщо для слова "экономика" стрибки із -0.25 і -0.18 до +0.13 можна пояснити світовою кон'юктурою, то аналогічні стрибки від +0.11 до -0.23 останнього тижня заздалегіть позитивного слова "реформы" можна пояснити лише відношенням до них в середині країни.

Поки що це все. Далі буде (сподіваюсь)).

пʼятниця, 30 березня 2012 р.

Тиждень 2012.11-12.

З деяким запізненням, але подивимось на головні слова попередніх двох тижнів. Граф слів буде об'єднаним за обидва тижні. Ось він.

Як бачимо, основними концепціями за ці тижні були слова: "время", "вопрос", "говорити", "больше", "Украина", "Україна", "глава", "команда", "предложение".

Найбільші тематичні кола:

  • "вопрос" (+0.110) - "говорить" (+0.029) - "больше" (+0.090) - "может" (+0.046) - "решение" (+0.007) - "Олександр" (-0.007) - "люди" (-0.017) - "год" (+0.071) - "Сергій" (+0.022);
  • "время" (+0.004) - "команда" (+0.269) - "глава" (+0.003) - "предложение" (+0.178) - "организация" (-0.020) - "фонд" (+0.185);
  • "Тимошенко" (+0.110) - "Юлия" (-0.137) - "дело" (-0.012) - "уголовный" (+0.004) - "власть" (+0.067).

Тепер створивши мовну модель тижня за допомогою n-грам, відтворимо послідовності деяких найвживаніших слів.

 

Відносно слова "Украина" три відтворених найвживаніших послідовності стосуються призначення (довгоочікуване) президентом П.Порошенка міністром економічного розвитку і торгівлі, турбота прем'єра про підвищення рентабельності вітчизняних НПЗ (на фоні нестримного і необгрунтованого зростання цін на заправках країни) і прагення української влади парафувати угоду з ЄС.
Найголовнішими темами про "Янукович" були забезпечення виплат для компенсації вкладів Ощадбанку СРСР (що сприйнялось як підготовка до парламенських виборів восени), намір зробити російську мову другою державною, що також було сприйнято, як свідчення наближення виборів депутатів і знову ж таки призначення Порошенка міністром.
Із "Тимошенко" все однозначно. Тут публікувались повідомлення про погіршення стану здоров'я (Ю.Тимошенко та Ю.Луценка також), необхідності лікування на стаціонарі та заяви західних політиків про ознаки політичних репресій в Україні.
Тема "Евро" (-2012) також була (і є) непростою. Тут і неокупність витрачених на підготовку 35 млрд. (!!) коштів, і негативний вплив не цю подію політичних переслідувань опозиції в країні тощо. Взагалі слово "Евро" за минулі два тижні мало сентиментне значення -0.178, тобто суттєво негативне...
На сьогодні це все. Далі буде.

 

неділя, 18 березня 2012 р.

Тиждень 2012.10. Бі-грами.

Спочатку подивимось на основні слова попереднього тижня, а потім на найвживаніші пари слів (бі-грами). Отже, найважливішими словами 10-го тижня року були:

Найголовнішими словами цього тижня були практично ті ж, що й попереднього: "новий", "партія", "Янукович", "Россия", "суд", "выборы", "право", "дело", "Тимошенко", "страна", "Путин". Головний граф слів виглядав наступним чином.

 

Найбільші концепції тут: "больше" (+0.133), "Украина" (-0.103), "может" (+0.036), "Україна" (+0.034), "говорить" (-0.156), "время" (+0.194), "страна" (-0.044), "час" (+0.061), "стал" (+0.053), "Россия" (-0.031).

Найвираженішими тематичними колами були три:

  • "министр" (+0.001) - "премьер" (+0.075) - "бывший" (-0.073) - "экс" (-0.045) - "Юлия" (-0.079) - "Тимошенко" (+0.033) - "колония" (-0.194);
  • "дело" (+0.099) - "Киев" (+0.081) - "суд" (+0.062) - "решение" (+0.013) - "Луценко" (+0.190) - "справа" (+0.073) - "рішення" (+0.084);
  • "Россия" (-0.031) - "российский" (-0.066) - "Путин" (+0.050) - "выборы" (-0.248) - "победа" (-0.146) - "оппозиция" (+0.041) - "митинг" (+0.032) - "Москва" (-0.134).

Цікаво, що остання тема про перемогу В.Путіна на виборах має здебільшо негативне забарвлення.

Тепер подивимось, які бі-грами були найвживанішими:

Тут також багато таких слів, які вже були: "Виктор Янукович", "Юлия Тимошенко", "Владимир Путин", "партия регионов", "президентские выборы" тощо. Поглянемо на граф бі-грам. Величина сентиментного навантаження обчислювалась як середнє із двох слів.

Як можна помітити, найщільніші тематичні кола тут пов'язані із прогнозом погоди чи якоюсь другорядною інформацією. Це, скоріш за все, є наслідком неякісного пошуку статей новин. Серед інших помітних пожна виділити такі тематичні послідовності:

  • "Качановская исправительная" (+0.079) - "исправительная колония" (-0.176) - "суд прав" (-0.087) - "Вальбург Хабсбург" (+0.082);
  • "партия регионов" (-0.222) - "Сильная Украина" (+0.027) - "речь идет" (+0.006) - "угода асоціації" (+0.074);
  • "Юрий Луценко" (-0.023) - "генеральный прокурор" (-0.045) - "министр внутренних" (-0.134) - "администрация президента" (+0.062).

Тут є над чим далі працювати. Треба покращити відбір текстів новин, а також можна спробувати об'єднати пари слів із однаковими словами і подивитись, який вийде граф.

А поки що це все. Далі буде.

середа, 7 березня 2012 р.

Тиждень 2012.09.

Розглянемо основні теми попереднього тижня (27 лютого - 4 березня).

Всього було опрацьовано 5200 повідомлень із новин. Найвживанішими словами були:

Серед 30-ти перших слів є три прізвища: Янукович, Луценко і Тимошенко (що і не дивно). Поглянемо на загальний граф тижня.

Серед найбільших концепцій цього тижня можна назвати: "больше", "говорить", "дело", "должны", "может", "власть", "политический", "регион", "страна".

Найтіснішими тематичними циркуляціями тут були:

  • "регион" (-0.007) - "организация" (-0.004) - "партия" (-0.069) - "проводить" (-0.055);
  • "уголовный" (-0.196) - "Луценко" (-0.012) - "приговор" (-0.054) - "экс" (-0.172) - "Юрий" (-0.240) - "судебный" (+0.020);
  • "посада" (-0.028) - "державний" (+0.076) - "закон" (-0.001) - "служба" (+0.076) - "новий" (-0.011);
  • "Владимир" (-0.299) - "Путин" (-0.241) - "Россия" (+0.006) - "российский" (-0.286) - "газета" (+0.004).

Як бачимо, переважна більшість слів в основних темах мали негативне емоційне забарвлення.

Наостанок, витяги деяких цікавих частин графа.

На сьогодні це все. В мене є одна задумка спробувати замість окремих слів відбирати найвживаніші пари слів і з них формувати загальний граф. Взагалі-то це давно відомий прийом в технології обробки текстової інформації - використання бі-грам. Що з цього вийде - наступного разу.

Далі буде.

пʼятниця, 2 березня 2012 р.

Тиждень 2012.08.

Спочатку про нововведення. Тепер всі слова із власних назв (ті що були такими розпізнані алгоритмом) пишуться із великої букви. Я вирішив так зробити після того, як в попередніх графах я помітив, що слово "сир" означало власне сир, молочний продукт, і Сирію, країну. Щоб все таки відокремити ці кардинально різні теми і було введене виділення слів власних назв.

Що ж тепер подивимось, які тематичні течії переважали попереднього тижня.

Основними концепціями в цей тиждень були "вопрос", "страна", "Украина", "первый", "Україна", "люди". 

Як можна помітити, найголовнішими були такі теми:

  • "людська": "вопрос" (+0.454), "люди" (+0.062), "говорити" (+0.040), "думати" (+0.492), "сделать" (+0.043), "делать" (+0.138), "человек" (+0.381), "времена" (+0.045), "жизнь" (+0.485), "хорошо" (+0.373);
  • "політична російськомовна": "страна" (+0.301), "Украина" (+0.462), "первый" (+0.480), "власть" (+0.475), "выбор" (+0.044), "партия" (+0.055), "Россия" (-0.058), "год" (-0.027), "время" (+0.459), "кандидат" (+0.031), "Москва" (+0.062), "состав" (-0.078), "украинский" (+0.101), "российский" (+0.404), "газ" (-0.023), "газовый" (+0.019), "Европа" (+0.075);
  • "політична україномовна": "Україна" (+0.137), "питання" (+0.169), "політичний" (+0.118), "влада" (+0.292), "перший" (-0.011), "року" (+0.027), "країна" (+0.162), "український" (-0.065), "російський" (+0.039), "суд" (+0.015), "Європа" (+0.092);
  • "депутатська": "закон" (+0.018), "депутат" (+0.126), "народний" (+0.165), "парламент" (+0.209), "Верховна" (+0.036), "Рада" (+0.012), "фракція" (+0.073), "законопроект" (+0.040), "Литвин" (+0.405);
  • "Тимошенко": "Тимошенко" (+0.046), "врач" (-0.130), "состояние" (+0.177), "служба" (-0.077), "заява" (+0.023), "Луценко" (+0.042).

Поглянемо на деякі слова ближче.

Цікаво, що "Путин" (+0.059) міцно пов'язане із "тур" (+0.049), "второй" (+0.54), "мнение" (-0.096), "эксперт" (+0.022).

А "Ющенко" (-0.085) найбільш поєднане з "партія" (+0.055), "власний" (-0.106), "список" (0.0), "мав" (+0.051).

Єдина тема, де практично всі слова мають негативний зміст: "церква" (-0.326), "православна" (-0.206), "УПЦ" (-0.171), "МП" (-0.190), "церковний" (-0.299), "Священний" (-0.230), "Синод" (-0.209), "митрополит" (+0.029), "Володимир" (+0.081).

Це все щодо цього тижня. Далі буде.

середа, 22 лютого 2012 р.

Тиждень 2012.07.

Продовжимо наш огляд тижневих новиннєвих зрізів на політичну тематику. 7-ий тиждень (з 13 по 19 лютого).

Найвживанішими слова цього тижня були:

Всі вони представляють ті чи інші теми тижня. Пізніше, ми розглянемо їх детальніше. А зараз подивимось на основний граф тижня.

Як і минулого разу, були відібрані 300 слів із найбільшими TFIDF-значеннями, розмір слова відповідає його величині міжсловесної централізації (концепції), колір слів визначає його сентиментне забарвлення, а кольори зв'язків - скупчення слів в тематичні кластери. Як можна помітити, переважна кількість слів цього тижня має біля-нейтральне емоційне забарвлення.

Як і попереднього тижня, найбільшою за кількістю слів та щільністю є суспільно-економічна тематика, подана російською мовою. Сюди входить найбільша кількість яскраво виражених слів-концепцій. Це такі слова як: "вопрос" (-0.043), "думать" (+0.055), "страна" (+0.023), "первый" (+0.013), "говорить" (-0.020), "год" (-0.022), "сделать" (+0.086), "последний" (-0.238), "цель" (-0.043), "часть" (+0.010).

Другою за розміром є політична російськомовна тема. Тут основними концепціями є: "украина" (+0.010), "время" (-0.020), "дело" (-0.137), "президент" (-0.215), "украинский" (0.0), "российский" (-0.253), "государственный" (+0.086), "сообщить" (+0.008), "луценко" (+0.004), "прокурор" (-0.023).

Поглянемо детальніше на пару слів, які мають оточення з переважно негативним забарвленням. Наприклад, "луценко":

"луценко", "приступлюк" (-0.029), "суд" (+0.005), "прокурор", "дело", "обвинение" (-0.012), "приговор" (-0.038), "лишение" (+0.168), "имущество" (-0.171).

А ще "газ":

"газ" (-0.171), "россия" (-0.027), "российский", "цена" (-0.220), "газпром" (-0.167), "переговоры" (-0.014), "поставка" (-0.109), "европа" (+0.014).

 

Подальшим продовженням політичної теми є наступна - Тимошенко:

Основна послідовність тут: "тимошенко" (-0.004), "власенко" (-0.296), "врач" (+0.054), "иностранный" (+0.023), "обследование" (+0.097), "медицинский" (+0.024), "комиссия" (+0.010), "лечение" (-0.300).

Наступною і третьою за розміром є узагальнена україномовна тематика. Головними словами-концепціями в цій частині є такі як: "україна" (+0.072), "влада" (+0.041), "країна" (+0.071), "український" (+0.026), "російський" (-0.005), "міністр" (+0.071), "політик" (+0.030), "перший" (+0.033), "час" (+0.038), "рішення" (+0.015), "справа" (-0.037), "комісія" (+0.042), "лікар" (+0.058), "медичний" (+0.091), "обстеження" (+0.035).

І остання невелика тема, яка була окремо виділена попереднього тижня:

"забзалюк" (+0.147), "рыбаков" (+0.039), "депутатский" (-0.033), "депутат" (-0.109), "народный" (-0.258), "литвин" (-0.033), "группа" (+0.051), "расследование" (-0.001), "подкуп" (+0.013), "будут" (+0.155).

Оце і все, поки-що. Далі буде.

понеділок, 20 лютого 2012 р.

Тиждень 2012.06.

Перейдемо відразу до основного графу новин тижня (з 6-го по 12-те лютого).

В цьому тижневому зрізі представлено 250 слів із найбільшим значенням TF-IDF. Так ми відберемо слова основних новиннєвих тем. Зв'язки між словами поділені кольорами на класи цієї ж тематичної циркуляції слів. А розмір самих слів відповідає величині міжсловесної централізації. Таким чином ми зможемо побачити основні концепції, які є центральними для тих чи інших тем.

Отже, ми можемо виділити п'ять основних тем. Першу найбільшу, виділену червоними зв'язками між словами, можна описати як "соціально-економічну російськомовну" тематику. Основними концепціами тут є: "вопрос" (+0.008), "первый" (-0.055), "страна" (+0.015), "нужно" (+0.134), "думать" (-0.089), "год" (+0.179), "российский" (+0.020), "украинский" (+0.036), "выборы" (+0.019).

Друга тема має синій колір з'єднань слів і значною мірою пов'язана із попередньою. Її охарактеризуємо як "про-владну російськомовну". Тут перебувають такі слова, як "украина" (+0.044), "власть" (+0.052), "дело" (-0.005), "действие" (+0.020), "министр" (-0.060), "суд" (-0.136), "проект" (-0.200), "президент" (-0.020), "человек" (+0.016), "тимошенко" (-0.052).

Наступні дві теми є україномовним відзеркаленням попередніх двох. Перечислимо їх основнотворчі слова: "україна" (-0.001), "перший" (-0.047), "справа" (-0.001), "року" (+0.004), "міністр" (-0.001), "член" (-0.200), "питання" (-0.033), "проблема" (-0.040), "політичний" (+0.004), "країна" (-0.082), "політик" (+0.003), "вибори" (-0.082), "росія" (+0.013).

Остання тема особлива, яка з'явилась цього тижня. Найважливішими словами тут були: "забзалюк" (+0.180), "депутат" (-0.218), "сила" (-0.102), "народный" (+0.133), "фракция" (+0.167), "рада" (+0.145), "группа" (+0.009), "доллар" (-0.011).

Якщо поглянути ближче на слова, які з'являлись поряд із словом "забзалюк", отримаємо ще:

"переход" (+0.056), "рыбаков" (+0.112), "депутатский" (-0.229), "разговор" (+0.140), "расследование" (+0.049), "провокация" (+0.022). Хто слідкував за новинами, знає про що це.

На сьогодні це все. Про останній 7-ий тиждень розповім завтра-післязавтра. Далі буде.

неділя, 12 лютого 2012 р.

Тиждень 5.

Розглянемо політичний зріз останнього тижня (з 30 січня по 5 лютого). За цей період із новиннєвих джерел було отримано більше 5000 текстів. Перейдемо до основного графа.

Цього разу я трохи змінив спосіб відбору слів для кінцевої карти. Спочатку була порахована міжсловесна централізація кожного слова (betweeness centrality) в графі. За цією величиною в даному випадку відбираються слова, які містять концепції, виражені в графі. Було відібрано 200 найбільших слів-концепцій. Колір слова, як і раніше, позначає сентиментну складову. А колір вершин (і їх зв'язків) визначає модульність (об'єднаність) груп слів між собою, тобто, тематичні групи графа.

Як бачимо, найбільш щільною є група темно-жовтого кольору, в якій основними концепціями є "думать" (+0.046), "скажи" (-0.085), "дмитро" (+0.251), "віктор" (-0.236), "ситуація" (+0.174).

Другою за розміром є червона частина графу. Тут знаходяться здебільшо українські слова. Найбільш значимі серед них: "люди" (+0.119), "право" (+0.008), "давати" (+0.034), "хоче" (+0.201), "зробити" (-0.108), "янукович" (-0.067), "пиратский" (-0.127), "конституційний" (+0.035).

Наступна група теж є україномовною і здебільшо негативною. Основні з них: "україна" (-0.040), "перший" (-0.125), "влада" (-0.155), "питання" (+0.013), "політичний" (-0.020), "тимошенко" (-0.007).

Основна російськомовна частина в свою чергу позначена синіми зв'язками між вершинами. Головні концепції тут: "украина" (-0.022), "страна" (-0.038), "власть" (+0.021), "первый" (+0.018), "вопрос" (+0.233), "понимать" (-0.022), "человек" (-0.061), "должный" (-0.031).

Також можна відмітити невеличку відокремлену тематичну групу із словами "газ" (+0.168), "газпром" (+0.209), "поставка" (-0.023), "объем" (+0.008), "европа" (+0.037), "российский" (+0.247).

Є ще кілька невеликих розрізнених частин (наприклад, верхня частина із "температурою" і "морозом"), які кожен може дослідити самостійно.

На цей тиждень це все. Далі буде.

неділя, 5 лютого 2012 р.

Тижні 3 і 4.

Новини тепер завантажуються напряму із новиннєвих сайтів. Були вибрані наступні джерела:

  1. Сегодня.ua (рос.).
  2. УНІАН (рос./укр.).
  3. ЛІГА.Новини (рос./укр.).
  4. Finance.ua (рос./укр.).
  5. forUm (рос./укр.).
  6. Українська правда (рос./укр.).
  7. Корреспондент.net (рос./укр.).
  8. Фокус.ua (рос.).

Всі ці сайти дозволяють зкачувати новини за вказаною датою. Якщо можливо, беруться новини обома мовами. 

За ці два тижні (з 16 по 29 січня) було завантажено більше 8000 текстів новин на політичну тематику. Загальний граф має такий вигляд.

Відібрані слова зі зв'язками більше 0.5. Колір слова відповідає його семантичному забарвленню, а розмір слова - проміжна централізація. Це нове поняття взяте із аналізу графів, яке означає, як часто слово зустрічається при переміщенні по графу між двома випадковими словами. В цьому досліджені зокрема зазначається, що ця величина може слугувати для визначення головних концепцій тексту (або текстів в нашому випадку). Завдяки цій методиці ми можемо побачити, що основними концепціями за ці зва тижні були:

температура, розслідування, європейський, процесуальний, февраль, синоптик, президент.

Концепції поєднують основні теми, які визначені найбільшими скупченями графа.

1. Тема пов'язана із кримінальними ділами, причому українською мовою. Основні слова (за величиною TF-IDF) тут: "суд" (-0.225), "кримінальний" (-0.121), "документ" (+0.161), "кодекс" (+0.073), "прокурор" (+0.009), "останній" (+0.145), "рішення" (-0.074), "справа" (-0.180).

2. Невелика тема діяльності прем'єр-міністра: "голова" (-0.244), "азаров" (-0.022), "преса" (+0.068), "протокол" (+0.064), "градус" (-0.019), "державний" (-0.09), "концепція" (-0.102).

3. Суміш різних невеликих тем українською і російською мовами з переважно позитивним забарвленням. Найвживаніші слова тут: "система" (+0.267), "премьер" (+0.071), "синоптик" (+0.185), "батькивщина" (+0.158), "цена" (+0.089), "загальний" (-0.200), "бывший" (-0.030), "компанія" (-0.055), "февраль" (-0.022). 

4. "Президентська" тема. Головні слова в цій частині: "президент" (+0.052), "возможный" (+0.247), "социальный" (+0.281), "верховна" (+0.292), "рада" (+0.382), "нафта" (-0.349), "вартість" (-0.339), "стратегический" (+0.065), "альтернативний" (+0.192).

5. В цій частині зібрано багато імен та дієслів. Наприклад: "говорить" (+0.118), "знает" (+0.012), "простий" (+0.055), "понимать" (+0.009), "думать" (+0.248), "хотел" (+0.390), "леонід" (-0.153), "леонид" (+0.526), "сергій" (+0.080), "георгій" (-0.152), "дмитро" (+0.244).

6. Ще одна невеличка "погодна" тема, пов'язана із заморозками і переважно негативного емоційного забарвлення. "Температура" (-0.105), "днем" (+0.033), "ночью" (+0.057), "север" (-0.094), "ветер" (-0.021), "восточный" (-0.085), "облачно" (+0.083), "гололед" (-0.007), "снег" (-0.014), "прояснение" (+0.115).

На стогодні це все. Далі буде.

вівторок, 31 січня 2012 р.

Труднощі пошуку.

Сьогодні не буде огляду чергового тижня, а будуть деякі міркування.

Після активного використання пошуку в Google та спроби здійснення такого ж автоматизованого пошуку в Yandex виявилось, що ці пошукові системи не вітають такий спосіб оформлення пошукових запитів і через деякий час починають їх блокувати. Це робить неможливим закачування великої кількості текстів за ту чи іншу дату (що є необхідним для мене в даному випадку). Тому для своїх цілей доведеться повертатись до попередньої практики відбору кількох великих новиннєвих сайтів із можливістю перегляду новин по даті, написання для них захоплювачів текстів і елементарного пошуку по текстам за вказаним запитом.

Крім того в планах є також отримання текстів постів із однієї або кількох соц. мереж (наприклад, вже зараз це просто зробити для Живого Журналу), по яким найкраще оцінювати відношення людей (через сентиментний аналіз) до тих чи інших подій або осіб.

Плани великі, а що з того вийде - побачимо.)

Далі буде.

понеділок, 23 січня 2012 р.

2012 рік. Тиждень №2.

Поглянемо, які теми були найважливішими для українського медіапростору другого тижня року (09-15 січня). За цей тиждень із новиннєвих сайтів вдалося отримати лише 125 текстів. Можливо, все ще дається взнаки період різдвяних свят.

Перейдемо відразу до основного графа.

Цього разу граф трохи більше скупчений, ніж в перший тиждень. Тобто, цього тижня теми новин частіше повторювались в ЗМІ і є більш вираженими. Тут можна помітити такі підграфи.

"Политик(а)-Первый-Украина".

З назви зрозуміло, що ця частина описує загально-політичні новини. Найбільш популярними тут були слова "политик(а)" (-0.231), "первый" (-0.242) і "украина" (+0.058), а також "время" (+0.133), "страна" (+0.27), "год" (+0.163), "часть" (-0.439) тощо. Вгорі зліва виділяється частина, яку можна охарактеризувати словами: "экономика" (+0.144), "евро" (-0.409), "финансовый" (-0.369), "торговля" (-0.043), "правительство" (+0.163) і "2012 год" (-0.114).

"Газ-Цена-Грн".

Сегмент графа, який пов'язаний із газом став значно більшим ніж попереднього тижня, фіксуючу збільшення інтересу ЗМІ до цієї теми. Основні слова тут "газ" (+0.163), "цена" (+0.005), "одна" (+0.057), "поставка" (-0.503), "снижение" (-0.009), "грн" (+0.68), "соглашение" (+0.225), "договор" (-0.108), "донецк" (+0.588), "получить" (+0.163), "регион" (-0.231).

"Образование-Государственный".

Цю частину графа можна охарактеризувати, як освітньо-професійну. Тут вживаються такі слова: "образование" (+0.528), "высший" (+0.316), "качество" (+0.163), "министр" (+0.144), "государственный" (-0.083), "служат" (+0.36), "профессиональный" (+0.429), "оплата" (+0.061), "труд" (+0.069), "специалист" (+0.212).

"Законопроект-Президент".

В цьому сегменті зібрана україномовна частина новин. Як і раніше, через здебільшо офіційні повідомлення, вона виглядає найпозитивнішою. Найвживанішими словами тут є: "законопроект" (+0.543), "документ" (+0.175), "президент" (+0.473), "україна" (+0.375), "внесення" (+0.163), "бюджетний" (-0.222), "система" (+0.06).

Ось це основні напрямки новин, якими був багатий другий тиждень року. Хоча, наприклад, можна виділити ще такий невеликий, але цікавий ланцюжок слів:

"харьковский" (-0.423), "добкин" (+0.089), "аваков" (+0.004), "салтовский" (+0.102), "хлебозавод" (+0.109), "восторг" (-0.669). Тут мова йде про ініціювання місцевою харківською владою (М.Добкін) кримінальної справи проти екс-губернатора Харківщини (А.Аваков) і розпродаж останнім своїх часток бізнесу в Салтівському хлібокомбінаті та супермаркеті "Восторг".

Наразі це все. Далі буде.

четвер, 12 січня 2012 р.

Перший тиждень нового року.

В перші дні 2012 року через пошук вдалося отримати лише 86 текстів, пов'язаних із політикою. Далися взнаки вихідні дні, у які ЗМІ працювали вяло або не працювали взагалі. З цих текстів було виділено 375 слів, основний граф яких подано нижче.

Як бачимо, граф зосереджений навколо центральної частини, яку ми назвемо "Власть-Возможный".

Слова в цій частині густо переплетені між собою. Найбільш популярними тут є: "власть" (+0.071), "действие" (-0.024), "возможный" (+0.031), "большой" (+0.085), "первый" (-0.012), "выборы" (+0.676), "страна" (-0.722), "украина" (+0.763).

Всі відгалуження від основної частини є досить куцими.

В цьому окремо стоячому сегменті йдеться про "запас" (+0.025), "урожай" (-0.004), "пшеница" (-0.029), "кукурудза" (+0.08), "ячмень" (+0.002), "млн" (+0.071) і "тон" (-0.008).

В цій частині графа найвживанішими словами тут є "работа" (-0.764), "компания" (-0.765), "бизнес" (+0.032), "информация" (+0.001), "деятельность" (+0.002).

В цьому невеличкому скупченні поєднані такі слова, як "европа" (-0.631), "европейский" (+0.011), "государство" (-0.001), "подготовка" (+0.008), "коммерческий" (+0.116), "национальный" (-0.045).

Отже, як висновок зазначимо, що першого тижня цього нового (і політичного також) року в ЗМІ восновному висвітлювались теми про владу, вибори, нові можливості, врожай, роботу, бізнес і Європу. Побачимо, чим багатими будуть наступні тижні.

Далі буде.