fbpx

Як часто ви помічали, що сьогодні всі обговорюють певну історію, а вже завтра про неї забувають і переключаються на щось інше? Як часто ви дивувалися, чому всі обговорюють саме цю подію, адже є важливіші? У цьому матеріалі ми аналізуємо інформаційне поле березня 2021-го та з’ясовуємо, які події стають хайповими та скільки тривають окремі інформаційні приводи.

Як ми шукали інфоприводи?

Під інфоприводами ми маємо на увазі подію чи декілька пов’язаних подій, які мали значне висвітлення у ЗМІ, — наприклад, акції на підтримку Стерненка чи перекриття Суецького каналу. Також інфоприводом може бути підтема великої теми — наприклад, «ситуація в Криму» в темі «політика», «побічні реакції на вакцини» в темі «коронавірус».

Для аналізу ми взяли новини 42 популярних українських медіа за березень (162 тис. 382 новини). Матеріали класифікували на 15 тем. Першою п’ятіркою тем за кількістю новин виявилися політика, інциденти, коронавірус, економіка та шоубізнес. Саме серед цих топтем ми й шукали інфоприводи, попередньо замінивши «шоубізнес» темою «світ», яка йде наступною за кількістю новин і для нас є цікавішою.

На новинах цих тем запустили алгоритм LDA, який розділив кожну тему на 40 топіків-інфоприводів[1] (тобто загалом 200 інфоприводів). Серед цих 200 інфоприводів ми відібрали по три в кожній «великій» темі (тобто загалом 15) для детального дослідження (рис. 1). Критерії відбору інфоприводів були такі:

1)     кількість новин у певному інфоприводі;

2) важливість цього інфоприводу визначена експертною думкою команди DataVox. Наприклад, у підтемі «курс гривні» було дуже багато новин — адже новини на цю тему щоденно публікує велика кількість сайтів. Проте рух курсу в один чи інший бік на кілька копійок не є цікавою темою для аналізу.

Рисунок 1. Кількість новин у виділених інфоприводах у кожній із п’яти тем

Джерело: власні розрахунки. Примітка: розмір бульбашки пропорційний кількості новин у певному інфоприводі

Протягом місяця новини інфоприводу могли лише час від часу з’являтися в інфополі, а могли перебувати в полі зору ЗМІ переважну частину місяця. Тому для аналізу тривалості інфоприводу ми взяли лише пікові проміжки часу, тобто ті дні, коли до теми була підвищена увага ЗМІ. Ці проміжки ми визначили за допомогою ковзного середнього кількості новин інфоприводу за 12 годин (докладніше — в методології наприкінці статті).

Топсімка інфоприводів за кількістю новин

Тема коронавірусу не перестає бути актуальною. В березні значна увага була прикута до щеплень вакциною Astrazeneca, коли з’явилася велика кількість новин про побічні реакції на неї та призупинення / відновлення вакцинації в різних країнах.

Докладніше про побічні реакції на вакцини читайте в поясненні від VoxCheck.

Цей інфопривід був у фокусі уваги безперервно протягом десяти днів, з 11 по 21 березня. У цей період новини про нього склали 1,31% всіх новин у 42 досліджених ЗМІ.

Найбільше у висвітленні цього інфоприводу брало учать «НВ» — 63 новини протягом березня стосувалися вакцинації (рис. 2). Також багато писали про нього «РБК-Україна» (55) та «Укрінформ» (46). Не цікавила ця тема видання «Znaj.ua», «Politeka» та «Факти» (лише від 0 до 3 новин)*.

Ситуації в Криму ЗМІ також приділяють багато уваги. Протягом березня писали про арешт журналіста «Радіо Свобода» в Криму, санкції, накладені на Росію через анексію, Кримську платформу, указ Путіна про заборону володіння землею українцям у Криму, водну блокаду, сім років «референдуму» та загалом про окупацію / деокупацію. Обговорення таких тем триває доволі довго — чотири із семи періодів підвищеної уваги до ситуації в Криму тривали від 3 до 6 днів. Під час такої «пікової» уваги до теми Криму ЗМІ присвячували їй в середньому 0,67% своїх новин.

Найбільше про Крим писали «Укрінформ» — 66 новин за місяць, 24 канал та Obozrevatel — по 60. Найменша* кількість матеріалів про Крим була у стрічках «Znaj.ua», «Голос» та «Вголос» — від 2 до 4.

Санкції проти Медведчука ставали топтемою політичних новин сім разів, переважно на 1-2 дні. Частка інфоприводу серед усіх новин під час пікових періодів коливалася від 0,55% до 1,26%.

Найбільше у березні писали про цю тему, зрозуміло, ЗМІ, пов’язані з Медведчуком: «112.ua» (81 новина) та ZIK (89). Замикають трійку 24 канал та «НВ», яке писало про санкції у 49 новинах. Найменше* ця тема цікавила «Znaj.ua», «Вголос» та «Факти» ICTV (по 2 новини).

До категорії «інциденти», як і до «політики», потрапили новини, пов’язані з акцією за Стерненка 20 березня. Це переважно матеріали про затримання учасників акції, визначення їм запобіжних заходів, інші новини із судів і т. п. Відповідно до нашого класифікатора, такі новини потрапляють саме до категорії «інцидентів». До «політики» ж алгоритм відніс переважно коментарі політиків про акцію, новини про позачергове засідання Ради, присвячене протесту, двері у студії «1+1», відмивання та ремонт Офісу президента. Категорії у класифікаторі не перетинаються, тобто одна новина не могла бути одночасно в «інцидентах» та «політиці».

Інфопривід з «інцидентів» мав тільки один пік, який тривав понад 6 днів. При цьому він зайняв у інфополі одну з найбільших часток — 1,81% усіх новин.

Найчастіше ця тема траплялася в «НВ» — 42 їхніх новини за місяць стосувалися акції 20 березня. По 39 новин про неї розмістили «Букви» та УНІАН. Максимально оминали* тему Politeka, «Znaj.ua» та «Вголос» (від 0 до 3 новин).

Серед політичних новин акція за Стерненка отримала три “хвилі” уваги, які тривали від 1,4 до 3,6 днів. Перший із них почався в день основної події інфоприводу — протесту 20 березня, через приблизно пів години після оголошення про завершення акції, і закінчився 24 березня. Під час цього піку 2,12% усіх новин стосувалися цієї теми (це найбільший показник із 15 розглянутих інфоприводів). Під час другого піку не можна виділити центральну подію, однак близько 25% новин інфоприводу займало обговорення перформансу з дверима на «1+1». Центральною подією третього сплеску цікавості до цієї теми було позачергове засідання парламенту для засудження протестів.

До топтрійки медіа, які найчастіше брали участь у висвітленні акції 20 березня, входять 24 канал (43 новини за місяць), «Гордон» (39) та «Цензор.нет» (38). Politeka взагалі не поширювала новини про цей інфопривід, на сайті «Вголос» відповідних статей було дві, а на «Znaj.ua» — 3*.

Тема тарифів мала найбільшу кількість піків — 8, які в середньому тривали по 1,5 дні. Новини переважно стосувалися ціни на газ за березень і квітень, річного тарифу на газ, продовження терміну встановлення газових лічильників, тарифу на електроенергію, боргів та ін. Максимально ця тема займала 1,07% в новинному інфополі.

Серед окремих медіа найбільше уваги тарифам приділили «Главком» та Obozrevatel (по 48 новин протягом березня), а також «Українські новини» (43). Найменше* — «Українська правда» — 0 матеріалів (ймовірно, через наявність дочірнього профільного медіа — «Економічної правди»), «Букви» (3) та «Zaxid.net» (4).

Тема ДТП з українцями в Польщі 5 березня при єдиному піку зберігалася в інфополі 5 днів, а частка новин про неї в цей період становила 2,01%.

Новини про цей інфопривід найчастіше у березні публікували 24 канал та «Gazeta.ua» (по 40) і «НВ» (34). Найрідше* це робили «Бабель», «Факти» і «Фокус» — від 1 до 3 новин.

Решта 8 інфоприводів мають малу кількість новин для аналізу в розрізі медіа.

Рисунок 2. Топдесятка медіа за кількістю новин про топсімку інфоприводів

Джерело: власні розрахунки. * До порівняння в цьому розділі не потрапили «Економічна правда» та Суспільне, оскільки перше медіа має економічний профіль та практично не пише на інші теми, а в Суспільного до зібраних із сайта матеріалів потрапляють новини регіональних філій — це спотворює порівняння

Наскільки інфоприводи заповнюють інфополе в періоди пікових значень?

В середньому інфопривід протягом «злету» заповнює 0,87% інфополя (рис. 3). Найбільшу увагу ЗМІ привернув один із піків акції за Стерненка (2,12% усіх новин за період злету). Найменший пік, із протестів у М’янмі, заповнив 0,27%.

Рисунок 3. Максимальні та середні частки новин інфоприводів серед усіх новин розглянутих ЗМІ під час пікових періодів

Джерело: власні розрахунки. Примітка: новини про блокування Суецього каналу, як і акція за Стерненка, могли потрапити до двох категорій – або “економіки”, або “світу”. До першої потрапили новини про вплив події на світову економіку, до другої — загальні новини про ситуацію в каналі.

Тривалість життя інфоприводів

Як довго проаналізовані інфоприводи «живуть» у ЗМІ? Розгляньмо тривалість пікових періодів (рис. 4-5).

Рисунок 4. Пікові періоди інфоприводів на часовій осі

Отже найдовший пік тривав 9,6 днів — у темі «призупинення та відновлення щеплення вакциною Astrazeneca», найкоротший — 0,2 дні, у справи Шеремета-Антоненка.

В середньому (медіана) ЗМІ приділяють інфоприводу 1,4 дні. Лише третина “сплесків” уваги до інфоприводів тривали понад 2 дні.

Рисунок 5. Розподіл піків інфоприводів за тривалістю

Агреговані дані для статті можна подивитися за посиланням.

Висновки

1. Із п’яти найпопулярніших категорій новин ми виділили по три найбільш популярні та цікаві інфоприводи й детально розглянули ці 15 інфоприводів (подій чи вузьких тем). Загальна кількість новин у інфоприводах становить 7602, тобто 4,7% із 162 382 “березневих” новин.

2. Для інфоприводів характерні пікові періоди, під час яких кількість присвячених їм новин значно зростає. Піків може бути декілька для одного інфоприводу. В середньому під час підвищеної уваги до інфоприводу медіа присвячують йому 0,87% новин.

3. Із розглянутих інфоприводів найвищий “пік” був у акції протесту за Стерненка – онлайн-ЗМІ присвятили цій події 2,12% новин. Найменш помітною була хвиля новин про протести у М’янмі — лише 0,27% новин.

4. Медіанна тривалість сплеску уваги до інфоприводу — 1,4 дні. Лише третина інфоприводів користуються підвищеною увагою медіа довше двох днів. Найдовше тривав пік теми про призупинення/відновлення вакцинації Astrazenec’ою” — 9,6 днів. Найкоротший сплеск уваги ЗМІ був у справи Шеремета-Антоненка — 0,2 дня.

5. Далеко не всі медіа вважають “хайповими” одні й ті самі теми. Наприклад, Politeka, Znaj.ua чи ZIK опублікували про найпопулярніший інфопривід за місяць — акцію за Стерненка — до трьох новин, тоді як на 24 каналі, Гордоні чи Цензор.НЕТ таких новин було близько 40. Можливо, це пов’язано зі спеціалізацією медіа – оскільки ми розглядали лише суспільно-політичні теми, природно, що про них більше писали ЗМІ, які можна назвати суспільно-політичними. Водночас можна припустити, що люди, які дізнаються більшість новин, наприклад, із сайту Znaj.ua, практично не отримують інформації про важливі новини з життя країни. Це свідчить про значну фрагментованість українського медіаполя.

Методологія

Для дослідження ми сформували список українських онлайн-медіа, взявши за основу відкриті рейтинги Інтернет-асоціації України, Gemius, Kantar, дані Similar web, дослідження USAID-Internews, моніторингів Інституту масової інформації та «Детектора медіа».

Ми додаємо медіа до моніторингу, враховуючи такі фактори: позиція медіа в рейтингах та дослідженнях, наведених вище; технічні можливості збору даних; оцінки релевантності медіа від редакційної колегії та нас як дослідників.

Було відібрано 42 популярних українських ЗМІ.

Усі новини за березень ми класифікували на 15 тем. Докладніше про алгоритм класифікації читайте в одній із попередніх статей.

Новини п’яти тем (політика, інциденти, коронавірус, економіка та світ («шоубізнес» стоїть вище «світу» за кількістю новин, проте для нас він не дуже цікавий) для української та російської мов було розбито на 40 топіків за допомогою алгоритму LDA. Після цього ми виокремили серед 40 топіків 15 інфоприводів, які нас найбільше цікавлять, та вручну звели результати для двох мов між собою. При відборі інфоприводів для аналізу ми враховували кількість новин інфоприводу та його важливість.

Новини у виділених топіках ми відфільтрували від тих, які не стосувалися інфоприводу, але яких було багато (наприклад, в інфопривід про допомогу ФОПам потрапило багато новин про тарифи Укрпошти — ми видалили їх із масиву). За особливістю роботи LDA до одного топіку могли потрапити кілька інфоприводів — тому ми позбулися зайвих.

Щоб знайти пікові періоди інфоприводу, ми використали ковзне середнє. Спершу відсортували новини інфоприводу за часом. Далі для кожної новини порахували кількість новин цього інфоприводу за 12 годин до цієї новини (таблиця 1, стовпчик “кількість новин”). Після цього розрахували ковзне середнє — для кожної новини визначили середнє значення поля “кількість новин” за попередні 12 годин (стовпчик “ковзне середнє”). 

Мінімальна кількість новин, яка мала бути у 12-годинному вікні для показника “кількість новин”  — 4, інакше значення поля дорівнювало NaN (тобто у цій ситуації — нулю, але такі значення відкидалися при розрахунку середньоарифметичного). У випадку з “ковзним середнім” за 12-годинний період мало бути щонайменше 4 новини зі значенням “кількість новин” не NaN.

Ми використали метод ковзного середнього, щоб згладити розподіл новин інфоприводу на часовій осі.

Таблиця 1. Приклад для пояснення середнього ковзного

Значення ковзного середнього, грубо кажучи, показують ту кількість новин, яку медіа публікували би за 12-годинний проміжок, якби робили це рівномірно. 

Не враховувалися часові злети інфоприводу, якщо максимальне значення ковзного середнього в них не перевищувало середнє значення протягом місяцяковзного середнього у інфоприводу. В інфоприводу акції за Стерненка в категорії «політика» один пік був розбитий на два, оскільки в період близько двох днів спостерігалися достатньо малі значення (нижче 30% від середнього значення ковзного середнього в інфоприводі) для врахування в аналізі. Тому цей проміжок часу був видалений.

12-годинний проміжок був вибраний після тестування різних значень: при менших проміжках утворювалося багато піків, хоча між ними був невеликий часовий проміжок, а при більших — навпаки, піки могли об’єднуватися, хоча між ними був великий часовий проміжок. Тому ми вирішили обрати пів доби для ковзного середнього. З точки зору загального розуміння це можна пояснити так: 12-годинний проміжок охоплює робочий один день. А якщо певна подія трапилася ввечері й про неї продовжили писати наступного ранку (тобто після перерви на ніч) – це буде продовження тієї самої інформаційної хвилі, а не початок наступної. 

___

[1] У кожній із решти десяти тем алгоритм також міг би виділити по 40 інфоприводів.

Джерело

COVID-19 Live