Webinary

Big data i AI w badaniach mediów. Marcin Niemczyk: Na razie nie jest to takie łatwe

– Badania mediowe od lat rządzą się swoimi prawami, opracowanymi przez międzynarodowe instytucje. Tymczasem rynek zasypywany jest narzędziami, które próbują wyrwać kawałek tego obszaru i przekonać firmy mediowe, że przy pomocy modelowania danych, można osiągnąć ciekawe efekty. Na razie nie jest to jednak takie łatwe – mówił Marcin Niemczyk z Polskich Badań Internetu podczas grudniowej sesji Akceleratora Innovatorium.

– Po co robi się badania mediowe? – pytał retorycznie Marcin Niemczyk. – Bo media bez użytkowników nie istnieją, a badania są jedynym sposobem, by potwierdzić, że konkretny podmiot ma obserwatorów. Pomiary dodatkowo mają sprawdzić, ile i jakich osób korzysta z danego medium. – Ostatecznie bowiem modelem biznesowym jest sprzedaż kontaktów tych osób z reklamą – podsumował Niemczyk.

Punktem odniesienia w badaniach statystycznych są dane GUS. Niemczyk przypomniał, że jeśli bada się preferencje polityczne, to trzeba wiedzieć, jaka jest struktura populacji i losowo dobrać ludzi do próby, by nie była skrzywiona. – W przypadku mediów każde badanie musi też mieć badanie założycielskie, które określi, ile osób korzysta z danego medium. Tylko wtedy, modelując dane, mamy punkt odniesienia. Ponadto jesteśmy w stanie stwierdzić, jakie cechy społeczno-demograficzne decydują o tym, jak media są konsumowane.

Poza punktem odniesienia, kolejny problem, na który można napotkać, próbując modelować dane o konsumpcji mediów, jest taki, że rozkłady intensywności korzystania z mediów są inne niż rozkłady populacyjne. Starsi oglądają telewizję, młodzi korzystają z internetu.

Nośniki reklamy w mediach

Według badania Publicis, które zaprezentował Marcin Niemczyk, telewizja i internet zdecydowanie wybijają się na runku nośników reklamowych, zajmując praktycznie jego połowę. Dalej znajduje się radio, outdoor, magazyny, dzienniki  i kino.

Czy można z nich zbierać jakieś dane i modelować? Jeśli nie teraz, to w przyszłości? Tak, ale w bardzo różnym stopniu. Niemczyk podaje kino jako przykład małego rynku nośników reklamy. Dane (np. sprzedaż internetowa biletów, aplikacje, paragony/karty, raport biletera) nie są specjalnie modelowane, ale może właśnie tu jest pole do popisu dla AI. Na razie nie jest wykorzystywane – podkreślił Niemczyk.

W przypadku magazynów i dzienników można zebrać danedotyczące punktów sprzedaży, paragonów/kart, raportu kioskarza, ale… Obszar badań reklamy prasowej zmienił się ogromnie. – Kiedyś zmiany w planowaniu kampanii oparte były na czytelnictwie i ogólnych wynikach dla prasy, dziś opierają się o badania zauważalności reklamy i wyniki dla reklamy – podkreślił Niemczyk. – Nowe wskaźniki badania reklamy to: zauważalność, koncentracja uwagi, skupienie (łączny czas spędzony na reklamie), intensywność kampanii. Ciekawych danych dostarczają np. badania eyetrackingowe, mówiące, jak mózg reaguje na to, co widzimy. Wynika z nich, że średni czas kontaktu z reklamą to 630 ms czyli 0,65 sekundy!

W przypadku outdooru, jak  twierdzi Niemczyk, AI mogłaby zbierać i analizować dane, dotyczące np. lokalizacji nośników, rozmiaru, czy natężenia ruchu przy nośniku. Z kolei w przypadku radia danych nadających się do modelowania raczej nie ma.

Jak można zbierać dane z telewizji? Pewnego rodzaju informacją, choć obarczoną dużym błędem, bylibypłacący abonament. Ponadto dane mogą pochodzić z dekoderów kablówek czy telewizorów Hbb, dekoderów satelitarnych i aplikacji, które raportują co jest oglądane. Danych jest dużo, ale problemem jest to, że nie dotycząc całej  populacji.

W przypadku telewizji, z big data eksperymentuje Nielsen. Ale pamiętać należy, że big data ma zalety. I wady – jeśli firmy nie traktują ich odpowiedzialnie. Kluczowe jest podejście do badań.  Wg Niemczyka big data jako samodzielny zasób nie nadaje się do pełnego zrozumienia dynamiki widowni, bo niektóre grupy mogą być niedoreprezentowane lub nadreprezentowane na poziomie technicznym.

I wreszcie inernet.Wykorzystuje ogromne dane: z serwerów, dane dla odsłon zmierzonych skryptami, ruch mierzony pojemnością danych. Ale – jak mówi Niemczyk –  cookie to nie człowiek. I to jest w tych badaniach największy problem. – Wydawca widzi przeglądarkę, która odpytuje o treść, ale nie widzi kto jest za przeglądarką.

Jak więc zbadać internet? Przede wszystkim trzeba mieć panelistów PC – cookie i software. – Internautom emituje się ankietę. Jeśli ją wypełnią, stają się cookiepanelistami, a cookie dostaje cechy demograficzne. Po zainstalowaniu netPanelu można raportować. Jeśli robi się to w sposób ciągły, zachowania panelisty nie odstają od populacji, to wchodzi on do próby badawczej – tłumaczył Niemczyk. Ale, podkreślał, panel zrekrutowany online nie jest reprezentatywny. Nie odzwierciedla struktury demograficznej w populacji internautów czy proporcji pomiędzy liczbą użytkowników na witrynach.

Naturalnie mamy coraz więcej narzędzi i metod badania internetu, ale wniosek końcowy jest niezmiennie taki, jak i postawiona na początku teza: media mierzone są nadal trochę tradycyjnie, wychodząc od badań społecznych, rozwijanych jeszcze w XX wieku. Dlaczego? Odpowiedź jest dość prosta. – Potrzeby klientów tych badań mówią o tym, że chcą oni mieć pełny obraz rynku, rozumianego jako rynek mieszkańców Polski – wyjaśnił Niemczyk.

Według niego, bez tej wiedzy nie da się zrobić modelowania, które spełni wspomniane wyżej potrzeby. Jednocześnie trudno nie zauważyć, że ogromna wiedza leży po stronie badań zbieranych w internecie i w telewizji.  – Modelowanie danych technicznych z telewizji to chyba największy trend na najbliższe lata. Także w outdoorze – przekonywał Marcin Niemczyk.

W wielkich platformach same dane nie wystarczą, ale są bezcenną dawką wiedzy, jeśli chodzi o poprawianie danych badawczych i modelowanie ich – podsumował. 

Marcin Niemczyk, Polskie Badania Internetu

Wykład wygłoszony podczas grudniowej sesji Akceleratora Innovatorium

Podobne artykuły:

Herb Polski
Flaga Polski

Dofinansowanie ze środków Ministra Edukacji i Nauki w ramach programu Społeczna Odpowiedzialność Nauki – Popularyzacja nauki i promocja sportu. Projekt: Akcelerator

DOFINANSOWANIE: 900 000 ZŁ
CAŁKOWITA WARTOŚĆ: 1 020 000,00 ZŁ