Geglücktes Google-DNI-Projekt bei 24sata: „Ein historischer Moment, auch für die STYRIA!“

In Zagreb passiert gerade ein Stück STYRIA-Zukunft: Zusammen mit dem Styria.AI Data Science Team von Trikoder und der Unterstützung von Styria Digital Development hat es die kroatische STYRIA-Marke 24sata jüngst geschafft, mit ihrem Google-Digital-News-Initiative-Projekt live zu gehen, im ersten Schritt auf der Mobilvariante. Hrvoje Dorešić (24sata) und Dominik Šafarić (Styria.AI) erzählen, was hinter der Idee steckt, Inhalte auf der Website für jeden User personalisiert anzuzeigen - durch einen Algorithmus.

VON PHILIPP LACKNER

Worum geht es bei eurem Google-DNI-Projekt - kurz umrissen?
Dominik Šafarić: Unser Data-Science-Team in Zagreb hat dafür drei Innovationen auf Machine-Learining-Basis entwickelt: Die erste ist die Tag-Optimierung. Sie ermöglicht einen standardisierten und optimierten Content-Tagging-Prozess für all diejenigen, die digitale Medieninhalte produzieren. Die Plattform bietet Journalisten automatisch Tags an, die am besten zum jeweiligen Thema passen. Das wird sowohl das Tagging als auch die Suche nach den gewünschten Inhalten erheblich vereinfachen. Die „Contextual Rocommendation“, also das kontextbezogene Empfehlungssystem, ist die nächste Innovation: sie empfiehlt Journalisten ähnliche Inhalte auf der Grundlage des Contents, den sie gerade erstellen. Und die dritte Innovation ist die Personalisierung von Inhalten: Sie passt Content entsprechend den Nutzerinteressen sowie dem Verhalten der User auf der Plattform selbst an.

Hrvoje Dorešić: Eine durch Machine Learning personalisierte Homepage für User zu erstellen, ist etwas, mit dem wir seit 2015 bei 24sata experimentieren. Wir haben festgestellt, dass es dabei Einiges an Potenzial gibt. Dann haben wir uns damit bei Google beworben - und wurden gefördert! Es war ein ziemlicher Aufwand, ein ganzes System aufzubauen, das im Wesentlichen darin besteht, Daten von den Nutzern zu erhalten, mit diesen Daten ein Netzwerk zu trainieren und Inhalte jedes Mal so personalisiert auszuspielen, wenn ein Nutzer auf unserer Homepage landet.

 

Fokussierung auf Personalisierung - was ist euer langfristiges Ziel?
Dorešić: Nutzer auf unserer Website für sie relevante Inhalte finden zu lassen und sie zu binden. Unsere Hauptaufgabe ist es, die User über aktuelle Dinge auf dem Laufenden zu halten, über die sie Bescheid wissen sollten. Und die Personalisierung hilft den Menschen, Artikel zu finden, die sie interessieren, mit speziellem und maßgeschneidertem Content.

 

Ihr seid vor ein paar Wochen damit live gegangen. Wie sieht der Status derzeit aus?
Dorešić: Im Moment sieht man zunächst fünf Artikel auf der mobilen Version der 24sata-Website, die von Redakteuren platziert wurden. Darunter zehn von der Maschine, der Rest statt wieder von der manuellen Eingabe. Wir beginnen hier klein, um die Conversions zu diesen Artikeln zu messen. Wir werden im Jahr 2020 alle Plattformen von 24sata, also mobile, Desktop und App, relaunchen. Alle werden personalisierte Homepages und einen personalisierten Feed unter der Artikelebene haben. Wir haben also noch etwas Zeit, um den Algorithmus so funktionieren zu lassen, wie wir es wollen. Es geht jetzt darum, noch bessere Ergebnisse damit zu erzielen, damit wir ihn schließlich auf der neuen Website implementieren können.

 

Wie gehen eure Journalisten mit dem Thema um?
Dorešić: Wir haben uns natürlich intensiv darüber ausgetauscht und ich muss gestehen: Ja, es ist ein kontroverses Thema. Aber Maschinen müssen noch sehr, sehr viel lernen, um besser zu arbeiten, als unsere Redakteure. Es gibt so viele Elemente, die einen Einfluss darauf haben, wie man Artikel kuratiert. Das Endergebnis unseres Projekts sind sicher eine bessere User-Experience und mehr Zeitressourcen für Redakteure, um guten Journalismus zu betreiben.

 

Welche Herausforderungen gab es technisch?
Šafarić: Die grundlegende Challenge bestand darin, eine Art von Machine Learning zu entwickeln, die genaue Empfehlungen erzeugt: Keyword-, Kontext- und personalisierte Artikelempfehlungen. Wie soll die Modellarchitektur aussehen? Wie trainiert man das Netzwerk? Wie bewertet man, ob Empfehlungen richtig sind oder nicht? Das galt es zu meistern. Aus technischer Sicht mussten wir Systeme entwickeln, die zu Höchstleistungen fähig, hochskalierbar und fehlertolerant sind.


Mit welchem Output?
Šafarić: Das Ergebnis ist, dass die Systeme monatlich rund 800 Millionen Clickstream-Ereignisse verarbeiten und dem Benutzer personalisierte Artikelempfehlungen in durchschnittlich 60 Millisekunden zur Verfügung stellen.

 

Gibt es Pläne, das Projekt für andere STYRIA-Marken zu nutzen? 
Dorešić: Wenn das gut funktioniert, bin ich sicher, dass andere Marken diese Technologie nutzen können. Sie gehört uns. 

 

Ist sie denn einzigartig?
Dorešić: Wir verwenden die gleiche Art von Technologie, die schon bei Netflix, YouTube oder anderen läuft. Aber wir haben einen anderen Ansatz gewählt. Für uns ist das erste Mal, dass wir den Kreis schließen konnten: Von der Datenbeschaffung, Erstellung eines Personalisierungsmodells, ihres Trainings bis hin zur Produktion für den Nutzer. Und es ist definitiv das erste Mal in der Region, dass jemand mit personalisierten Homepages arbeitet. Dies ist ein historischer Moment, auch für STYRIA. Ich bin sicher, dass Data Sciene und Machine Learning eine wesentliche Rolle im Journalismus spielen und in den kommenden Jahren an Bedeutung gewinnen werden. 

 

Letzte Frage: Wie fühlt Ihr euch, jetzt, nachdem schon ein großes Stück des Weges gegangen ist?
Dorešić: Wir haben erfahren, dass Data Science etwas Neues und Spannendes ist. Es gab immer wieder große Herausforderungen, aber auch dank der großen Hilfe vom Entwicklerteam der SDD haben wir es noch rechtzeitig geschafft. Jetzt sind wir sehr glücklich. Wir und die STYRIA können stolz sein. 

Šafarić: Zu Beginn des Projekts waren wir uns der verschiedenen Herausforderungen bewusst, die den Erfolg gefährden könnten. Aber unser talentiertes Team hat es wieder einmal geschafft, Grenzen zu überschreiten und wir sind sehr stolz darauf!


Foto#1 (c) Igor Kralj/PIXSELL: Antonio Šarabok, Vedran Vekić, Matko Vrbanec, Marko Pranjić, Nikola Tucković, Josip Kaurinović (stehend); Marija Paić, Petra Rebernjak, Dominik Šafarić, Roman Kosanović, Davor Škalec, Hrvoje Dorešić, Nikolina Vidonis (sitzend, alle von links nach rechts) 

Foto#2: Auf der mobilen Version der 24sata-Website testet die Mannschaft gerade die Personalisierung: passendene Inhalte werden teilweise automatisch ausgespielt - je nach Nutzerverhalten