10 Fragen an Andreas Wander

Automatische Texterstellung

Hallo Andreas. Du warst ja gerade zum dritten Mal in unserer Academy zu Gast. Inwiefern haben sich die drei Auftritte für dich unterschieden – mal abgesehen davon, dass du mittlerweile bei einem neuen Arbeitgeber bist?

Ja, da hast du recht, das ist mein drittes Mal bei euch und ich bin immer wieder gerne dabei. Seit Januar 2017 bin ich Geschäftsführer bei diva-e Textprovider. Wir sind ein Anbieter für Content Marketing und Content Produktion aus Bochum.

Als ich das erste Mal an eurer Academy teilgenommen habe, stand ja noch Barketing am Türschild. Nach dem Zusammenschluss mit Nils Kattaus ConversionLift ist es spannend und eindrucksvoll zu sehen, wie ihr euch als LEAP weiterentwickelt. Bei meinen Besuchen ging es schon immer um das Thema Content – in dem Bereich bin ich ja zu Hause. Content Marketing ist einem ständigen Fluss unterworfen, daher ergeben sich daraus immer wieder neue Aspekte über die man reden kann. Diesmal ging es um die automatisierte Texterstellung, ein spannendes und auch relativ frisches Thema.

Das stimmt wohl. Und für mich als Journalist war es beruhigend zu sehen, dass du automatisch erstellte Texte nicht als Ersatz für solche siehst, die von Menschen gemacht werden. Magst du mal erläutern, wo du die Einsatzgebiete für solche Texte siehst?

Natürlich! Die Tools sind hier schon sehr weit, benötigen aber vor allem zwei wichtige Grundlagen:

  1. Eine qualitativ hochwertige und redaktionelle Bedienung
  2. Eine breite und saubere Datenbasis

Die Datenpunkte werden ja mithilfe des Redakteurs und der Software auf Basis eines Trainings erstellt bzw. geschrieben. Genau hier ist dann die Schnittstelle zwischen Mensch und Maschine.

Ein sehr wichtiger Anwendungsfall hat aber tatsächlich einen journalistischen Ursprung. Live-Berichterstattungen, Newsticker und Spielberichte im z.B. aus dem Fußballbereich greifen schon länger auf solche Methoden zurück. Insbesondere, wenn es um die Betextung des Massensports geht.

Im E-Commerce finden automatisierte Texterstellungen gleich mehrfache Anwendungen. Die Paradedisziplin ist sicher der Produkttext. Jeder Betreiber einer E-Commerce-Plattform wird das Problem kennen: die endlose Vielfalt an Produkten sollte idealerweise früher oder später betextet werden, nicht nur um für Suchmaschinen relevant zu sein, sondern auch seinem Kunden die gewünschten Informationen zur Verfügung zu stellen. Meistens lässt ein großes Produktsortiment allerdings die Content-Kosten in die Höhe schießen. Gleiches gilt für Kategorietexte. Genau hier setzt die automatisierte Variante an und bietet eine wirtschaftliche Lösung.

Ein anderes, aktuell sehr spannendes Thema, ist Personalisierung. Ein Beispiel: Wer das volle Potential der Technologie nutzt, erstellt für jeden seiner Kunden einen individuellen Newsletter-Text:

Personalisierte Ansprache des Kunden, z.B. in “Du” oder “Sie”-Form. Emotionale oder sachliche Ansprache, eine flotte Umgangssprache oder förmlich.

Ein standortbasierter Wetterbericht enthält die für den Kunden wichtigsten Informationen, inkl. Vorschläge zu Freizeitaktivitäten und passend dazu die richtige (in Preis, Qualität, Marke) Multifunktionsjacke aus dem Onlineshop anbietet. Und das alles voll automatisiert.

Einige weitere Einsatzgebiete der automatisierte Textgenerierung wären bspw. die Erstellung von Finanz- und Geschäftsberichten oder auch Horoskopen oder Promi-News. Bei Formaten mit weniger strukturierten Daten und Inhalten, wie eBooks, Ratgeber, Top-Listen, etc. stößt die Technologie an ihre Grenzen – zumindest vorerst.

Und sicher sind auch die meisten Redakteure froh, wenn sie keine Produktbeschreibungen mehr erstellen müssen. Wie kann ich mir denn den Ablauf des Trainings der Maschine vorstellen? Worauf achtet ihr da besonders?

Ich denke, das kann jeder bestätigen, der schon mal in diesem Bereich getextet hat. Beschreibungen für beispielsweise tausende technische Bauteile zu erstellen, bringt jeden an seine zumutbaren Grenzen.

Als erster Schritt vor dem ersten Training steht natürlich das Aufsetzen der sogenannten „Maschine“. Das bedeutet, dass die Software über eine API-Schnittstelle an eine Datenquelle gekoppelt werden muss – beispielsweise ein PIM-System. Ist diese Verbindung eingerichtet, kann die Maschine die Daten in die Texte einbauen.

Damit sind wir dann beim Training der Software. Man startet damit einen Urtext zu erstellen, der als Grundlage für die weitere Textentwicklung dient. Im Beispiel der Produktbeschreibungen, ist dieser Urtext möglichst so allgemein gehalten, dass er als Ausgangstext für viele Produkte einer Produktgruppe gelten kann. Er sollte möglichst viele Produktmerkmale abdecken. Diese Merkmale werden später zu Datenfeldern, deren Inhalt automatisch ausgetauscht wird. Also gilt: Je besser der Urtext, desto vielseitiger und effizienter ist er einsetzbar. Besonders zu beachten ist hierbei, dass die Formulierungen möglichst allgemein gehalten werden. Der spezifische Bezug zum Produkt entsteht im nächsten Schritt beim Einarbeiten der Datenfelder.

Anschließend teilt der Redakteur den Text in seine Bestandteile, also die einzelnen Sätze auf und hinterlegt diese in der Software. In diesem Schritt werden die Datenfelder in die Sätze eingebaut.

Ein stark vereinfachtes Beispiel: Das Produkt ist farbig und aus einem Material. Die Datenfelder sind hier fett markiert. „Produkt“ dient als ein Container für verschiedenste Produkte, die zudem das Merkmal einer Farbe und eines Materials aufweisen. Anhand der Produktdaten, ordnet die Maschine dem jeweiligen Produkt die richtige Farbe bzw. Material zu – Der Schuh ist schwarz und aus Leder.

Im nächsten Schritt erstellt der Redakteur Satz-Varianten, arbeitet Synonyme ein und definiert Abhängigkeiten, nach denen bestimmte Satzteile und Wörter im Text vorkommen sollen oder nicht. Man definiert die Logik, nach der die Maschine erkennen soll, ob bspw. ein Produktmerkmal besonders hervorzuheben ist und welche Wortwahl sie in dem Fall treffen soll. So kann man die Maschine dazu trainieren, bestimmte Merkmale und Werte zu verstehen und zu bewerten und damit das auch wirklich im Text verarbeitet wird. Somit lernt die Maschine mit der Zeit hinzu und ist beliebig erweiterbar.

Mit dem fortlaufenden Training entsteht eine enorme Varianz und Vielfalt in den Texten, die das Arbeiten mit der automatisierten Texterstellung so attraktiv machen. Außerdem: die Maschine wird es nicht leid, den 1789. Produkttext zu einem Schrauben-Typen zu schreiben. Somit ist eine gleichbleibende Textqualität gesichert.

Kannst du uns einen Einblick geben, wie lange es dauert, bis mithilfe einer Maschine beispielsweise alle Produkte eines mittelgroßen Online-Shops vertextet wurden? Denn aus eigener leidvoller Erfahrung weiß ich, wie lange man da als Redakteur normalerweise dransitzt.

Tatsächlich lässt sich das sehr gut gegenüberstellen! Am besten nehmen wir wieder ein Beispiel zur Hand: Ein Online-Shop für Möbel bietet 10.000 Produkte an und benötigt für jedes eine eigene Produktbeschreibung.

In vielen Fällen ist es mit einer einmaligen Betextung nicht getan: hinzu kommen andere Sprachen, eine Desktop- und mobile Text-Version sowie mögliche weitere Kanäle wie Amazon, eBay usw. Die Gesamtmenge an Text steigt hier gerne mal um ein Vielfaches.

Um es hier nicht zu komplex zu machen, fokussieren wir uns auf den deutschen Online-Shop. 10.000 Produkttexte zu je 250 Wort machen eine Gesamtmenge von ca. 2,5 Millionen Wörtern.

Gehen wir zuerst den klassischen Weg: Ein Inhouse Redakteur schafft im Durchschnitt vielleicht 750 Wörter in der Stunde und hat rund 6 produktive Stunden pro Tag. Wenn man das mal hochrechnet, würde die einzelne Person grob 550 Tage benötigen, um die 2,5 Millionen Wörter zu schreiben – das sind stolze eineinhalb Jahre. In der Realität würde man natürlich versuchen mehrere Autoren mit der Aufgabe zu betreuen, um die Zeit zu verkürzen. Doch bleiben wir hier beim Vergleich von Mensch und Maschine, denn letztendlich muss der Redakteur die Text-Maschine auch bedienen.

Damit Letztere arbeiten kann, muss natürlich die Anbindung an die Produkt-Datenbank gegeben sein. Oftmals sind hier kaum aufwändigere Anpassungen nötig und die korrekte Verbindung ist in wenigen Tagen hergestellt. Den Aufbau des ersten Trainings habe ich zuvor erläutert. Grundsätzlich setzt man dafür ca. eine Woche an, bis man Text-Entwürfe zu einer ersten Produktgruppe vorliegen hat. Nach einer kurzen Feedback- und Analysephase wird das Training überarbeitet und ausgebaut. Hier geht man nun auch alle weiteren Produktgruppen an. In Summe nimmt der Setup-Prozess in unserem Beispiel bisher rund vier Wochen in Anspruch.

Jetzt können die Texte ausgespielt werden. Im weiteren Verlauf gilt es KPIs zu monitoren und Erfahrungen zu dokumentieren. Man sollte immer im Auge behalten, ob gesetzte Ziele realistisch erreichbar sind. Für diese Phase kann man nach individuellem Wunsch Zeit einplanen. Einige Wochen sollten aber einen guten Eindruck geben. Während des Monitorings und auch danach können jederzeit Anpassungen an den Texten genommen werden – alles mit vergleichsweise wenig Aufwand. Eine Änderung kann bspw. gleichzeitig übergreifend für 1.000 Texte gelten. Genau so setzt sich das Arbeiten mit der automatisierten Texterstellung fort.

Wer eine „Einmal-Betextung“ möchte, ist mit der Aufgabe nach rund 7 Wochen fertig. Wer seine Texte als dynamischen Content sieht und diesen gerne fortlaufend optimieren will, hat ebenfalls nach 7 Wochen ein Grundgerüst, das er mit wenig Aufwand bei Gelegenheit anpassen kann. Um wieder zurück zu den Redakteuren zu kommen: Selbst mit einem Team von vier Autoren liegt man noch bei einer groben Arbeitszeit von 16-18 Wochen. Hinzu kommen die steigenden Personalkosten. Man erkennt also recht schnell, dass die automatisierte Lösung bei der Umsetzung umfangreicher Textprojekte extrem hilfreich und zeitsparend sein kann.

Keine Frage. Schaffen es Betreiber von Online-Shops denn ab einem gewissen Zeitpunkt, auch selbst Änderungen vorzunehmen? Oder bietet ihr das Ganze als laufende Betreuung an?

Das hängt stark vom Betreiber selber ab. Man könnte es als „Einstellungssache“ beschreiben. Wer das volle Potenzial automatisierter Texterstellung nutzt, verschreibt sich diesem Ansatz, möchte ihn auch inhouse verinnerlichen und Wissen aufbauen – dabei helfen wir gern!

In den meisten Fällen jedoch suchen Unternehmen einen Dienstleister, der Sie beim Thema Content mit Fachwissen unterstützen kann, egal ob automatisiert oder klassisch. Die Textproduktion soll bewusst ausgelagert werden, um Ressourcen auf das eigene Tagesgeschäft zu fokussieren. Daher ist der Großteil unserer „automatisierten“ Projekte eine langfristige Betreuung und das ist auch sinnvoll so, da man folgendes beachten muss: Der Vorteil der automatisierten Texterstellung ist ja eben, dass man nicht eine Einmal-Betextung beauftragen muss wie sonst. Das Erstellen, Trainieren und Optimieren ist ein laufender Prozess, der erst möglich ist, weil die üblicherweise hohen Produktionskosten der Texte quasi wegfallen.

Außerdem hat nicht jeder Betreiber die personellen Möglichkeiten seine Mitarbeiter intensiv über das Arbeiten mit der Text-Engine zu schulen. Der Umgang mit dem Tool erfordert redaktionelles Fachwissen und Erfahrung.

Wer das Know-how in dem Bereich nicht erst mühsam allein aufbauen will, der ist mit einem erfahrenen Dienstleister sicher besser bedient. Man darf nicht vergessen: Das Verständnis bzw. Handwerk einen Text zu schreiben hat jeder in einem gewissen Maße ganz natürlich verinnerlicht. Automatisiert Texte zu generieren ist vollkommenes Neuland im Arbeitsalltag. Sowohl mit dem einen als auch dem anderen kennen wir uns bestens aus.

Stehen einem Shop-Betreiber entsprechende personelle Ressourcen zur Verfügung, bauen wir gemeinsam mit Ihm und seinen Mitarbeitern Fachwissen auf. Wir bieten Schulungen vor Ort an, in denen wir praxisorientiert den Umgang mit dem Tool erklären und erste Trainings erstellen. Wir freuen uns immer, wenn der Kunde erkennt, dass die Textqualität steigt, wenn man mit Begeisterung und Herzblut bei der Sache ist.

Wie würdest du denn die allgemeine Textqualität eurer Maschinen bewerten – am besten im Vergleich zu einem guten menschlichen Texter? Sicher gibt es da eine Lernkurve, oder?

Zu dieser Frage habe ich euch mal ein kleines Rätselspiel mitgebracht: Erkenne den Textroboter! Einen der folgenden Texte hat ein Mensch, den anderen die Software geschrieben. Die Auflösung gibt’s dann am Ende des Interviews:

Grundsätzlich wird das, was die Maschine generiert nur so gut, wie der Redakteur das Training gestaltet. Daher: Ja, es gibt eine Lernkurve, die deckungsgleich mit dem Lernprozess ist mit der Software-Lösung zu arbeiten. Der Redakteur muss sich ein Grundverständnis aneignen und verstehen, wie das Tool arbeitet. Bekommt er ein Gefühl dafür, schreibt er genauso geübt und selbstverständlich Texte, wie auf händische Weise.

Nehmen wir wieder die Produkttexte als Paradebeispiel, gibt es qualitativ keinen Unterschied zwischen automatisiert und klassisch erstellten Texten. Die Unterschiede werden genau da sichtbar, wo automatisierte Textgenerierung seine bisher natürlichen Grenzen hat: bei Content-Formaten zu denen es weniger strukturierte Daten und Inhalte gibt, wie z.B. eBooks oder Ratgeber.

Ob automatisiert oder händisch: Wir haben auf beiden Gebieten viel Erfahrung und wissen daher, wie wir die Qualität eines guten Texters in der neuen Technologie umsetzen und gewährleisten können. Das liegt ja auch ganz in unserem Interesse: Keiner unserer Redakteure würde mit automatisierten Texten arbeiten, wenn er nicht vollends dahinter stünde – „Textercodex“!

Wie werden sich automatisierte Texte denn deiner Meinung nach entwickeln. Glaubst du, dass in ein paar Jahren auch ganze E-Books mit einzigartigen oder gar neuartigen Inhalten aus der Feder einer Maschine stammen könnten?

Dazu gibt’s von mir ein klares „Ja“! Die Maschine, die zum jetzigen Zeitpunkt u.a. Produkttexte liefert, wird sich wie jede Technologie exponentiell weiterentwickeln. Die Software muss in der Lage sein, den inhaltlichen Fokus zu erweitern und weniger themenspezifisch (z.B. produktbezogen) zu arbeiten. Kurz gesagt: Sie muss holistisch Denken.

Prinzipiell macht man in den Trainings ja nichts anderes, als Wissen in einer Datenbank zu hinterlegen und dieser dann beizubringen, wie sie dieses Wissen miteinander verknüpfen soll. Wer viel Arbeit und Ehrgeiz in das Training der Maschine investiert und den Sprach-Algorithmus verbessert, kann es schaffen, die Software auf solch ein holistisches Niveau zu heben. Google hat es ja auch geschafft: Der Algorithmus wurde über die Jahre stets weiterentwickelt und dadurch intelligenter.

Die Forschung in künstlicher Intelligenz ist heute schon sehr weit. Den Anteil dieser Entwicklung, den wir als Verbraucher bei technischen Produkten sehen, ist nur ein Bruchteil von den eigentlichen heutigen Möglichkeiten. Moderne Sprachcomputer sind dazu in der Lage, Aussagen zu interpretieren und Wahrheitswerte zu erkennen. Diese Maschinen erweitern selbstständig ihr Wissen – holistisches Denken wird dadurch möglich. Eine eigenständig denkende künstliche Intelligenz hat heute noch diesen „Science-Fiction“-Touch und ist für den Verbrauchermarkt unbezahlbar. Doch wie bei jeder Technologie gibt es da diesen natürlichen Kreislauf: Mit der technischen Weiterentwicklung, der Skalierbarkeit in der Herstellung und steigender Akzeptanz sinkt der Preis.

Mit diesem Trend werden Sprachcomputer in der Zukunft dazu fähig sein holistische Content-Formate wie eBooks, Ratgeberinhalte oder Blogs zu erstellen. Die nächste Hürde wird dann vielleicht die gute alte Lyrik sein? Das wird man sehen.

Lässt sich dann auch der Aufbau der Trainings verändern? Weil bisher wird ja für jedes Vorhaben eine neue Maschine angelernt. Wäre es möglich, dass in der Zukunft auch die Maschinen voneinander lernen, damit man nicht immer bei Null anfangen muss?

Das wird auf jeden Fall möglich sein. Prinzipiell ist die Antwort hier eine ähnliche: Mit der Weiterentwicklung von künstlicher Intelligenz wird auch die Text-Maschine noch fortschrittlicher werden. Die Funktion von bestehenden Trainings zu lernen, liegt gar nicht mal in so weiter Ferne.

In der Erstellung eines Trainings verknüpft der Redakteur über Abhängigkeiten und einer definierten Logik Produktmerkmale. So können verschiedene Inhalte verbunden werden und Sätze entstehen. Damit die Software von anderen Trainings oder gar Maschinen lernen kann, muss ein ähnlicher Prozess geschehen. Auf einer übergeordneten Ebene müssen Merkmale und Logiken mehrerer Trainings verknüpft und inhaltlich erfasst werden – Stichwort: holistisches Denken. Nehmen wir wieder das Beispiel der Produktkategorien, muss definiert werden, was eine Produktgruppe auszeichnet und sie von anderen unterscheidet. Eigentlich ist das Prinzip immer ein ähnliches: Wir versuchen der Software unsere Logik hinter Text und Inhalten beizubringen, damit diese auf dessen Basis Texte generiert. Ist das erreicht, kann die Software erkennen, wieso sie bei der Erstellung des Trainings „Ohrringe“ besonders auf Material und Wording achten soll und nimmt eigenständig Elemente aus dem Training „Halsketten“ zur Hilfe. Diese Logik Trainings oder sogar Software-übergreifend manuell aufzubauen wird sehr mühselig werden. Daher wird in Zukunft die einzig sinnvolle Lösung der Einsatz von künstlicher Intelligenz sein, die selbstständig agieren kann.

Auch wenn man beim aktuellen Stand für jede Kategorie eigene Trainings erstellen muss, fängt man hier nie wieder ganz bei Null an. Entscheidet man sich für das Arbeiten mit automatisierter Texterstellung ist die erste größte Hürde der Lernprozess. Es ist eine neue Art mit Text zu arbeiten und daran muss man sich gewöhnen. Hat ein Redakteur das erste und zweite Text-Training erstellt, ist er routinierter und weitere Trainings fallen deutlich leichter. Man kann Synergieeffekte nutzen und teilweise Elemente aus anderen Trainings übernehmen. Hierbei ist Erfahrung enorm wertvoll und spart Zeit. In den ersten gemeinsamen Trainings mit unseren Kunden versuchen wir daher immer unsere Erfahrungswerte weiterzugeben.

Du sagst ja selbst, dass der Redakteur eine zentrale Position einnimmt. Wie nehmen Redakteure denn die Arbeit mit der Maschine an? Weil ich kann mir vorstellen, dass es gerade zu Beginn noch einige Berührungsängste gibt.

Gelegentlich schreckt der durchaus technische Charakter den ein oder anderen weniger technikaffinen Redakteur zunächst ab. Hat man jedoch erst einmal grob verstanden, wie die Maschine funktioniert, erkennt man die Möglichkeiten, die diese Software bietet. Das Ganze ist eine spannende Herausforderung für jeden Sprachbegeisterten. Dieser haben sich bisher alle Redakteure, mit denen wir zusammengearbeitet haben, mit großer Neugier und Begeisterung gestellt.

Ein guter Redakteur ist für das Arbeiten mit der Software unerlässlich. Automatisierung hin oder her – der Redakteur ist der entscheidende Faktor, der die Textqualität beeinflusst. Bei der Arbeit sind jede Menge Sprachgefühl und Textverständnis gefragt! Schließlich sind es im ersten Schritt die Redakteure, die einerseits Urtexte anlegen, Satzvarianten entwickeln und Synonyme hinterlegen. Auch ein gewisses Maß an Verständnis für Grammatik ist wichtig – nur so können die Daten korrekt in den Sätzen eingebunden und verdrahtet werden.

Von diesen sprachlichen „Basics“ abgesehen unterscheidet sich die konkrete Texterstellung durchaus vom klassischen Texten – das ist eben die willkommene Herausforderung und Abwechslung dabei.

Es müssen ganz andere Faktoren bedacht werden, wie: Ist dieser Satz allgemein genug, um zu jedem Produkt und in jedem Kontext zu passen? Passt die Tonalität dieses Wortes zu allen Produkten? Und wie gliedere ich den Input sinnvoll nach genau diesen Aspekten? Hierbei entdeckt der ein oder andere vielleicht ein ungeahntes Talent, systematischer an die Textkonzeption heran zu gehen.

Und wie bereits gesagt: Je mehr Arbeit und Herzblut die Redakteure in die Trainings stecken, desto besser werden die Texte, denn die Maschine ist immer nur so gut wie der Redakteur, der sie bedient.

Zum Abschluss würde mich noch folgendes interessieren: Ihr arbeitet ja mit den Maschinen und erstellt die Trainings. Aber die Maschinen selbst kommen ja von anderen Anbietern, oder? Inwiefern seid ihr dort in die Prozesse involviert und könnt euer Feedback einbringen, um die Maschinen zu verbessern?

Ganz genau. In unserem Fall arbeiten wir mit unserem Partner AX Semantics zusammen, der die Software-Komponente entwickelt. Wir stellen hier meist eine Schnittstelle zwischen dem Kunden und dem Anbieter dar, die Software selbst bieten wir jedoch nicht an. Wir betreuen dann den kompletten Prozess des Onboardings, in dem die Maschine korrekt aufgesetzt wird sowie die redaktionelle Betreuung und Erstellung der Trainings. Hier liefern wir eben das fachliche Knowhow am Text und bringen viel Erfahrung aus Content Marketing und Produktion mit. Dieses Setup bringt mit, dass wir sehr eng mit unserem Partner zusammenarbeiten und das nicht nur aus vertrieblicher Sicht!

Gemeinsam beraten wir den Kunden über die Struktur der einzubindenden Produktdaten und finden da auch immer eine sinnvolle Lösung. Unsere Redakteure stehen im regen Austausch mit den Kollegen bei AX Semantics über neue Funktionen der Software. Oftmals können wir aus unserer Texter-Perspektive noch wertvollen Input zur Weiterentwicklung der Maschine geben. Durch das enge Verhältnis ist es kein Problem auch mal projektspezifische Änderungen vorzunehmen oder neue Datenquellen anzubinden.

Lieber Andreas, vielen Dank für deinen Auftritt in der Academy, dieses Interview und die spannenden Einblicke in die automatisierte Texterstellung. Und hier noch die Auflösung deines Rätsels: