Vor kurzem berichteten wir von unserem Besuch auf der Marktforschungsmesse Research & Results. Hier schrieben wir auch davon, dass „Computerlinguistik […] zum Erfolgsfaktor schlechthin [wird]!“ und versprachen: „Was wir auf diesem Feld so tun, werden wir Euch in Kürze mitteilen“. Genau darum soll es in diesem Blogartikel gehen. Wie kann man Online-Inhalte, z.B. Blogartikel oder Foreneinträge, (größtenteils) automatisiert auf semantische Eigenschaften hin untersuchen? Hierfür haben wir einen Analysemethode entwickelt – die Mutlirelationale Textanalyse (MRA)!
Die Methodik hinter der MRA
Aber bevor ich die eben gestellte Frage beantworte, möchte ich noch etwas weiter ausholen und die dahinter stehende Methodik anschneiden – bitte bleibt aber noch etwas bei mir. Nach der etwas trockenen Theorie kommen die Vorteile und dann noch ein richtig interessantes Anwendungsbeispiel. Deshalb: nicht vorher wegnicken! 😉
Also, wovon gehen wir aus? Wir gehen davon aus, dass komplexe Daten (darunter fallen auch unstrukturierte Textdaten, wie Blogartikel oder Forenbeiträge) eine Vielzahl impliziter Informationen enthalten, die für den Betrachter der Daten unsichtbar sind. Mit unserer Multirelationalen (Text-) Analyse erweitern wir bestehende quantitative Analyseverfahren um ein qualitativ-exploratives Vorgehen. Die Methode dahinter basiert auf Erkenntnissen aus der Graphentheorie sowie der allgemeinen Netzwerk- und Systemtheorie und geht davon aus, dass Zusammenhänge als Netzwerke modelliert und visualisiert werden können. Netze bestehen demnach allgemein aus unterscheidbaren Elementen und Verbindungen, die zwischen den Elementen bestehen. In einem Text sind verschiedene Begriffe mit anderen Begriffen verbunden. Text kann somit mit Hilfe von Algorithmen als ein Netzwerk aus miteinander verbundenen Elementen modelliert werden.
So weit, so trocken. Aber wie kann das aussehen? Zum Beispiel so:
Wir haben natürlich die Möglichkeit, in die Grafiken genauer hinein und hinaus zu zoomen und somit die Verbindungen genauer zu untersuchen. Des Weiteren gibt es viele verschiedene Einstellungen, die eine ideale Auswertung der Daten ermöglichen.
Vorteile der MRA
Welche Vorteile hat jetzt die MRA? Zum einen ermöglicht sie es, sehr große Datenmengen semantisch, linguistisch und vor allem (größtenteils) automatisiert auswerten zu können. Des Weiteren können die Ergebnisse visuell festgehalten werden. Außerdem kann die MRA vielfältig eingesetzt werden. Ein Anwendungsbeispiel werde ich euch gleich noch vorstellen. Nebenbei erwähnt sind wir die ersten, die in dieser Richtung ein zuverlässiges Verfahren entwickelt haben und anwenden. Zumindest nach unseren Erkenntnissen, die wir aus der Marktforschungsmesse Research & Results ziehen konnten.
Kurze Anmerkung zwischendurch: Ihr fragt euch sicherlich, warum ich vor die automatisierte Anwendung immer noch ein „größtenteils“ in Klammer setze. Ganz einfach: Die Ergebnisse müssen natürlich noch überprüft, bewertet und interpretiert werden. Dies geschieht dann aus Qualitäts- und Zuverlässigkeitsgründen natürlich nicht mehr automatisiert. 🙂
Anwendungsbeispiel: Werte der Region Westerwald
Vor ziemlich genau einem Jahr haben wir für den Westerwald Touristik-Service eine MRA durchgeführt. Ziel war die Ermittlung des Fremdbildes der Region Westerwald. Hierzu untersuchten wir ca. 1.500 Online-Texte mit Hilfe der MRA und leiteten daraus die mit dem Westerwald in Verbindung stehenden Werte ab. Daraus, und aus den Werten, die sich aus dem ebenfalls ermittelten Eigenbild ergaben, wurden dann sieben Werte in moderierten Gruppenprozessen definiert. Darauf basierend werden also seit einem Jahr alle Maßnahmen, sowohl Online als auch Offline, abgeleitet. Diese Markenwerte ziehen sich somit durch die gesamte Strategie des Westerwald Touristik-Service – vom Produkt bis zur Kommunikation z.B. auf der Webseite des Westerwalds (Bildmaterial, Texte, Funktionalitäten, etc.).
So werden die sieben Werte im Westerwald dann beispielsweise innerhalb der Region kommuniziert:
Viele weitere Anwendungsbereiche möglich
Ein weiteres Anwendungsbeispiel ist die Identifikation von Subthemen. Denkbar ist zum Beispiel, dass eine Region in den Alpen Online-Texte daraufhin untersuchen möchte, welche Subthemen im Bereich Skifahren für sie relevant sind. Ist vielleicht Freeriden für die Gäste interessant, oder doch eher ein Funpark? Legen die Gäste eher auf einen beheizten Lift Wert, oder sind sie mit dem Service auf den Hütten nicht zufrieden? Variationen, Fragestellungen und Themen sind hierbei in alle Richtungen offen. Übrigens haben wir für einen Kunden, der nicht aus dem Destinationsbereich kommt, vor kurzem erst Subthemen identifiziert. Ihr seht also, die MRA ist auf alle Bereiche anwendbar! 🙂
Was haltet ihr denn von unserer MRA? Kennt ihr entgegen unserer Erkenntnis doch andere Beispiele, wo genau so vorgegangen wird? Welche möglichen Anwendungsbereiche würden euch noch einfallen?
Wir sind auf euer Feedback gespannt,
Ben und Nina.