tetrel Logo tetrel Logo

Natural Language Processing: die nächste Raketenstufe in der digitalen Transformation?

2021-05-11 von Philipp Block (LinkedIn | Twitter)

Künstliche Intelligenz wird gerne als Königsdisziplin der digitalen Transformation bezeichnet. Zu Recht. Denn KI nimmt erst richtig Geschwindigkeit auf, sie wird im Sinne von Vorhersagemodellen mehr und mehr Mainstream. Und NLP, Natural Language Processing ist dabei der Booster.

Digitale Transformation ist ein Prozess, eine Reise, bei der die Richtung immer wieder geändert wird und das Ziel offen ist. Irrtümlicherweise verstehen viele das aber so, dass man da einen Haken hinter machen kann, wenn dies oder das erreicht ist. Dem ist aber nicht so. Das ist das Thema der nächsten Jahre und Jahrzehnte. NLP hat dabei das enorme Potential, der digitalen Transformation entscheidende Schübe zu geben. Deshalb hier erstmal eine Definition, dann eine Bestandsaufnahme und zuletzt ein Ausblick.

Digitale Transformation?

Per definitionem bezeichnet digitale Transformation einen fortlaufenden, in digitalen Technologien begründeten Veränderungsprozess – hauptsächlich in einem wirtschaftlichen Kontext, also was das in Konsequenz für Unternehmen bedeutet. Dazu dann noch im Verwaltungs- und natürlich auch im Bildungsbereich. Wie es darum steht, na ja, das sei dahingestellt. Ein plakatives Beispiel: Alle Schulen mit Computern für alle Schüler auszustatten, und dann zu sagen “Fertig”, das ist es nicht. Das Stichwort hierbei lautet: “fortlaufender Veränderungsprozess”.

Potentiale erkennen - und auch nutzen

Neue Betriebssysteme, neue Software, neue Anwendungsmöglichkeiten – begreift man digitale Transformation nicht als Prozess, steht man schnell wieder am Anfang. Warum jetzt dieses düstere Bild? Geht es nicht optimistischer? Ja, natürlich. Die Entwicklungen im Bereich der KI, allen voran NLP, eröffnen in immer kürzeren Abständen immer größere Dimensionen der Anwendbarkeit. Modelle im Natural Language Processing nähern sich immer mehr menschlichem Verständnis an, teilweise sind sie sogar besser. Das hat schon jetzt großen Einfluss auf die Wirtschaft, beziehungsweise könnte großen Einfluss haben.

Nicht als Rocket Science betrachten

Das ist abhängig davon, inwiefern Unternehmen KI und NLP als vorteilhafte Technologie begreifen, akzeptieren und einsetzen. Doch da ist nicht die Frage ob, sondern wann? Das wird geschehen, da bin ich mir sicher. Ein gängiges Klischee ist, dass KI ja nur was für die Wissenschaft oder Großkonzerne ist - Rocket Science eben. Das mag mal so gewesen sein. Vielleicht zögern so manche Unternehmen deshalb, sich diesem Bereich anzunähern. Von NLP können aber schon heute Unternehmen jeder Größe profitieren, da haben Blue Chips kein Monopol mehr drauf. Doch bei Domänenwissen, also proprietäres Wissen und Daten eines Unternehmens, wird NLP bisher eher selten eingesetzt. Dabei ist ein produktiver Einsatz in Wochen bis wenigen Monaten möglich - und das Potenzial zur Verbesserung ist enorm. Denn:

Text wird strukturierten Daten immer ähnlicher

Immer mehr Unternehmen entdecken die vielen Möglichkeiten von NLP, die kontinuierlich vielfältiger werden. Das liegt unter anderem daran, dass durch NLP die Grenze zwischen strukturierten Daten und Text immer fließender wird, also dass Text wie strukturierte Daten behandelt werden kann. Ein simples Beispiel für strukturierte Daten: Excel und Adressdatenbanken … Diese Daten können in Sekundenbruchteilen ausgewertet werden (meistens). Text ist Text – ebenso in unterschiedlichster Form vorhanden, in Dokumenten, aber auch in Audio-Dateien. Und hier kommt NLP als Joker ins Spiel:

Mit NLP Text klassifizieren und analysieren

NLP, zur Erinnerung: Natural Language Processing, ermöglicht es, ähnlich wie bei strukturierten Daten in kürzester Zeit Informationen zu verarbeiten. Klingt alles sehr abstrakt? Dann hier etwas plastischer: Um Daten aus einer Excel zu extrahieren oder einen Dublettenabgleich in einer Adressdatenbank durchzuführen, benötigt es auch in Standard-Office-Programmen nur einen Klick (an der richtigen Stelle). Will man allerdings Informationen aus einem Textdokument ziehen, ist das nicht mit einem Klick getan – zumindest in Standardprogrammen ohne NLP … Informationen sind ja erstmal nicht als Informationen gekennzeichnet. Und sind als solche auch nicht klassifiziert oder in einem Kontext analysiert. Mit NLP:

Mein Lieblingsbeispiel - ein Textdokument mit vielen, vielen Seiten, man benutzt die “Suchen”-Funktion nach “Bank”. Dann werden Treffer angezeigt. Aber nur die. Ob es sich dabei um eine Bank zum meditativen Sitzen im Park handelt, oder um eine Bank, um sein Geld sicherheitshalber zu parken, das ist nicht ersichtlich – es sei denn, eine trainierte KI führt diese Suche durch… Jetzt muss man sich das mal verbildlichen:

Diese Vereinbarung über eine strategische Allianz wird am 9. September 2005, zwischen der UTEK Corporation ("UTK"), 202 South Wheeler Street, Plant City, Florida 33566, einer Gesellschaft des Bundesstaates Delaware, und World Energy Solutions, ("AVDU"), 3900A 31st Street North, St. Petersburg, Florida, einer Gesellschaft des Bundesstaates Florida, geschlossen und unterzeichnet.

Neue Effizienzmöglichkeiten

Wieder ein greifbares Beispiel – ein umfangreiches Vertragsarchiv mit hunderten von Dokumenten, jedes davon mehrere hundert oder tausende Seiten lang. Ohne NLP-Lösungen bedeutet das, dass das individuell von einem Menschen einzeln, händisch ausgewertet werden muss. Also lesen, durchsuchen, bewerten, abtippen. Das kann dauern. Mit einer NLP-Lösung geht das in Sekundenschnelle. Konkrete Anwendungsbeispiele? Zum Beispiel das Extrahieren relevanter Informationen aus Datenraumdokumenten (rechtliche Verbindlichkeiten, Lieferanten-Service-Level-Agreements, Kündigungsfristen etc.) für eine rechtliche und kommerzielle Due Diligence. Es gibt viele weitere Beispiele und Anwendungs- sowie Einsatzmöglichkeiten von NLP, viele weitere werden definitiv hinzukommen.

Fazit: “Ignite!”

Im Alltagsleben ist NLP ebenso schon längst angekommen. Gerade kürzlich gab es die Meldung, das BERT, eine NLP-Lösung, den Google Assistant deutlich verbessert hat (https://mixed.de/google-assistant-wird-durch-bert-ki-verbessert/). Mit anderen Worten: Die kontinuierliche Entwicklung von NLP ist die nächste Raketenstufe, die bei KI gezündet wird - oder schon ist. Und das verstehe ich unter echter digitaler Transformation …