tetrel Logo tetrel Logo

Know-how und Know-what: automatische Analyse von Marktdaten

Ein deutsches Investmentunternehmen nutzt die docuduct Platform, um Firmenverschmelzungen in Unternehmensmitteilungen zu erkennen.

Herausforderung

Data Science spielt für Investmentunternehmen eine immer größere Rolle: Sowohl in der Identifikation als auch der Bewertung von neuen Zielunternehmen werden zunehmend Machine Learning-basierte Verfahren angewendet.

Als Teil einer Investmententscheidung benötigte das Investmentunternehmen eine Übersicht aller Firmenverschmelzungen der letzten 10 Jahre in ausgewählten Branchen.

Die gute Nachricht: Firmenverschmelzungen sind mitteilungspflichtig - die Information war also allgemein zugänglich. Die schlechte Nachricht: Die Information lag fast ausschließlich als Fließtext vor, beispielsweise so:

DRESDNER BANK Aktiengesellschaft, Frankfurt am Main, Jürgen-Ponto-Platz 1, 60301 Frankfurt am Main. Die Gesellschaft ist als übertragender Rechtsträger nach Maßgabe des Verschmelzungsvertrages vom 27.03.2009 sowie des Zustimmungsbeschlusses ihrer Hauptversammlung vom 06.05.2009 mit der COMMERZBANK Aktiengesellschaft mit Sitz in Frankfurt am Main (Amtsgericht Frankfurt am Main HRB 32000) verschmolzen. Die Verschmelzung wird erst wirksam mit Eintragung im Register des Sitzes des übernehmenden Rechtsträgers.

Um alle relevanten Unternehmensübernahmen zu identifizieren, war es nötig, mehr als 8 Mio. Texte zu analysieren.

Analyse von Marktdaten Natural Language Processing

Das Investmentunternehmen nutzte die docuduct Platform, um Firmenverschmelzungen skalierbar aus Texten zu extrahieren. Zur Anschauung:

Verschmelzung im Fließtext erkannt

Eine erste Version der Erkennung wurde innerhalb von zwei Wochen auf Basis synthetischer Trainingsdaten erstellt. Anschließend wurde der Active Learning-Algorithmus der docuduct Platform genutzt, um die Erkennung auf Basis ausgewählter Beispiele systematisch zu verbessern.

Eine besondere Herausforderung waren dabei ähnliche Formulierungen für Kauf und Verkauf, zum Beispiel:

Fall A:

Mit der Gesellschaft (übernehmender Rechtsträger) ist aufgrund des Verschmelzungsvertrages vom 15.12.2019 mit Nachtrag vom 18.01.2020 die Gesellschaft mit beschränkter Haftung ABC GmbH, Dresden (Amtsgericht Dresden, HRB 12345) verschmolzen. Auf die bei Gericht eingereichten Urkunden wird Bezug genommen.

Fall B:

Die Gesellschaft ist auf Grund des Verschmelzungsvertrages vom 15.12.2017 sowie der Beschlüsse der Gesellschafterversammlungen vom selben Tag mit der ABC GmbH mit dem Sitz in Dresden (Amtsgericht Dresden, HRB 12345) verschmolzen. Die Verschmelzung wird erst wirksam mit der Eintragung der Verschmelzung in das Handelsregister der übernehmenden Gesellschaft, welche am 01.01.2018 erfolgt ist.

Trotz der ähnlichen verwendeten Wörter und Formulierungen beschreibt Fall A einen Unternehmenskauf und Fall B einen Unternehmensverkauf. Ein entscheidender Unterschied.

Das eingesetzte docuduct Modul unterscheidet diese beiden Fälle, indem es nicht nur die erkannten Wörter bewertet, sondern erkennt, in welchem Kontext und welcher Beziehung zueinander diese verwendet werden.

Ergebnisse

Firmenverschmelzungen konnten mit einer Genauigkeit von über 98% automatisch erkannt werden. In den verbleibenden Fällen vermeldete die Erkennung keine ausreichende Konfidenz, woraufhin der Text für ein manuelles Review an einen menschlichen Bearbeiter übergeben wurde.

>98%

automatische Erkennungsrate

<5s

durchschnittliche Zeit für Review von Grenzfällen

100%

Gesamt-Erkennungsrate