tetrel Logo tetrel Logo

Know-how and know-what: automatic analysis of market data

A German investment company uses the docuduct Platform to detect company mergers in corporate disclosures.


Data science is playing an increasingly important role for investment companies: Machine learning-based methods are being used more and more in both the identification and valuation of new target companies.

As part of an investment decision, the investment firm needed an overview of all company mergers in the last 10 years in selected industries.

The good news: Company mergers are subject to notification - so the information was publicly available. The bad news: The information was almost exclusively available as continuous text, for example like this (in German):

DRESDNER BANK Aktiengesellschaft, Frankfurt am Main, Jürgen-Ponto-Platz 1, 60301 Frankfurt am Main. Die Gesellschaft ist als übertragender Rechtsträger nach Maßgabe des Verschmelzungsvertrages vom 27.03.2009 sowie des Zustimmungsbeschlusses ihrer Hauptversammlung vom 06.05.2009 mit der COMMERZBANK Aktiengesellschaft mit Sitz in Frankfurt am Main (Amtsgericht Frankfurt am Main HRB 32000) verschmolzen. Die Verschmelzung wird erst wirksam mit Eintragung im Register des Sitzes des übernehmenden Rechtsträgers.

To identify all relevant company acquisitions, it was necessary to analyze more than 8 million texts.

Analysis of market data with natural language processing

The investment company used the docuduct Platform to extract company mergers from text in a scalable way. For illustration (in German):

Detection of merger in text

A first version of the recognition was created within two weeks based on synthetic training data. Subsequently, the active learning algorithm of the docuduct Platform was used to systematically improve the recognition based on selected examples.

A particular challenge here was similar wording for buying and selling, for example (in German):

Case A:

Mit der Gesellschaft (übernehmender Rechtsträger) ist aufgrund des Verschmelzungsvertrages vom 15.12.2019 mit Nachtrag vom 18.01.2020 die Gesellschaft mit beschränkter Haftung ABC GmbH, Dresden (Amtsgericht Dresden, HRB 12345) verschmolzen. Auf die bei Gericht eingereichten Urkunden wird Bezug genommen.

Case B:

Die Gesellschaft ist auf Grund des Verschmelzungsvertrages vom 15.12.2017 sowie der Beschlüsse der Gesellschafterversammlungen vom selben Tag mit der ABC GmbH mit dem Sitz in Dresden (Amtsgericht Dresden, HRB 12345) verschmolzen. Die Verschmelzung wird erst wirksam mit der Eintragung der Verschmelzung in das Handelsregister der übernehmenden Gesellschaft, welche am 01.01.2018 erfolgt ist.

Despite the similar words and phrases used, Case A describes a business purchase and Case B describes a business sale. One crucial difference.

The docuduct module differentiates between these two cases by not only evaluating the recognized words, but also recognizing in which context and in which relationship they are used.


Company mergers could be detected automatically with an accuracy of over 98%. In the remaining cases, the recognition reported insufficient confidence, whereupon the text was passed to a human editor for a manual review.


automatic detection rate


average time for review of borderline cases


overall detection rate