Einleitung
Kaum ein Thema prägt die Digitalisierung so stark wie die Künstliche Intelligenz (KI). Von automatisierten Prozessen bis hin zu lernenden Systemen verändert KI die Art, wie Unternehmen Informationen verarbeiten und Entscheidungen treffen. Auch im Bereich der Dokumentenverarbeitung rückt KI zunehmend in den Fokus – mit dem Versprechen, wiederkehrende manuelle Aufgaben zu automatisieren und gleichzeitig die Datenqualität zu verbessern.
Bei AMETRAS ecm, haben wir uns intensiv mit der Frage beschäftigt,
was KI in der realen Welt der Dokumentenverarbeitung tatsächlich leisten kann.
In diesem Beitrag teilen wir die Erkenntnisse aus unserem sechsmonatigen Forschungsprojekt, zeigen die aktuellen Möglichkeiten und Grenzen auf – und wie diese Erkenntnisse in unsere Lösungen eingeflossen sind.
Warum KI in der Dokumentenverarbeitung wichtig ist
Unternehmen verarbeiten täglich eine Vielzahl geschäftsrelevanter Dokumente: Rechnungen, Bestellungen, Auftragsbestätigungen oder Lieferscheine – oft in unterschiedlichen Formaten, Sprachen und Layouts.
Klassische OCR- und regelbasierte Systeme sind seit Jahren etabliert und liefern verlässliche Ergebnisse. Doch sie stoßen an Grenzen, wenn Dokumente unstrukturiert, unterschiedlich formatiert oder handschriftlich sind.
Hier setzt Künstliche Intelligenz an:
Machine Learning (ML) und Large Language Models (LLMs) versprechen, Inhalte nicht nur zu lesen, sondern auch zu verstehen – also semantische Zusammenhänge zu erkennen und flexibel auf verschiedene Dokumenttypen zu reagieren.
Doch wie ausgereift ist diese Technologie wirklich? Und was ist heute schon praxistauglich?
Genau das wollten wir herausfinden.
Das Forschungsprojekt von AMETRAS ecm
Im Frühjahr 2024 startete das AI/ML-Team von AMETRAS ecm unter der Leitung von Andreas Schuler, Experte für OCR und neuronale Netze mit über 30 Jahren Erfahrung, ein umfassendes Forschungsprojekt.
Ziel war es, den tatsächlichen Nutzen moderner KI- und LLM-Modelle bei der Datenextraktion aus Dokumenten zu bewerten.
Über einen Zeitraum von sechs Monaten untersuchten wir, wie verschiedene KI-Modelle reale Dokumente verarbeiten, darunter:
- Rechnungen, Bestellungen und Auftragsbestätigungen aus unterschiedlichen Ländern und Sprachen
- Versicherungs- und Geschäftsdokumente mit variierenden Layouts
- PDFs mit und ohne Textschicht, Scans und Fax-Dokumente
Dabei wurden sowohl vortrainierte Open-Source-Modelle als auch feinjustierte LLMs getestet und mit klassischen OCR-Verfahren kombiniert, um hybride Ansätze zu evaluieren.
Zentrale Erkenntnisse
Die Ergebnisse lieferten ein realistisches Bild des aktuellen Entwicklungsstands:
- Reine Textmodelle ohne Layoutverständnis erzielten nur rund 45 % korrekte Ergebnisse.
- Layout-basierte Modelle, die die räumliche Struktur der Dokumente berücksichtigen, verbesserten die Erkennungsrate auf etwa 54 %.
- Tabellenstrukturen stellten weiterhin eine Herausforderung dar – insbesondere bei verschachtelten oder unregelmäßigen Layouts.
- Hybride Systeme („Mixture of Experts“)– also die Kombination aus KI, OCR und klassischen Verfahren – erzielten die besten Resultate.
- Prompt-basierte Ansätze (z. B. mit ChatGPT) lieferten uneinheitliche Ergebnisse und neigten zu sogenannten Halluzinationen, abhängig von den Parametern und Trainingsdaten.
Das Fazit:
KI ist kein Allheilmittel, aber in Kombination mit bewährten Verfahren ein mächtiges Werkzeug, um Effizienz und Datenqualität deutlich zu steigern.
Von der Forschung zur Anwendung: AMETRAS ecm.docProcess
Aus den Erkenntnissen dieser Forschung haben wir bei AMETRAS ecm den nächsten Schritt gemacht – von der Theorie zur Praxis.
Mit AMETRAS ecm.docProcess ist eine Plattform entstanden, die das Beste aus beiden Welten vereint:
- KI-gestützte Dokumentenerkennung für maximale Flexibilität
- OCR- und regelbasierte Logik für Stabilität und Präzision
- Optionale manuelle Validierung durch spezialisierte Fachkräfte
- Nahtlose Integration in ERP- und CRM-Systeme
Dabei ist uns besonders wichtig:
Unsere KI-Modelle werden ausschließlich intern gehostet – sämtliche Dokumente bleiben im Haus und unter unserer Kontrolle. So stellen wir sicher, dass unsere Kunden von der Leistungsfähigkeit moderner KI profitieren, ohne Kompromisse bei Datensicherheit oder Datenschutz einzugehen.
Fazit
Künstliche Intelligenz verändert die Dokumentenverarbeitung – nicht durch Revolution, sondern durch Evolution. Die Zukunft liegt in der intelligenten Kombination aus Erfahrung, bewährten Technologien und modernen KI-Methoden.
Unsere Extraktionssysteme arbeiten bereits seit Jahren mit lernenden KI-Komponenten, die kontinuierlich verbessert werden. So entstehen Lösungen, die mit jedem neuen Dokument intelligenter werden – sicher, nachvollziehbar und effizient.
Bei AMETRAS ecm sehen wir KI nicht als Ersatz, sondern als Verstärkung.
Unsere Forschung und Entwicklung zielt darauf ab, das Potenzial dieser Technologie sinnvoll und verantwortungsvoll einzusetzen – dort, wo sie echten Mehrwert schafft.