Google mit KI auch für “Dokument-Verstehen”?
11. Oktober 2019 13:24 Uhr | | Permalink
AI, Automatisierung & Information Management: auch Google bietet jetzt Services in der Cloud zur Dokumenten-Analyse an: Google: “Unlocking the power of AI with solutions designed for every enterprise” http://bit.ly/Google-ECM. Die Effekte werden gut im Artikel “Bringing Intelligence to Enterprise Content Management, Google Releases Document Understanding AI” beschrieben: http://bit.ly/Google-Document-Understanding. Zu den Einsatzmöglichkeiten von AI und ML auf der Google-Plattform gibt es auch das Video eines aktuellen Vortrages: https://www.youtube.com/watch?v=7dtl650D0y0.
Mit “Document Understanding” wird bei Google die Analyse, die Klassifikation und das inhaltliche “Verstehen” beliebiger digitaler – auslesbarer, also nicht Images, dafür braucht es noch zwischendurch OCR/ICR – Objekte bezeichnet. Dafür lassen sich auch Profile per ML erlernen oder trainieren und als kundenspezifische Schema speichern.
Für diese Lösungen gibt es bereits eine Reihe von Entwicklungs- und Lösungs-Partnern. Darunter namhafte Anbieter aus der ECM-Branche: Iron Mountain, Box, Egnyte, UiPath, Accenture und Taulia. Interessant wird die AI-Konkurrenz-Situation bei Box werden. Box ist Partner von IBM und nutzt Watson. Zudem strebt Box eine engere Kooperation mit Microsoft an und wird dort auch auf Automatisierungs-Services zurückgreifen wollen.
Künstliche Intelligenz ist zur treibenden Kraft im Information Management geworden. Automatisierung wird von AI & ML vorangetrieben. So wird auch BPM Business Process Management und RPA Robotic Process Automation ebenso profitieren wie die traditionellen Einsatzgebiete beim Input-Management (Capture), inhaltlicher Erschließung (Taxonomy, Classification, Indexing) und Wiederfinden (Retrieval, Search). Brauchen wir dann zukünftig noch manuell erstellte Aktenpläne für das Records Management? Klassifiziert und ordnet die Maschine dann alles selbst? Findet die Maschine alles? Befinden wir uns auch hier auf dem Weg zum SICS? http://bit.ly/updateIM19-HH-SICS
AI für Klassifizierung? Ernüchternd
Das Video von Google ist schon sehr interessant. Hier kann man auch auf Bestrebungen von Microsoft mit den Cognitive Services verweisen. AWS hat da sicher auch was 🙂 Aber ich finde nach meiner aktuellen Marktsondierung den Begriff AI für die Künstliche Intelligenz im Bereich Dokumentenklassifizierung deutlich überbewertet.
Wo wird diese verwendet? Sind meine Ansprüche zu hoch? Wir wollen unseren Kunden auch einen perfekten Komfort bieten, um das Gold (also die Daten) als allen(!) relevanten Dokumentarten zu ziehen und in Prozessen und Weiterverarbeitung anzubieten. Nicht nur immer wieder „Rechnungen“. Und so sucht man, ergänzend zu eigenen Engine, an der man einfach, aber klassisch, Dokumente durch anklicken antrainiert, auch nach neuen Welten, die das Leben für die Anwender einfacher macht. Und meine aktuelle Recherche ist eher ernüchternd.
Die Lösungen, die ich mir angesehen habe, konzentrieren sich auf Rechnungen mit vordefinierten Erkennungsbibliotheken im Hintergrund. Wenigstens hier teilweise auf Crowd Learning Basis. Sobald man die Rechnungen verlässt, wird es eng.
Den interessantesten „Fall“ hatte ich in der Schweiz bei einem erstmal vielversprechenden Anbieter für eine sehr KI umworbene unterstützte automatische Erkennung von mehreren Dutzend Dokumentarten. 98% Genauigkeit. Super, dachte ich, endlich mal Fortschritte. Ein junges Startup, massiv VC gestützt.
Im Gespräch wurde es spannend. Von den vielen beworbenen Dateitypen konnte die Bibliothek „erstmal“ nur eine … nämlich Rechnungen. Was für eine Überraschung. Die anderen würden irgendwann mal kommen. Die 98% Genauigkeit wolle man aber auch auf der Homepage korrigieren, so genau wäre es dann nicht. Ok, und was passiert mit Dokumenten, die noch nicht mit der angepriesenen Super-KI automatisch klassifiziert wurden? Ja, die werden tatsächlich von einem externen Team per Hand nachgearbeitet. Zum Nachtrainieren …. Das Thema Datenschutz hab ich dann mal außen vor gelassen. Das darf man doch bitte nicht „KI“ nennen. Das ist Marketinghumbug.
Wenn wir noch auf dieser Ebene arbeiten, dann sind wir noch meilenweit von einer Automatisierung auf Basis von KI entfernt. Kann mir jemand erklären, wozu die KI denn überhaupt bei den Klassifizierungsanbietern eingesetzt wird? Was übernimmt die KI? Fast immer entpuppte sich das als Hinterlegung von sprachflexiblen Synonymen in Kombination mit Regeln und von „Hand“ gesetzten (geskripteten) Ankerpunkten und relativen Koordinaten auf Basis von Crowd Learning und großen Dokumentbeständen. Bestenfalls angereichert mit ergänzenden Datenquellen aus ERP.
Ich stimme Ulli zu. KI kann die treibende Kraft in Segment Information Management werden. Aber aktuell ist mir da viel zu viel Schein als Sein. LEIDER. Wer mag mich von Gegenteil überzeugen?
Aktueller Stand bei automatischer Klassifizierung
Das Thema ist sehr interessant und wichtig für die Zukunft. Die aktuelle Situation ist aber tatsächlich ernüchternd. Trotz zahlreicher auch größerer Projekte gibt es kaum praxisnahe Ergebnisse. Außer den Rechnungen und Anfängen bei der Verarbeitung von Mails, sind mir keine nennenswerten Fortschritte bekannt. Wir hatten erst kürzlich in einem Projekt die Situation , dass auf die Ankündigung “Das machen wir mit KI” im Test eine Erkennungsrate von 2% folgt (bei rein zufälliger Klassifikation, kann man statistisch gesehen wahrscheinlich erfolgreicher sein).
Auch bei den Rechnungen ist eine stabile Lösung fast immer mit einem Stammdatenvergleich auf Positionsebene versehen, was ja keine AI darstellt.
Aber es freut mich, dass es noch mehr Zweifler gibt. Denn aktuell passen die Anstrengungen und Ansprüche (damit auch die Erwartungen der Kunden) überhaupt nicht zu den Ergebnissen.
AIIM Whitepaper zu Automatisierung & KI
AIIM hat ein neues Whitepaper veröffentlicht, dass sich mit der Bedeutung der Künstlichen Intelligenz beim Information Management beschäftigt: “Why Care about Artificial Intelligence? A Guide for Adopting AI for Process Improvement” https://info.aiim.org/why-care-about-artificial-intelligence Hier wird Künstliche Intelligenz als der wichtigste Treiber beschrieben. Viel geben die par dicht mit Text bepackten Folien nicht her. Das als eBook zu bezeichnen ist schon gewagt.
AIIM eBook bei PROJECT CONSULT im Download: “Why Care about Artificial Intelligence? A Guide for Adopting AI for Process Improvement” | #AIIM #AI #Automation http://bit.ly/33Q3Txp