Google mit KI auch für “Dokument-Verstehen”?

11. Oktober 2019 13:24 Uhr  |   |  Permalink


AI, Automatisierung & Information Management: auch Google bietet jetzt Services in der Cloud zur Dokumenten-Analyse an: Google: “Unlocking the power of AI with solutions designed for every enterprise” http://bit.ly/Google-ECM. Die Effekte werden gut im Artikel “Bringing Intelligence to Enterprise Content Management, Google Releases Document Understanding AI” beschrieben: http://bit.ly/Google-Document-Understanding. Zu den Einsatzmöglichkeiten von AI und ML auf der Google-Plattform gibt es auch das Video eines aktuellen Vortrages: https://www.youtube.com/watch?v=7dtl650D0y0.

Mit “Document Understanding” wird bei Google die Analyse, die Klassifikation und das inhaltliche “Verstehen” beliebiger digitaler – auslesbarer, also nicht Images, dafür braucht es noch zwischendurch OCR/ICR  – Objekte bezeichnet. Dafür lassen sich auch Profile per ML erlernen oder trainieren und als kundenspezifische Schema speichern.

Google AI Architecture for Document Understanding | Screenshot https://www.youtube.com/watch?v=7dtl650D0y0

Für diese Lösungen gibt es bereits eine Reihe von Entwicklungs- und Lösungs-Partnern. Darunter namhafte Anbieter aus der ECM-Branche: Iron MountainBoxEgnyteUiPathAccenture und Taulia. Interessant wird die AI-Konkurrenz-Situation bei Box werden. Box ist Partner von IBM und nutzt Watson. Zudem strebt Box eine engere Kooperation mit Microsoft an und wird dort auch auf Automatisierungs-Services zurückgreifen wollen.

Google AI ML Content Extraction | Screenshot https://www.youtube.com/watch?v=7dtl650D0y0

Künstliche Intelligenz ist zur treibenden Kraft im Information Management geworden. Automatisierung wird von AI & ML vorangetrieben. So wird auch BPM Business Process Management und RPA Robotic Process Automation ebenso profitieren wie die traditionellen Einsatzgebiete beim Input-Management (Capture), inhaltlicher Erschließung (Taxonomy, Classification, Indexing) und Wiederfinden (Retrieval, Search). Brauchen wir dann zukünftig noch manuell erstellte Aktenpläne für das Records Management? Klassifiziert und ordnet die Maschine dann alles selbst? Findet die Maschine alles? Befinden wir uns auch hier auf dem Weg zum SICS? http://bit.ly/updateIM19-HH-SICS

3 Kommentare zu “Google mit KI auch für “Dokument-Verstehen”?

  • AI für Klassifizierung? Ernüchternd
    22. Oktober 2019 um 16:51
    Permalink

    Das Video von Google ist schon sehr interessant. Hier kann man auch auf Bestrebungen von Microsoft mit den Cognitive Services verweisen. AWS hat da sicher auch was 🙂 Aber ich finde nach meiner aktuellen Marktsondierung den Begriff AI für die Künstliche Intelligenz im Bereich Dokumentenklassifizierung deutlich überbewertet.

    Wo wird diese verwendet? Sind meine Ansprüche zu hoch? Wir wollen unseren Kunden auch einen perfekten Komfort bieten, um das Gold (also die Daten) als allen(!) relevanten Dokumentarten zu ziehen und in Prozessen und Weiterverarbeitung anzubieten. Nicht nur immer wieder „Rechnungen“. Und so sucht man, ergänzend zu eigenen Engine, an der man einfach, aber klassisch, Dokumente durch anklicken antrainiert, auch nach neuen Welten, die das Leben für die Anwender einfacher macht. Und meine aktuelle Recherche ist eher ernüchternd.

    Die Lösungen, die ich mir angesehen habe, konzentrieren sich auf Rechnungen mit vordefinierten Erkennungsbibliotheken im Hintergrund. Wenigstens hier teilweise auf Crowd Learning Basis. Sobald man die Rechnungen verlässt, wird es eng.

    Den interessantesten „Fall“ hatte ich in der Schweiz bei einem erstmal vielversprechenden Anbieter für eine sehr KI umworbene unterstützte automatische Erkennung von mehreren Dutzend Dokumentarten. 98% Genauigkeit. Super, dachte ich, endlich mal Fortschritte. Ein junges Startup, massiv VC gestützt.

    Im Gespräch wurde es spannend. Von den vielen beworbenen Dateitypen konnte die Bibliothek „erstmal“ nur eine … nämlich Rechnungen. Was für eine Überraschung. Die anderen würden irgendwann mal kommen. Die 98% Genauigkeit wolle man aber auch auf der Homepage korrigieren, so genau wäre es dann nicht. Ok, und was passiert mit Dokumenten, die noch nicht mit der angepriesenen Super-KI automatisch klassifiziert wurden? Ja, die werden tatsächlich von einem externen Team per Hand nachgearbeitet. Zum Nachtrainieren …. Das Thema Datenschutz hab ich dann mal außen vor gelassen. Das darf man doch bitte nicht „KI“ nennen. Das ist Marketinghumbug.

    Wenn wir noch auf dieser Ebene arbeiten, dann sind wir noch meilenweit von einer Automatisierung auf Basis von KI entfernt. Kann mir jemand erklären, wozu die KI denn überhaupt bei den Klassifizierungsanbietern eingesetzt wird? Was übernimmt die KI? Fast immer entpuppte sich das als Hinterlegung von sprachflexiblen Synonymen in Kombination mit Regeln und von „Hand“ gesetzten (geskripteten) Ankerpunkten und relativen Koordinaten auf Basis von Crowd Learning und großen Dokumentbeständen. Bestenfalls angereichert mit ergänzenden Datenquellen aus ERP.

    Ich stimme Ulli zu. KI kann die treibende Kraft in Segment Information Management werden. Aber aktuell ist mir da viel zu viel Schein als Sein. LEIDER. Wer mag mich von Gegenteil überzeugen?

    Antwort
  • Aktueller Stand bei automatischer Klassifizierung
    4. November 2019 um 6:57
    Permalink

    Das Thema ist sehr interessant und wichtig für die Zukunft. Die aktuelle Situation ist aber tatsächlich ernüchternd. Trotz zahlreicher auch größerer Projekte gibt es kaum praxisnahe Ergebnisse. Außer den Rechnungen und Anfängen bei der Verarbeitung von Mails, sind mir keine nennenswerten Fortschritte bekannt. Wir hatten erst kürzlich in einem Projekt die Situation , dass auf die Ankündigung “Das machen wir mit KI” im Test eine Erkennungsrate von 2% folgt (bei rein zufälliger Klassifikation, kann man statistisch gesehen wahrscheinlich erfolgreicher sein).

    Auch bei den Rechnungen ist eine stabile Lösung fast immer mit einem Stammdatenvergleich auf Positionsebene versehen, was ja keine AI darstellt.

    Aber es freut mich, dass es noch mehr Zweifler gibt. Denn aktuell passen die Anstrengungen und Ansprüche (damit auch die Erwartungen der Kunden) überhaupt nicht zu den Ergebnissen.

    Antwort
  • AIIM Whitepaper zu Automatisierung & KI
    15. November 2019 um 14:47
    Permalink

    AIIM hat ein neues Whitepaper veröffentlicht, dass sich mit der Bedeutung der Künstlichen Intelligenz beim Information Management beschäftigt: “Why Care about Artificial Intelligence? A Guide for Adopting AI for Process Improvement” https://info.aiim.org/why-care-about-artificial-intelligence Hier wird Künstliche Intelligenz als der wichtigste Treiber beschrieben. Viel geben die par dicht mit Text bepackten Folien nicht her. Das als eBook zu bezeichnen ist schon gewagt.

    AIIM AI Automation Process RPA

    AIIM eBook bei PROJECT CONSULT im Download: “Why Care about Artificial Intelligence? A Guide for Adopting AI for Process Improvement” | #AIIM #AI #Automation http://bit.ly/33Q3Txp

    Antwort

Neuen Kommentar verfassen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Ich stimme zu, dass die von mir eingegebenen Daten einschließlich der personenbezogenen Daten an PROJECT CONSULT übermittelt und dort zur Prüfung der Freischaltung meines Kommentars verwendet werden. Bei Veröffentlichung meines Kommentars wird mein Name, jedoch nicht meine E-Mail und meine Webseite, angezeigt. Die Anzeige des Namens ist notwendig, um eine individuelle persönliche Kommunikation zu meinem Beitrag zu ermöglichen. Anonyme oder mit falschen Angaben eingereichte Kommentare werden nicht veröffentlicht. Zu Nutzung, Speicherung und Löschung meiner Daten habe die Datenschutzerklärung zur Kenntnis genommen.

Ich versichere, alle gültigen Vorgaben des Urheberrechts beachtet zu haben. Ich habe keine Bilder, Grafiken, Texte oder Links in meinem Beitrag verwendet, die durch CopyRight, Leistungsschutzrecht oder Urheberrecht geschützt sind. Für den Inhalt meines Kommentars bin ich trotz Prüfung und Freischaltung durch PROJECT CONSULT ausschließlich selbst verantwortlich. Meine Rechte am Beitrag werden bei PROJECT CONSULT nur durch die CC Creative Commons by-nc-nd Vorgaben gewahrt.