Share­Point Syntex Setup: Modell­typen für das Verständnis von Inhalten

|

Mit Share­Point Syntex will Micro­soft Firmen helfen, vorhan­denes Wissen zu identi­fi­zieren, zu organi­sieren und im passenden Kontext bereit­zu­stellen. Für das Verständnis von Inhalten bietet die Anwen­dung zwei Arten von KI-Modellen: Formu­lar­ver­ar­bei­tung für Bilder und semi-struk­tu­rierte Inhalte sowie Dokument­ver­ständnis für unstruk­tu­rierte Inhalte. 

Share­Point Syntex ist seit Anfang Oktober 2020 als Add-on für Firmen mit Micro­soft 365 E3- und E5-Lizenzen verfügbar. Ziel von Syntex ist es, die Inhalte von Share­Point neu zu erschließen, das Fachwissen einzelner Personen zu erfassen und es anderen Mitar­bei­tern im Unter­nehmen bereit­zu­stellen. Die Anwen­dung kann Dokumente automa­tisch analy­sieren und klassi­fi­zieren. Das funktio­niert über eine trainier­bare KI (Machine Teaching), die wichtige Metadaten in Dokumenten findet und entspre­chend einordnet.

Für die Analyse von Inhalten können Firmen KI-Modelle zum Lesen von Dokumenten entwi­ckeln, die Algorithmen zur Klassi­fi­zie­rung und Extrak­tion von Daten enthalten und Metadaten automa­tisch zuweisen. Share­Point Syntex nutzt diese KI-Modelle zur Verar­bei­tung von drei Haupt­typen von Inhalten: digitalen Bildern, struk­tu­rierten oder semistruk­tu­rierten Formu­laren und unstruk­tu­rierten Dokumenten wie Handbü­cher oder Verträge. Es gibt zwei Modelltypen:

  • Formu­lar­ver­ar­bei­tung: Bei Bildern und semi-struk­tu­rierten Inhalten kommt der Modelltyp Formu­lar­ver­ar­bei­tung zum Einsatz, der mit Hilfe der Power-App-Funktion AI Builder aus einer einzigen Dokument­bi­blio­thek erstellt wird.
  • Dokument­ver­ständnis: Dieses Modell für unstruk­tu­rierte Inhalte wird im Inhalts­center von Share­Point Syntex aufge­baut und lässt sich auf mehrere Biblio­theken anwenden.

Setup Modelltyp Dokumentverständnis

Zentraler Ort für das Erstellen von Modellen für Dokument­ver­ständnis ist das Inhalts­center von Share­Point. Dort können Nutzer über die grafi­sche Oberfläche und mit Hilfe von Assis­tenten entweder neue Inhalts­typen erzeugen oder vorhan­dene Inhalts­typen wie Kaufver­trag oder Brief verwenden, um das entspre­chende Modell zu definieren. Ein Share­Point-Inhaltstyp stellt eine Kategorie von Dokumenten dar, die gemein­same Merkmale aufweisen, etwa eine Reihe von Spalten oder Metadaten-Eigen­schaften für einen bestimmten Inhalt.

Modelle zum Dokument­ver­ständnis erkennen in unstruk­tu­rierten Dokumenten wie etwa Verträgen oder Briefen bestimmte Muster oder Phrasen. Sie bestimmen automa­tisch den Dateityp (Klassi­fi­zie­rung) der identi­fi­zierten Textstellen als auch die Infor­ma­tionen, die extra­hiert werden sollen (Extrak­toren). Ein Beispiel wäre ein Modell zur Auswer­tung von Verträgen, um später etwa den Namen des Kunden, Termine, die verein­barten Kondi­tionen, Gebühren oder das Ablauf­datum zu erkennen und diese Infor­ma­tionen später aus diesen Verträgen zu extrahieren.

Ist das Modell fertig, erfolgt im nächsten Schritt das Training und Testen der Klassi­fi­ka­toren und Extrak­toren des Modells mit Hilfe von positiven und negativen Beispiel­da­teien. Einmal trainiert, sind die Modelle in der Lage, Verträge und andere Dokumente in Share­Point-Dokumen­ten­bi­blio­theken automa­ti­siert zu identi­fi­zieren und zu klassi­fi­zieren. Die Auswahl / das Setup der Dokument­bi­blio­thek erfolgt auf der Start­seite des Modells auf der Kachel Modell auf Biblio­theken anwenden über die Option Modell veröf­fent­li­chen oder im Abschnitt Biblio­theken mit diesem Modell über +Neue Biblio­thek hinzu­fügen.

Die Modelle erkennen auch Felder wie das Datum und können diese Infor­ma­tionen aus den besagten Biblio­theken oder Dokumenten extra­hieren. So ist es dann beispiels­weise möglich, die Namen der jewei­ligen Vertrags­partner herzaus­zu­fil­tern oder mit Hilfe von Power Automate Workflows einzu­richten, die einen Vertrag bei bestimmten Kondi­tionen automa­ti­siert zur Freigabe an einen Vorge­setzten weiterleiten.

Setup Modelltyp Formularverarbeitung

Modelle für die Formu­lar­ver­ar­bei­tung lassen sich mit Hilfe der Micro­soft Power­Apps AI Builder direkt in einer Share­Point-Dokument­bi­blio­thek erstellen. Sie nutzen Machine Teaching, um beispiels­weise Schlüssel-Wert-Paare oder Tabel­len­daten aus struk­tu­rierten oder teilstruk­tu­rierten Dokumenten wie Formu­laren und Rechnungen zu identi­fi­zieren und extrahieren.

Ein mögli­ches Einsatz­sze­nario: Unter­nehmen erhalten Rechnungen per Post, Fax, E‑Mail oder auf anderen Wegen. Die Verar­bei­tung dieser Dokumente und die manuelle Eingabe der Infor­ma­tionen in eine Daten­bank kosten viel Zeit. Die Formu­lar­ver­ar­bei­tung automa­ti­siert diesen Vorgang durch den Einsatz von maschi­nellem Lernen zum Extra­hieren von Text, Zahlen etc. aus diesen Rechnungen. Auf diese Weise lassen sich auch Rechnungen nachver­folgen und überwachen.

Wichtig: Der Adminis­trator muss die Formu­lar­ver­ar­bei­tung in einer Share­Point-Dokument­bi­blio­thek aktivieren, damit lizen­zierte Benutzer sie einsetzen können. Ist dies der Fall, wählen Sie in der Dokumen­ten­bi­blio­thek das Menü Automa­ti­sieren, dann AI Builder und Formu­lar­ver­ar­bei­tungs­mo­dell erstellen. Dabei wird wie beim Dokument­ver­ständnis ebenfalls ein neuer Share­Point-Inhaltstyp erzeugt.

Im nächsten Schritt öffnet der Browser eine neue Seite im Power Apps AI Builder, um Beispiel­da­teien hinzu­zu­fügen und zu analy­sieren, um das Modell zu trainieren. Es lernt den Aufbau der Dokumente und definiert die Infor­ma­tionen und Felder, die aus ähnli­chen Formu­laren künftig extra­hiert werden sollen. Formu­lare weisen meist eine ähnliche Struktur auf und enthalten Infor­ma­tionen wie Steuer­nummer oder Rechnungs­nummer oft an derselben Stelle. Nach der Analyse der Dokumente werden die gefun­denen Felder angezeigt und Sie können dieje­nigen auswählen, die Sie speichern wollen. Anschlie­ßend lässt sich das Modell über die Seite Modell­zu­sam­men­fas­sung über den Klick auf Trainieren testen und weiter trainieren. Auch Schnell­tests sind möglich.

Nachdem Sie das Modell trainiert und über die entspre­chende Schalt­fläche veröf­fent­licht haben, erstellt das Modell einen Power Automa­tion-Ablauf. Dieser Prozess wird ausge­führt, wenn die Nutzer eine Datei in die Share­Point-Dokument­bi­blio­thek hochladen, und extra­hiert Daten, die im Modell als Inhaltstyp erkannt wurden. Die extra­hierten Daten werden in der Dokument­bi­blio­theks-Ansicht des Modells dann in Spalten angezeigt.

Weitere Infor­ma­tionen zu den KI-Modellen von Share­Point Syntex zum Verständnis von Inhalten finden Sie hier.

Rückfragen zum Thema? Oder ein anderes Anliegen? Nehmen Sie Kontakt mit uns auf, wir unter­stützen Sie gerne.

 

Blog Autor



Kontakt zur netunite AG

Ihr Anliegen. Unsere Experten. Erleben Sie netunite. Wir freuen uns auf Ihre Anfrage.
Gerne sind wir auch telefonisch unter 089/8906599-0 oder per E-Mail unter info@netunite.eu für Sie erreichbar.

netunite AG
Lindwurmstraße 97
80337 München

    Pflichtfeld
    Pflichtfeld
     
    Pflichtfeld
     
    Pflichtfeld

    Um unsere Webseite für Sie optimal zu gestalten und fortlaufend verbessern zu können, verwenden wir Cookies. Durch die weitere Nutzung der Webseite stimmen Sie der Verwendung von Cookies zu. Weitere Informationen zu Cookies erhalten Sie in unserer Datenschutzerklärung. Akzeptieren