Share­Point Syntex Setup: Modell­typen für das Verständnis von Inhalten

|

Mit Share­Point Syntex will Micro­soft Firmen helfen, vorhan­denes Wissen zu identi­fi­zieren, zu organi­sieren und im passenden Kontext bereit­zu­stellen. Für das Verständnis von Inhalten bietet die Anwen­dung zwei Arten von KI-Modellen: Formu­lar­ver­ar­bei­tung für Bilder und semi-struk­tu­rierte Inhalte sowie Dokument­ver­ständnis für unstruk­tu­rierte Inhalte. 

Share­Point Syntex ist seit Anfang Oktober 2020 als Add-on für Firmen mit Micro­soft 365 E3- und E5-Lizenzen verfügbar. Ziel von Syntex ist es, die Inhalte von Share­Point neu zu erschließen, das Fachwissen einzelner Personen zu erfassen und es anderen Mitar­bei­tern im Unter­nehmen bereit­zu­stellen. Die Anwen­dung kann Dokumente automa­tisch analy­sieren und klassi­fi­zieren. Das funktio­niert über eine trainier­bare KI (Machine Teaching), die wichtige Metadaten in Dokumenten findet und entspre­chend einordnet.

Für die Analyse von Inhalten können Firmen KI-Modelle zum Lesen von Dokumenten entwi­ckeln, die Algorithmen zur Klassi­fi­zie­rung und Extrak­tion von Daten enthalten und Metadaten automa­tisch zuweisen. Share­Point Syntex nutzt diese KI-Modelle zur Verar­bei­tung von drei Haupt­typen von Inhalten: digitalen Bildern, struk­tu­rierten oder semistruk­tu­rierten Formu­laren und unstruk­tu­rierten Dokumenten wie Handbü­cher oder Verträge. Es gibt zwei Modelltypen:

  • Formu­lar­ver­ar­bei­tung: Bei Bildern und semi-struk­tu­rierten Inhalten kommt der Modelltyp Formu­lar­ver­ar­bei­tung zum Einsatz, der mit Hilfe der Power-App-Funktion AI Builder aus einer einzigen Dokument­bi­blio­thek erstellt wird.
  • Dokument­ver­ständnis: Dieses Modell für unstruk­tu­rierte Inhalte wird im Inhalts­center von Share­Point Syntex aufge­baut und lässt sich auf mehrere Biblio­theken anwenden.

Setup Modelltyp Dokumentverständnis

Zentraler Ort für das Erstellen von Modellen für Dokument­ver­ständnis ist das Inhalts­center von Share­Point. Dort können Nutzer über die grafi­sche Oberfläche und mit Hilfe von Assis­tenten entweder neue Inhalts­typen erzeugen oder vorhan­dene Inhalts­typen wie Kaufver­trag oder Brief verwenden, um das entspre­chende Modell zu definieren. Ein Share­Point-Inhaltstyp stellt eine Kategorie von Dokumenten dar, die gemein­same Merkmale aufweisen, etwa eine Reihe von Spalten oder Metadaten-Eigen­schaften für einen bestimmten Inhalt.

Modelle zum Dokument­ver­ständnis erkennen in unstruk­tu­rierten Dokumenten wie etwa Verträgen oder Briefen bestimmte Muster oder Phrasen. Sie bestimmen automa­tisch den Dateityp (Klassi­fi­zie­rung) der identi­fi­zierten Textstellen als auch die Infor­ma­tionen, die extra­hiert werden sollen (Extrak­toren). Ein Beispiel wäre ein Modell zur Auswer­tung von Verträgen, um später etwa den Namen des Kunden, Termine, die verein­barten Kondi­tionen, Gebühren oder das Ablauf­datum zu erkennen und diese Infor­ma­tionen später aus diesen Verträgen zu extrahieren.

Ist das Modell fertig, erfolgt im nächsten Schritt das Training und Testen der Klassi­fi­ka­toren und Extrak­toren des Modells mit Hilfe von positiven und negativen Beispiel­da­teien. Einmal trainiert, sind die Modelle in der Lage, Verträge und andere Dokumente in Share­Point-Dokumen­ten­bi­blio­theken automa­ti­siert zu identi­fi­zieren und zu klassi­fi­zieren. Die Auswahl / das Setup der Dokument­bi­blio­thek erfolgt auf der Start­seite des Modells auf der Kachel Modell auf Biblio­theken anwenden über die Option Modell veröf­fent­li­chen oder im Abschnitt Biblio­theken mit diesem Modell über +Neue Biblio­thek hinzu­fügen.

Die Modelle erkennen auch Felder wie das Datum und können diese Infor­ma­tionen aus den besagten Biblio­theken oder Dokumenten extra­hieren. So ist es dann beispiels­weise möglich, die Namen der jewei­ligen Vertrags­partner herzaus­zu­fil­tern oder mit Hilfe von Power Automate Workflows einzu­richten, die einen Vertrag bei bestimmten Kondi­tionen automa­ti­siert zur Freigabe an einen Vorge­setzten weiterleiten.

Setup Modelltyp Formularverarbeitung

Modelle für die Formu­lar­ver­ar­bei­tung lassen sich mit Hilfe der Micro­soft Power­Apps AI Builder direkt in einer Share­Point-Dokument­bi­blio­thek erstellen. Sie nutzen Machine Teaching, um beispiels­weise Schlüssel-Wert-Paare oder Tabel­len­daten aus struk­tu­rierten oder teilstruk­tu­rierten Dokumenten wie Formu­laren und Rechnungen zu identi­fi­zieren und extrahieren.

Ein mögli­ches Einsatz­sze­nario: Unter­nehmen erhalten Rechnungen per Post, Fax, E‑Mail oder auf anderen Wegen. Die Verar­bei­tung dieser Dokumente und die manuelle Eingabe der Infor­ma­tionen in eine Daten­bank kosten viel Zeit. Die Formu­lar­ver­ar­bei­tung automa­ti­siert diesen Vorgang durch den Einsatz von maschi­nellem Lernen zum Extra­hieren von Text, Zahlen etc. aus diesen Rechnungen. Auf diese Weise lassen sich auch Rechnungen nachver­folgen und überwachen.

Wichtig: Der Adminis­trator muss die Formu­lar­ver­ar­bei­tung in einer Share­Point-Dokument­bi­blio­thek aktivieren, damit lizen­zierte Benutzer sie einsetzen können. Ist dies der Fall, wählen Sie in der Dokumen­ten­bi­blio­thek das Menü Automa­ti­sieren, dann AI Builder und Formu­lar­ver­ar­bei­tungs­mo­dell erstellen. Dabei wird wie beim Dokument­ver­ständnis ebenfalls ein neuer Share­Point-Inhaltstyp erzeugt.

Im nächsten Schritt öffnet der Browser eine neue Seite im Power Apps AI Builder, um Beispiel­da­teien hinzu­zu­fügen und zu analy­sieren, um das Modell zu trainieren. Es lernt den Aufbau der Dokumente und definiert die Infor­ma­tionen und Felder, die aus ähnli­chen Formu­laren künftig extra­hiert werden sollen. Formu­lare weisen meist eine ähnliche Struktur auf und enthalten Infor­ma­tionen wie Steuer­nummer oder Rechnungs­nummer oft an derselben Stelle. Nach der Analyse der Dokumente werden die gefun­denen Felder angezeigt und Sie können dieje­nigen auswählen, die Sie speichern wollen. Anschlie­ßend lässt sich das Modell über die Seite Modell­zu­sam­men­fas­sung über den Klick auf Trainieren testen und weiter trainieren. Auch Schnell­tests sind möglich.

Nachdem Sie das Modell trainiert und über die entspre­chende Schalt­fläche veröf­fent­licht haben, erstellt das Modell einen Power Automa­tion-Ablauf. Dieser Prozess wird ausge­führt, wenn die Nutzer eine Datei in die Share­Point-Dokument­bi­blio­thek hochladen, und extra­hiert Daten, die im Modell als Inhaltstyp erkannt wurden. Die extra­hierten Daten werden in der Dokument­bi­blio­theks-Ansicht des Modells dann in Spalten angezeigt.

Weitere Infor­ma­tionen zu den KI-Modellen von Share­Point Syntex zum Verständnis von Inhalten finden Sie hier.

Rückfragen zum Thema? Oder ein anderes Anliegen? Nehmen Sie Kontakt mit uns auf, wir unter­stützen Sie gerne.

 

Blog Autor



Kontakt zur netunite AG

Ihr Anliegen. Unsere Experten. Erleben Sie netunite. Wir freuen uns auf Ihre Anfrage.
Gerne sind wir auch telefonisch unter 089/8906599-0 oder per E-Mail unter info@netunite.eu für Sie erreichbar.

netunite AG
Lindwurmstraße 97
80337 München

    Pflichtfeld
    Pflichtfeld
     
    Pflichtfeld
     
    Pflichtfeld