Green decoration

Klassifizieren & Extrahieren

Wir liefern eine produktionsreife Plattform für intelligente Dokumentenverarbeitung im Schweizer Back-Office. PDFs, Scans und E-Mails werden nach Ihrer Taxonomie klassifiziert und in ERP, PIM oder Falldatensystem übergeben. Dieselbe Engine läuft bereits bei Weita und Sanitas.

Suite für intelligente Dokumentenverarbeitung

Produktionsreife IDP, keine reine Demo

Wir liefern eine komplette IDP-Pipeline, die sich in Ihren Stack einfügt. Sie klassifiziert jedes eingehende Dokument, extrahiert die Felder, die Ihre nachgelagerten Systeme erwarten, und stellt eine rollenbasierte Prüfoberfläche bereit. Das Ergebnis sind verlässliche Daten, denen ERP und PIM vertrauen können.

Mehrformat-Eingang ohne Vorsortierung

PDFs, Bild-Scans, Word- und Excel-Anhänge, Lieferantendatenblätter und E-Mail-Inhalte laufen durch denselben Ablauf. Mistral OCR arbeitet in zwei Durchläufen: zuerst Rohtext, dann strukturierter Text. Handgeschriebene Belege und mehrspaltige Rechnungen werden zuverlässig als sauberer Text extrahiert.

KI-Klassifikation nach Ihrer Taxonomie

Die Klassifikation folgt einem vom Administrator definierten Kategoriemodell, nicht starren Regeln. Jede Kategorie legt Dokumenttypen, Pflichtfelder und die Prüfrolle fest. Neue Familien wie Leistungsabrechnung oder Lieferschein sind eine Konfigurationssache. Die KI-Dokumentenklassifizierung folgt Ihrem Schema, nicht umgekehrt.

Strukturierte JSON-Extraktion

Nach der Klassifikation wird jedes Dokument an das passende Extraktionsschema weitergeleitet: Feldblöcke, Felder, Typen, Pflicht- und Optionalkennzeichen. Im JSON-Modus von OpenAI liefert das Modell die Nutzdaten genau in der Struktur, die das nachgelagerte System erwartet. Die Dokumentenextraktion liefert typisiertes JSON.

Rollenbasierte HITL-Prüfung

Extraktionen mit geringer Konfidenz, nicht zugeordnete Kategorien und Policy-Ausnahmen landen in der HITL-Warteschlange bei der zuständigen Rolle. Genehmigte Daten fließen weiter, abgelehnte werden im Prompt-Register als Trainingssignal abgelegt. So bleibt die KI-gestützte Dokumentenverarbeitung verifiziert, nicht bloss angenommen.

Viersprachige Schweiz: DE/EN/FR/IT

Das Schweizer Back-Office ist selten einsprachig. Jede Kategorie, jeder Feldblock und jede Prüfoberfläche bringt DE- und EN-Locales von Haus aus mit. Französisch und Italienisch lassen sich ohne Code-Änderung über das Prompt-Register ergänzen. Ein Lieferantenblatt aus der Romandie, eine Leistungsabrechnung aus Zürich und ein Vertrag aus dem Tessin laufen durch dieselbe Pipeline.

Schweizer Datenresidenz auf Wunsch

Für FINMA-, MDR- und IVDR-sensible Workloads läuft die Engine auf Schweizer Hosting oder on-prem beim Kunden. Mit dem Apertus-Modul steht zusätzlich ein souveräner LLM-Pfad bereit — Inhalte verlassen die Schweiz oder die EU nicht. Jede Klassifikations- und Extraktionsentscheidung wird revisionssicher protokolliert.

Unser Vorgehen

Wir beginnen mit Ihren Dokumenten: Stichproben je Familie, das nachgelagerte System, das die Daten weiterverarbeitet, und die Rollen mit Prüfverantwortung. Daraus leiten wir das Kategorieschema, die Feldblöcke und die Erfolgskriterien für den Piloten ab.

Wir setzen die Pipeline für diese Familie durchgängig auf: Einlesen, Klassifizieren, Extrahieren, menschliche Prüfung und Weiterleitung. Weita und Sanitas sind genau so gestartet. Die Treffsicherheit belegen wir mit Ihren eigenen Daten.

Wir passen die Prüfoberfläche an Ihre Rollen an: wer sieht und bearbeitet welche Felder, wann eskaliert das System, wohin geht die Übergabe. Rückmeldungen der Prüfer wirken sich noch am selben Tag im System aus.

Sobald die erste Familie stabil läuft, erweitern wir die Taxonomie: neue Kategorien, neue Feldblöcke, neue Nutzer. Weil die Dokumentenklassifizierung dem vom Administrator definierten Schema folgt, ist jede weitere Familie ein reiner Konfigurationsschritt.

Wir übergeben den Zugang zum Prompt-Register, die Rollenleitfäden und das Monitoring-Dashboard für Genauigkeitsabweichungen. Die meisten Kunden behalten uns für Basis-Support; andere übernehmen den Betrieb vollständig im eigenen Haus. Die Pipeline läuft auch ohne uns.

Diese Engine, kein generisches IDP

Sie kontrollieren das Schema, nicht der Anbieter

Die meisten IDP-Produkte bringen ihre eigene Taxonomie mit und zwingen Sie, Ihre Daten daran auszurichten. Wir drehen es um: Ihr Modell aus Kategorien und Feldblöcken ist die Spezifikation, an die sich die KI bindet. Fügt das operative Team im sechsten Monat eine neue Familie hinzu, konfigurieren Sie das selbst — kein Ticket beim Anbieter.

Auf Schweizer Anforderungen gebaut, nicht nachgerüstet

Weita, Sanitas Troesch und der Insurance-AI-POC laufen mit derselben Engine in Schweizer Back-Office-Umgebungen. Zweisprachige EN/DE-Verarbeitung von Haus aus. Mistral OCR liefert den Two-Pass-Klassifikator. Die Editieroberfläche für die Dokumentenextraktion basiert auf Reverb, unserem internen Editor-Stack.

HITL wo nötig, Automatisierung wo möglich

Wir tun nicht so, als wäre das Modell zu 100 % korrekt. Extraktionen mit geringer Konfidenz und nicht zugeordnete Kategorien landen in der rollenbasierten Prüf-Warteschlange; Freigaben fliessen zurück ins Prompt-Register. Routinedokumente mit hoher Konfidenz überspringen die Warteschlange.

Eine Engine, drei bewährte Branchen

Dieselbe Architektur trägt das Grosshandels-PIM bei Weita, das Bau-Onboarding bei Sanitas Troesch und die Versicherungsschäden im POC. Neue Branchen erben das fertige Muster — sie erweitern die Engine, statt sie neu zu bauen.

Revisionssicher von Anfang an

Jeder Schritt wird protokolliert: Kategorie, Prompt-Version, Modell-ID, Freigabe-Rolle. Der Audit-Pfad ist Standard, nicht nachträglich angefügt. Für FINMA-, MDR- und IVDR-sensible Kunden ist die DSGVO-Konfiguration Teil der Deployment-Vorlage — inklusive nachvollziehbarer Provenienz der Dokumentenklassifizierung.

Häufig gestellte Fragen

  • OCR wandelt Dokumentenbilder in Zeichen um. Intelligente Dokumentenverarbeitung geht weiter: Sie ordnet das Dokument einer fachlichen Kategorie zu (Rechnung, Bestellung, Lieferschein), extrahiert die Felder und schickt Ausnahmen an den richtigen Prüfer. OCR ist im IDP der erste Schritt.

Über SAPIENTROQdecoration

ai avatar

Hallo! Ich bin dein KI-Assistent, entwickelt von SAPIENTROQ. Ich bin ein Sprachmodell, das mit einer RAG-Datenbank verbunden ist, die Informationen über unser Unternehmen enthält. Wenn du mehr über KI-Lösungen, reale Anwendungsfälle oder darüber erfahren möchtest, wie KI deinem Unternehmen helfen kann, stelle deine Fragen gerne in der Sprache deiner Wahl.

Wähle eine Option

Hallo! Ich bin ein KI-Agent, entwickelt von SAPIENTROQ 🤖
Decoration
Decoration

Sind Sie an einer Lösung interessiert?

Wir freuen uns, Ihnen die Möglichkeiten unverbindlich aufzuzeigen.

Roland Kurmann

Roland Kurmann

CEO, SAPIENTROQ

Termin buchen

Decoration