Green decoration

OCR Software fur Schweizer Dokumente

Produktionsreife OCR Software fur das Schweizer Back-Office. Zwei-Pass Mistral OCR macht aus Scans, Fotos und gemischten PDFs sauberen Text und strukturierte Zonen — bereit fur Ihre nachgelagerte Extraktion und Ihre ERP- oder PIM-Systeme.

OCR Software, produktisiert

Zwei Durchlaufe statt einem Modellaufruf

Unsere OCR Software arbeitet im Zwei-Pass-Muster mit Mistral OCR. Der erste Durchlauf liefert den Rohtext der Seite. Der zweite Durchlauf liefert strukturierte Zonen: Tabellen, Spalten, Kopfzeilen, Schlussel-Wert-Bloecke. Ein einzelner Modellaufruf wuerde beides zu einer Annahme verschmelzen. Getrennte Durchlaufe geben dem nachgelagerten LLM-Extraktor sowohl die Worte als auch das Layout — und er entscheidet pro Feld, welcher Eingabe er vertraut.

Schweizerdeutsch und deutsche Formulare

Mehrspaltige deutsche Rechnungen, handschriftliche Schweizerdeutsch-Notizen auf Lieferantendatenblaettern und zweisprachige DE/EN-Formulare laufen durch dieselbe OCR-Schicht. Schweizerdeutsch wird auf OCR-Ebene als DE behandelt — kein separates Mundartmodell noetig. Der OCR-Schweiz-Anspruch ist kein Marketing: die Schicht ist gegen die Dokumente gehaertet, die bei Weita und Sanitas Troesch produktiv ankommen.

Scans, Fotos, gemischte PDFs

Echte Dokumente im Schweizer Back-Office sind selten saubere digitale PDFs. Fotografierte Belege, Archivscans mit Durchscheinen, Handy-Aufnahmen von Papierdokumenten, mehrseitige PDFs mit gemischten digitalen und gescannten Seiten. Die OCR-Schicht behandelt jede Eingabeform am selben Kontrakt: Rohtext plus strukturierte Zonen heraus, bereit fur den naechsten Schritt.

OCR-API fur Ihren Extraktor

Die OCR-Schicht ist nicht die Antwort, sondern der Kontrakt zum nachgelagerten Extraktor. Sie laesst sich in unseren S001.1-Klassifikations- und Extraktionsservice einklinken, in unseren S001.2-Feldextraktions-Service oder in Ihren eigenen LLM-Extraktor — der OCR-Pass liefert immer beides: Rohtext und strukturierte Zonen, damit ein Extraktor pro Feld die passende Eingabe waehlt.

Stapel und Echtzeit

Der OCR-Schritt laeuft in einer mehrstufigen Laravel-Job-Queue. Fuer naechtliche Stapellaeufe — Lieferantendatenblatt-Importe, Archiv-Ingest — skalieren Docker-Worker horizontal. Fuer Portal-Uploads, bei denen ein Nutzer wartet, laeuft derselbe Schritt synchron und liefert binnen Sekunden zurueck. Gleicher Codepfad, andere Queue-Prioritaet — keine Gabelung zwischen Stapel und Online.

Schweizer Datenresidenz auf Wunsch

Fuer datensensible Workloads laeuft die OCR-Schicht auf Schweizer Hosting oder on-prem beim Kunden. Wo Dokumenteninhalte die Schweiz oder die EU nicht verlassen duerfen, steht der Apertus-Pfad fuer den Extraktor bereit. Jeder OCR-Pass wird mit Modell-ID und Version protokolliert — die Herkunft des extrahierten Textes ist nachgelagert revisionssicher nachvollziehbar.

Unser Vorgehen

Wir beginnen mit Ihren echten Dokumenten: gescannte Datenblaetter, fotografierte Belege, Archiv-PDFs, zweisprachige Formulare. Wir gleichen ab, was heute im Posteingang ankommt und was Ihr nachgelagertes System tatsaechlich als Eingabe braucht.

Wir fahren das Zwei-Pass-Muster mit Mistral OCR gegen die Stichprobe: zuerst Rohtext, dann strukturierte Zonen. Sie sehen genau, wie die Schicht mit Ihren schwierigsten Dokumenten umgeht — nicht mit einer kuratierten Demo.

Wir definieren, was die OCR-Schicht weiterreicht: Rohtext, strukturierte Zonen, Konfidenzsignale. Damit Ihr bestehender Extraktor oder unser S001.1- bzw. S001.2-Extraktor die Daten ohne nachgelagerte Parsing-Tricks konsumiert.

Wir haengen den OCR-Schritt in Ihre Job-Queue ein — Stapel fuer Hochvolumen-Importe, synchron fuer Portal-Uploads — und uebergeben das Runbook. Die meisten Kunden behalten uns fuer Basis-Support; andere uebernehmen den Betrieb ab Woche eins selbst.

Warum Zwei-Pass-OCR und kein einzelner Modellaufruf

Zwei Durchlaufe geben dem Extraktor eine Wahl

Ein einzelner OCR-Aufruf verschmilzt Worte und Layout zu einer Annahme. Wir fahren zwei Durchlaufe — zuerst Rohtext, dann strukturierte Zonen — und reichen beides an den nachgelagerten Extraktor weiter. Ist ein Feld im Rohstrom mehrdeutig, klaeren die strukturierten Zonen es; verliest sich der Layout-Pass an einer Tabelle, faengt der Rohtext den Wert auf. Die nachgelagerte LLM-Extraktion im OpenAI-JSON-Modus waehlt pro Feld die passende Eingabe, statt mit einem einzigen verrauschten Strom zu kaempfen.

OCR ist eine Schicht, kein Produkt

Cloud-OCR-Anbieter verkaufen den OCR-Aufruf als die Antwort. In Produktion ist er das nicht — er ist der Kontrakt zwischen Papier und Ihrem Extraktor. Weita, Sanitas Troesch und der Insurance-AI-POC behandeln OCR alle als gestaffelten Schritt: Mistral OCR laeuft als ein Job in einer Laravel-Queue, sein Output ist der Input fuer den naechsten Job, HITL kommt erst weiter unten ins Spiel. Wer OCR als Endprodukt verkauft, verdeckt, wo die eigentliche Genauigkeitsarbeit passiert.

Gegen echte Schweizer Dokumente gehaertet

Die OCR-Schicht ist auf die Dokumente abgestimmt, die im Schweizer Back-Office heute tatsaechlich ankommen: gescannte Lieferantendatenblaetter mit handschriftlichen Randnotizen, mehrspaltige deutsche Rechnungen, fotografierte Belege vom Handy, Archiv-PDFs mit Durchscheinen. Schweizerdeutsch wird auf OCR-Ebene als DE behandelt. Allgemeine Schweizerdeutsch-OCR-Versprechen sind Marketing — was zaehlt: die Schicht ist gegen die Dokumente von drei Schweizer Kunden produktiv getestet.

Haeufig gestellte Fragen

  • Schweizerdeutsch wird auf OCR-Ebene als DE behandelt. Die Schicht braucht kein separates Mundartmodell. In Produktion sind die ankommenden Dokumente meist in Standarddeutsch verfasst, mit vereinzelten Schweizerdeutsch-Anteilen — Lieferantennamen, Ortsbezeichnungen, handschriftliche Belege. Das Zwei-Pass-Muster behaelt Rohtext und strukturierte Zonen bei, sodass der nachgelagerte Extraktor Mehrdeutigkeiten ohne CH-spezifisches Modell aufloesen kann.

Über SAPIENTROQdecoration

ai avatar

Hallo! Ich bin dein KI-Assistent, entwickelt von SAPIENTROQ. Ich bin ein Sprachmodell, das mit einer RAG-Datenbank verbunden ist, die Informationen über unser Unternehmen enthält. Wenn du mehr über KI-Lösungen, reale Anwendungsfälle oder darüber erfahren möchtest, wie KI deinem Unternehmen helfen kann, stelle deine Fragen gerne in der Sprache deiner Wahl.

Wähle eine Option

Hallo! Ich bin ein KI-Agent, entwickelt von SAPIENTROQ 🤖
Decoration
Decoration

Sind Sie an einer Lösung interessiert?

Wir freuen uns, Ihnen die Möglichkeiten unverbindlich aufzuzeigen.

Roland Kurmann

Roland Kurmann

CEO, SAPIENTROQ

Termin buchen

Decoration