Green decoration

Migration von OpenAI zu Apertus

Bringen Sie Ihre OpenAI- oder Anthropic-Integration auf Apertus, das Schweizer Open-Weights-LLM, ohne Qualitätsverlust. Audit, Evaluations-Neuaufbau, Prompt-Umschrift, Benchmark und stufenweiser Wechsel — Schweizer Team.

Was die Migration zu Apertus liefert

Audit des bestehenden Stacks

Wir gehen die produktive OpenAI- oder Anthropic-Integration durch — Prompts, System-Messages, Tool-Use-Schemas, Retry-Verhalten, Rate-Limit-Behandlung, Eval-Sets, den Aufruf-Pfad im Code und die Kostenlinie. Das Audit liefert eine Portierbarkeitskarte je Prompt und eine dokumentierte Basislinie, an der die Migration gemessen wird.

Eval-Set als Migrationsvertrag

Bevor ein Modell gewechselt wird, wird das Eval-Set neu aufgebaut und eingefroren. Reale Produktionseingaben, Soll-Ausgaben, Edge Cases und Regressionsfälle werden zum Vertrag. Zwei Drittel der Arbeit sind Engineering, ein Drittel Evaluation — und die Evaluation entscheidet, wann der Wechsel freigegeben wird.

Prompts für Apertus umschreiben

Prompts, die auf ein bestimmtes Frontier-Modell hin geschrieben wurden, überstehen einen Wechsel nicht immer. Wir schreiben System-Messages, Few-Shot-Beispiele und Tool-Schemas Prompt für Prompt gegen das eingefrorene Eval-Set um. Erreicht ein Prompt die Latte nicht, wird er für einen Fine-Tune markiert.

Side-by-Side-Qualitätsbenchmark

Apertus und der bisherige Anbieter laufen parallel auf denselben Eingaben. Bewertet werden Aufgabenqualität gegen die eingefrorene Rubrik, p50- und p95-Latenz sowie Kosten pro Aufgabe auf Schweizer Hosting. Das Ergebnis ist eine Kosten-pro-Aufgabe-Tabelle, auf der Ihr Team auf realen Zahlen entscheidet.

Shadow-Traffic vor dem Go-Live

Halten die Benchmarks, läuft Apertus parallel zum bisherigen Anbieter auf realen Anfragen, Antworten werden gescort, aber nicht ausgeliefert. Die Shadow-Phase deckt Drift auf, die das Eval-Set nicht fand, und lässt uns Routing, Caching und Tool-Fallbacks gegen Live-Last tunen, bevor ein Nutzer das Modell sieht.

Kontrollierter Cutover mit Rollback

Der Wechsel ist ein definiertes Ereignis, kein Flag-Schalter. Ein Canary-Anteil übernimmt den ersten Live-Traffic, das Eval-Tor greift bei jeder Antwort. Der Vollwechsel folgt erst, wenn der Canary grün bleibt, und ein Rollback auf den bisherigen Anbieter bleibt die ganze Zeit ein Schritt entfernt.

Unser Migrationsweg

Wir kartieren die produktive OpenAI- oder Anthropic-Integration — Prompts, Tool-Schemas, Retries, Eval-Sets, Regressionstests und Kostenlinie — und liefern eine Portierbarkeits-Klassifizierung je Prompt vor jedem Modellwechsel.

Das Eval-Set wird als Migrationsvertrag neu aufgebaut: reale Produktionseingaben, Soll-Ausgaben, Edge Cases, Regressionsfälle. Es wird vor jedem Prompt-Eingriff eingefroren und entscheidet, wann der Wechsel erlaubt ist.

System-Messages, Few-Shot-Beispiele und Tool-Schemas werden Prompt für Prompt gegen das eingefrorene Eval-Set umgeschrieben. Prompts, die die Latte allein durch Umschrift nicht erreichen, werden für einen Fine-Tune markiert.

Apertus und der bisherige Anbieter bewerten dieselben Eingaben Side-by-Side auf Qualität, p50- und p95-Latenz und Kosten pro Aufgabe. Die veröffentlichte Tabelle ist die Lieferung — Ihr CTO und CFO entscheiden auf realen Zahlen.

Apertus läuft parallel zum bisherigen Anbieter auf echten Anfragen, gescort, aber nicht ausgeliefert. Die Phase fängt Drift ab, die das Eval-Set verfehlte, und tunt Routing und Tool-Fallbacks vor jeder Nutzerwirkung.

Ein Canary-Anteil übernimmt den ersten Live-Traffic, das Eval-Tor greift bei jeder Antwort. Der Vollwechsel folgt erst, wenn der Canary grün bleibt; ein Rollback bleibt im gesamten Freeze-Fenster nur einen Schritt entfernt.

Warum das Eval-Set der Vertrag ist

Das Eval-Set ist der Vertrag, nicht das Modell

Viele Migrationen scheitern, weil das Team den Modellwechsel als Lieferung und die Evaluation als Formsache behandelt. Wir drehen das um. Das eingefrorene Eval-Set — reale Produktionseingaben, Soll-Ausgaben, Edge Cases, Regressionsfälle — entscheidet als einziges, wann der Wechsel freigegeben ist. Apertus, der bisherige Anbieter und jedes künftige Modell werden gegen dieselbe Rubrik gemessen. Wer den Vertrag vor der Migration bauen will, findet ihn im bezahlten Apertus-Evaluations-POC.

Zwei Drittel Engineering, ein Drittel Evaluation

A model migration is two-thirds engineering and one-third evaluation. We rebuild the eval set first, freeze it as the contract, and only swap models once the regression suite says the new system meets the old one's quality bar. Diese Aufteilung schützt beide Seiten — Engineering hat ein echtes Ziel, die Evaluation das Budget, um Regression wirklich zu fangen.

Shadow, Canary und Vollwechsel

Der Wechsel ist gestaffelt, nicht geschaltet. Shadow-Traffic lässt Apertus auf echten Anfragen laufen, Antworten werden gescort, aber nicht ausgeliefert — so fangen wir Drift unter Live-Last ab. Ein Canary-Anteil übernimmt anschliessend einen Prozentsatz, das Eval-Tor greift bei jeder Antwort. Der Vollwechsel folgt erst bei grünem Canary.

Wo das im Apertus-Track ansetzt

Die Ziel-Inferenz übernimmt das On-Prem-Apertus-Deployment oder das souveräne Schweizer Hosting. Wo ein Prompt die Latte durch Umschrift nicht erreicht, ergänzen wir ein Fine-Tune hinter dem neuen Prompt. Discovery führt über den Apertus-Hub oder unsere KI-Beratung.

Häufig gestellte Fragen

  • Treiber sind Souveränität, Lieferantenrisiko und Kosten — kein Qualitätsneid. Apertus läuft als Open Weights unter Apache 2.0 auf Schweizer Infrastruktur, sodass Inferenz, Prompts und Logs im Land bleiben. Das beantwortet ein Mandat, das eine US-API nicht erfüllen kann.

Über SAPIENTROQdecoration

ai avatar

Hallo! Ich bin dein KI-Assistent, entwickelt von SAPIENTROQ. Ich bin ein Sprachmodell, das mit einer RAG-Datenbank verbunden ist, die Informationen über unser Unternehmen enthält. Wenn du mehr über KI-Lösungen, reale Anwendungsfälle oder darüber erfahren möchtest, wie KI deinem Unternehmen helfen kann, stelle deine Fragen gerne in der Sprache deiner Wahl.

Wähle eine Option

Hallo! Ich bin ein KI-Agent, entwickelt von SAPIENTROQ 🤖
Decoration
Decoration

Sind Sie an einer Lösung interessiert?

Wir freuen uns, Ihnen die Möglichkeiten unverbindlich aufzuzeigen.

Roland Kurmann

Roland Kurmann

CEO, SAPIENTROQ

Termin buchen

Decoration