Zurück zur Übersicht10. Juni 2026

Neue KI-Modelle 2026: Opus 4.8, Fable 5 & Gemini 3.5

Opus 4.8, Fable 5, Gemini 3.5: Was die neue KI-Modellgeneration für KMU bedeutet und warum der 15. Juni 2026 für bestehende KI-Integrationen zählt.

Illustration: Drei leuchtende Kugeln mit immer dichteren neuronalen Netzen, durch Lichtstrahlen verbunden – Sinnbild für die neue Generation der KI-Modelle.

Innerhalb von drei Wochen haben Google und Anthropic ihre bislang stärksten KI-Modelle veröffentlicht: Gemini 3.5 Flash am 19. Mai, Claude Opus 4.8 am 28. Mai und Claude Fable 5 am 9. Juni 2026. Gleichzeitig schaltet Anthropic am 15. Juni ältere Modelle ab. Wer KI bereits im Unternehmen einsetzt, sollte jetzt kurz hinschauen.

Das Wichtigste in Kürze:

Drei große Modell-Releases in nur drei Wochen, so dicht wie nie zuvor
Anthropic schaltet Claude Sonnet 4 und Opus 4 am 15. Juni 2026 ab, bestehende Integrationen müssen migrieren
Sie müssen sich nicht auf einen Anbieter festlegen: Microsoft 365 bietet ab Juli sogar eine Modell-Auswahl zwischen OpenAI und Anthropic

Was ist in den letzten Wochen passiert?

So viele Spitzenmodelle in so kurzer Zeit gab es noch nie. Den Auftakt machte Google auf der Entwicklerkonferenz I/O am 19. Mai 2026: Gemini 3.5 Flash übertrifft laut Google das bisherige Spitzenmodell 3.1 Pro in fast allen Benchmarks, arbeitet viermal schneller und kostet „weniger als die Hälfte des Preises vergleichbarer Modelle". Gemini 3.5 Pro folgt noch im Juni.

Anthropic legte nach: Am 28. Mai erschien Claude Opus 4.8, am 9. Juni folgten Claude Fable 5 und Mythos 5, positioniert als nächste Generation für anspruchsvolle Wissensarbeit und Programmierung. Wichtig für Unternehmen: Fable 5 ist seit dem Start auch über Amazon Bedrock, Google Vertex AI und Microsoft Foundry verfügbar, also in Cloud-Umgebungen, die viele Firmen ohnehin nutzen.

Welches Modell passt zu welcher Aufgabe?

Die Kurzantwort: Es gibt kein bestes Modell, nur das passende für Aufgabe, Budget und Datenschutz-Anforderung. Opus 4.8 kostet laut Claude-Dokumentation 5 US-Dollar pro Million Eingabe-Tokens, Fable 5 das Doppelte. Gemini 3.5 Flash ist auf Tempo und niedrige Kosten ausgelegt. Die Tabelle ordnet die drei Modelle aus KMU-Sicht ein.

Die neue KI-Modellgeneration im Überblick (Stand: 12. Juni 2026)
Modell	Erschienen	Stärke aus KMU-Sicht	Kontextfenster und Besonderheit
Claude Opus 4.8	28. Mai 2026	Umfangreiche Dokumentenanalysen zu moderaten Kosten (5/25 US-Dollar pro Mio. Tokens, Ein-/Ausgabe)	1 Mio. Token Kontext, bis zu 128.000 Token Ausgabe, Wissensstand Jänner 2026
Claude Fable 5	9. Juni 2026	Anspruchsvolle Wissensarbeit und Programmierung (10/50 US-Dollar pro Mio. Tokens, Ein-/Ausgabe)	1 Mio. Token Kontext, Adaptive Thinking dauerhaft aktiv
Gemini 3.5 Flash	19. Mai 2026	Schnelle Routineaufgaben; laut Google viermal schneller und unter halbem Preis vergleichbarer Modelle	k. A.

Welche drei Fachbegriffe sollten Sie kennen?

Sie müssen kein Technik-Profi sein, um die richtigen Fragen zu stellen. Diese drei Begriffe reichen für jedes Gespräch mit Ihrem IT-Dienstleister.

1 Million Token Kontext

Der Kontext ist das Kurzzeitgedächtnis eines KI-Modells, gemessen in Tokens (Wortbausteinen). 1 Million Token heißt praktisch: Sie analysieren einen ganzen Aktenordner in einem Durchgang, etwa alle Verträge, Protokolle und E-Mails eines Projekts gemeinsam, statt jedes Dokument einzeln hochzuladen. Opus 4.8 und Fable 5 bieten beide diese Kapazität.

Adaptive Thinking

Das Modell entscheidet selbst, wie viel Rechenleistung eine Aufgabe braucht. Eine einfache Terminfrage wird sofort beantwortet, eine komplexe Vertragsanalyse bekommt mehr Denkzeit. Vergleichbar mit einer erfahrenen Mitarbeiterin, die Routinefragen aus dem Stand beantwortet und sich für die Jahresplanung einen Nachmittag reserviert. Bei Fable 5 ist diese Funktion dauerhaft aktiv.

Modell-Deprecation

Anbieter schalten ältere Modellversionen nach einer Übergangsfrist ab, ähnlich wie ein Betriebssystem, das keine Updates mehr bekommt. Der Unterschied: Bei KI passiert das deutlich schneller. Anwendungen, die ein abgeschaltetes Modell ansprechen, funktionieren ab dem Stichtag nicht mehr.

Stichtag 15. Juni: Was Betreiber bestehender KI-Integrationen jetzt tun müssen

Laut Anthropics Modell-Übersicht werden Claude Sonnet 4 und Opus 4 am 15. Juni 2026 abgeschaltet, Opus 4.1 folgt am 5. August 2026. Wenn in Ihrem Unternehmen Chatbots, Automatisierungen oder andere KI-Integrationen laufen, hilft diese Checkliste:

Inventur machen: Klären Sie, welche Modelle in Ihren Tools stecken. Fragen Sie Ihren IT-Dienstleister oder Software-Anbieter konkret: Welche Claude-, GPT- oder Gemini-Version nutzt unser Chatbot, unsere Dokumenten-Automatisierung, unser CRM-Add-on?
Migration testen: Stellen Sie betroffene Anwendungen testweise auf den Nachfolger um, etwa von Opus 4 auf Opus 4.8, und prüfen Sie mit echten Beispielaufgaben, ob die Ergebnisse weiter passen.
Kosten neu kalkulieren: Die Nachfolger sind oft günstiger als die alten Modelle. Wie stark die Preise zuletzt gefallen sind, lesen Sie in unserer Analyse zu KI-Kosten 2026: Preisverfall und ROI.

Müssen Sie sich jetzt auf einen Anbieter festlegen?

Nein, im Gegenteil: Die Modellwahl wird zur Dienstleister-Frage, nicht zur Glaubensfrage. Microsoft kündigte am 28. Mai an, dass Microsoft 365 Business mit Copilot ab 1. Juli 2026 eine Modell-Auswahl zwischen OpenAI- und Anthropic-Modellen bietet. Selbst Microsoft legt sich also nicht mehr auf einen einzigen KI-Partner fest. Damit diese Auswahl im Alltag etwas bringt, unterstützen wir Sie mit unserem Copilot Enablement für Microsoft 365.

Für Sie heißt das: Entscheidend ist nicht, welches Logo auf dem Modell steht, sondern ob Ihre Lösung je nach Aufgabe, Budget und Datenschutz-Anforderung das passende Modell nutzt und bei Bedarf wechseln kann. Wie solche KI-Assistenten im Büroalltag konkret arbeiten, zeigt unser Artikel über KI-Agenten im Büro.

Fazit: Beweglich bleiben statt blind wechseln

Die Release-Welle vom Mai und Juni 2026 zeigt zwei Dinge: Die Modelle werden leistungsfähiger und zugleich austauschbarer. Kurzfristig zählt nur der 15. Juni, falls Sie betroffene Claude-Modelle im Einsatz haben. Mittelfristig zählt, dass Ihre KI-Lösungen so gebaut sind, dass ein Modellwechsel kein Großprojekt ist. Sie wissen nicht, welche Modelle bei Ihnen laufen? Wir prüfen das gerne in einem unverbindlichen Erstgespräch: Modell-Check bei NewWays anfragen.

Häufige Fragen

Welches KI-Modell ist das beste für mein Unternehmen?

Es gibt kein bestes Modell für alle Fälle. Die Wahl hängt von Aufgabe, Budget und Datenschutz-Anforderungen ab: Schnelle Routineaufgaben erledigt ein günstiges Modell wie Gemini 3.5 Flash, anspruchsvolle Analysen ein Spitzenmodell wie Claude Fable 5. Plattformen wie Microsoft 365 erlauben künftig den Wechsel zwischen Anbietern. Fragen Sie Ihren IT-Dienstleister nach einer Empfehlung für Ihren Anwendungsfall.

Muss ich jedes neue Modell sofort einsetzen?

Nein. Neue Modelle erscheinen mittlerweile alle paar Monate, und nicht jedes Update bringt für Ihre Anwendungsfälle spürbare Vorteile. Handeln müssen Sie nur in zwei Fällen: wenn ein Modell, das Sie nutzen, abgeschaltet wird, oder wenn ein Nachfolger dieselbe Aufgabe deutlich günstiger oder besser erledigt. Ein jährlicher Modell-Check reicht für die meisten KMU aus.

Was passiert, wenn ein KI-Modell abgeschaltet wird?

Anwendungen, die das Modell direkt ansprechen, funktionieren ab dem Stichtag nicht mehr: Chatbots antworten nicht, automatisierte Abläufe brechen ab. Aktuelles Beispiel: Anthropic schaltet Claude Sonnet 4 und Opus 4 am 15. Juni 2026 ab. Wer rechtzeitig auf den Nachfolger umstellt, merkt davon nichts und profitiert meist sogar von besseren Preisen.