Reasoning Models sind eine Klasse von KI-Sprachmodellen, die komplexe Aufgaben durch schrittweises logisches Nachdenken lösen, anstatt sofort eine Antwort zu generieren. Im Gegensatz zu herkömmlichen LLMs, die auf Basis statistischer Muster direkt antworten, durchlaufen Reasoning Models einen internen Denkprozess – vergleichbar mit dem Vorgehen eines Menschen, der ein Problem erst analysiert, Teilschritte formuliert und dann zur Lösung kommt. Bekannte Beispiele sind OpenAIs o1 und o3, Anthropics Claude mit Extended Thinking sowie Googles Gemini 2.5 mit Thinking-Modus.
Herkömmliche LLMs generieren ihre Antwort Token für Token auf Basis gelernter Wahrscheinlichkeiten. Bei einfachen Fragen („Was ist die Hauptstadt von Frankreich?“) funktioniert das zuverlässig. Bei mehrstufigen Problemen – etwa mathematischen Beweisen, logischen Rätseln oder der Analyse komplexer Sachverhalte – stossen Standard-LLMs jedoch an Grenzen, weil sie keinen strukturierten Denkprozess durchlaufen.
Reasoning Models lösen dieses Problem, indem sie vor der eigentlichen Antwort eine interne Denkkette (Chain of Thought) aufbauen. Das Modell zerlegt die Aufgabe in Teilschritte, prüft Zwischenergebnisse, verwirft fehlerhafte Ansätze und nähert sich schrittweise der Lösung. Dieser Prozess ist vergleichbar mit dem lauten Denken eines Menschen, der ein schwieriges Problem bearbeitet.
Die wichtigsten Mechanismen:
Die wichtigsten Reasoning Models im Überblick (Stand: 2026):
| Modell | Anbieter | Reasoning-Ansatz | Besonderheit |
|---|---|---|---|
| o1 | OpenAI | Internes Chain-of-Thought | Erstes kommerzielles Reasoning Model, versteckter Denkprozess |
| o3 / o4-mini | OpenAI | Erweitertes Reasoning mit Tool-Use | Kann während des Denkens Werkzeuge nutzen (Suche, Code-Ausführung) |
| Claude Opus / Sonnet (Extended Thinking) | Anthropic | Konfigurierbares Denkbudget | Denkprozess teilweise sichtbar, Budget steuerbar |
| Gemini 2.5 (Thinking) | Integrierter Thinking-Modus | Kombiniert Reasoning mit multimodalen Fähigkeiten | |
| DeepSeek R1 | DeepSeek | Open-Source Reasoning | Frei verfügbar, transparenter Denkprozess |
| QwQ | Alibaba (Qwen) | Open-Source Reasoning | Kompaktes Reasoning Model, lokal einsetzbar |
Reasoning Models sind nicht für jede Aufgabe die beste Wahl. Sie benötigen mehr Rechenzeit und verursachen höhere Kosten pro Anfrage. Ihr Vorteil zeigt sich bei Aufgaben, die echtes Nachdenken erfordern:
Für einfache Aufgaben wie das Verfassen einer E-Mail, eine Übersetzung oder eine faktische Kurzantwort ist ein Standard-LLM schneller und kostengünstiger.
Der grundlegende Unterschied lässt sich an einem Beispiel verdeutlichen:
| Eigenschaft | Standard-LLM | Reasoning Model |
|---|---|---|
| Antwortprozess | Direkte Generierung Token für Token | Interner Denkprozess, dann Antwort |
| Antwortzeit | Schnell (Sekunden) | Langsamer (Sekunden bis Minuten) |
| Stärke | Schnelle, flüssige Textgenerierung | Komplexe, mehrstufige Problemlösung |
| Kosten | Geringer pro Anfrage | Höher durch zusätzliche Rechenzeit |
| Typische Aufgabe | E-Mail schreiben, Text zusammenfassen | Beweis führen, Code-Architektur planen |
Chain-of-Thought (CoT) ist die zentrale Technik hinter Reasoning Models. Der Ansatz wurde 2022 in einer Forschungsarbeit von Google beschrieben und hat die Entwicklung dedizierter Reasoning-Modelle massgeblich angestossen.
Das Prinzip: Wenn ein Sprachmodell dazu gebracht wird, seine Gedankenschritte explizit aufzuschreiben, verbessert sich die Genauigkeit bei komplexen Aufgaben erheblich. Ein einfaches Beispiel:
Ohne CoT: „Was ist 17 × 23?“ → Modell antwortet direkt (und liegt möglicherweise falsch)
Mit CoT: „Was ist 17 × 23? Denke Schritt für Schritt.“ → Modell rechnet: „17 × 20 = 340. 17 × 3 = 51. 340 + 51 = 391.“ → korrektes Ergebnis
Reasoning Models automatisieren dieses Prinzip: Sie durchlaufen den Denkprozess intern, ohne dass der Nutzer explizit dazu auffordern muss. Die Modelle wurden so trainiert, dass sie bei komplexen Aufgaben automatisch in den Reasoning-Modus wechseln.
Für Unternehmen sind Reasoning Models dann relevant, wenn Aufgaben über einfache Textgenerierung hinausgehen:
In der Praxis empfiehlt sich ein abgestufter Ansatz: Einfache Aufgaben werden mit Standard-LLMs bearbeitet, komplexe Aufgaben gezielt an Reasoning Models übergeben. Das optimiert sowohl die Kosten als auch die Antwortqualität.
Reasoning Models stellen einen Paradigmenwechsel in der KI-Entwicklung dar: Statt nur die Trainingsdaten zu vergrössern, wird die Rechenzeit bei der Antwortgenerierung gezielt erhöht. Das Ergebnis sind Modelle, die komplexe Probleme strukturiert durchdenken und dabei deutlich genauere Ergebnisse liefern als Standard-LLMs. Für einfache Aufgaben bleiben herkömmliche Sprachmodelle die effizientere Wahl – doch überall dort, wo echtes Nachdenken gefragt ist, setzen Reasoning Models neue Massstäbe.
Die bereitgestellten Informationen dienen ausschließlich der allgemeinen Orientierung. Für Richtigkeit, Vollständigkeit und Aktualität wird keine Gewähr übernommen. Die Inhalte sind nicht rechtsverbindlich und nicht Bestandteil einer Leistungsbeschreibung.