KI Tech-InsightsDigitale Trends
12 Minuten
15. Juni 2026

Die 4 Stufen der KI: von der Cloud-KI bis zur selbstreplizierenden Maschine

Kamil Gawlik
Autor
Kamil Gawlik

KI- und Digital-Experte bei DigiRift

Die 4 Stufen der KI als Eskalation: von Cloud-KI über agentische Systeme bis zum humanoiden Roboter in der Fertigung

Es ist 6:40 Uhr an einem Dienstag im März, als Sandra Berg, Geschäftsführerin eines Maschinenbau-Zulieferers mit 42 Mitarbeitern im Schwäbischen, ihren ersten Kaffee an den Schreibtisch stellt. Auf ihrem Bildschirm liegen drei Dinge nebeneinander, die sie aus dem Tritt bringen, und sie kann die Schlagzeilen über die Stufen der KI nicht mehr sortieren. Eine Mail ihres Sohnes mit dem Betreff "Mama, schau mal was die KI gebaut hat", ein LinkedIn-Beitrag eines Wettbewerbers über humanoide Roboter in der Fertigung, und die Tagesschau-Push, dass ein KI-Modell einen Denksport-Test bestanden hat, an dem Maschinen jahrelang gescheitert sind.

Sandra ist keine Technikfeindin. Aber sie hat das Gefühl, dass sich gerade etwas verschiebt, das sie nicht mehr greifen kann. Ist KI das Ding, das ihr Sohn am Wochenende ausprobiert? Oder das, was bald ihre Werkshalle umkrempelt? Genau hier setzt dieser Artikel an. Wer die Stufen der KI versteht, hört auf, jede Schlagzeile als Einzelereignis zu lesen, und sieht stattdessen eine Entwicklung mit klarer Richtung. Wir beschreiben vier Stufen eskalierender KI-Autonomie, ordnen sie in zwei etablierte Forschungs-Frameworks ein und zeigen anhand realer Beispiele aus den Jahren 2024 bis 2026, wo wir heute wirklich stehen.

Treppendiagramm der 4 Stufen der KI mit wachsender Autonomie von Cloud-KI bis verkörperter Roboter-KI
Die vier Stufen der KI von Cloud-KI bis verkörperter Maschine, geordnet nach wachsender Autonomie.

Warum wir die Stufen der KI überhaupt brauchen

Die Stufen der KI sind ein Ordnungsmodell, das beschreibt, wie viel eine KI selbstständig tut, statt nur auf Befehl zu reagieren. Je höher die Stufe, desto weniger menschliche Hand am Steuer. Genau diese Achse, die Autonomie, macht den Unterschied zwischen einem Werkzeug und einem Akteur.

Dass dieser Ordnungsbedarf real ist, zeigt die Verbreitung. Laut McKinsey & Company (2024) setzten Anfang 2024 bereits 65 Prozent der befragten Organisationen generative KI regelmäßig in mindestens einer Geschäftsfunktion ein, fast doppelt so viele wie zehn Monate zuvor. Im DACH-Raum berichtet Bitkom (2025), dass 2025 rund 36 Prozent der deutschen Unternehmen KI nutzen, eine Verdopplung gegenüber 20 Prozent im Vorjahr.

Bevor wir die vier Stufen aufschlüsseln, zwei Landkarten aus der Forschung. OpenAI hat ein Modell mit fünf Stufen auf dem Weg zur AGI skizziert, von Chatbots über selbstständige Agenten bis zu Systemen, die ganze Organisationen steuern könnten. Unabhängig davon definiert Google DeepMind (2024) in seinem peer-reviewten Framework "Levels of AGI" sechs Fähigkeitsstufen, von Level 0 ohne KI bis Level 5 "Superhuman". Wichtig für die ehrliche Einordnung: DeepMind verortet heutige Spitzenmodelle wie ChatGPT oder Gemini bei "Level 1 Emerging AGI". Wir stehen also näher am Anfang als am Ende, auch wenn die Schlagzeilen anderes suggerieren.

Stufe 1: Generative KI in der Cloud, das Werkzeug auf Abruf

Stufe 1 ist die KI, die heute fast jeder kennt. Ein Sprachmodell läuft in einem fernen Rechenzentrum und erzeugt auf Eingabe hin Text, Code, Bilder oder Antworten. Der Mensch stellt die Frage, die Maschine liefert, der Mensch entscheidet. Es ist ein Werkzeug, kein Akteur. Weil dieses Werkzeug als Mietleistung aus der Cloud kommt, lohnt sich früh der Blick auf Kosten und Datenhoheit, den wir im Beitrag zu eigener KI-Infrastruktur statt SaaS-Abos vertiefen.

In der Autonomie-Logik von DeepMind entspricht das der Stufe "KI als Werkzeug": Sie verstärkt menschliche Fähigkeiten, handelt aber nicht eigenständig. Genau hier sitzt der Löwenanteil dessen, was Unternehmen heute produktiv nutzen, und es ist die Stufe mit dem schnellsten Praxis-Effekt. Ein Telefonbot, der in einer Tierarztpraxis Termine annimmt, oder ein Chatbot im Kundensupport sind klassische Stufe-1-Anwendungen mit klarem Geschäftsnutzen. Wie so ein Voicebot konkret im Alltag wirkt, zeigen wir am Beispiel im Beitrag zum KI-Telefonbot in der Tierarztpraxis.

Die ehrliche Einordnung gehört dazu. Stufe-1-Systeme sind beeindruckend im Erzeugen, aber sie haben kein Gedächtnis über den Auftrag hinaus, planen nicht selbstständig und handeln nicht ohne Anstoß. Sie sind der Hammer, nicht der Zimmermann. Und der Hammer wird von einem Dienstleister geführt, der weiß, wo der Nagel hingehört, nicht vom Endkunden, der ihn nebenbei bedienen soll.

Stufe 2: KI, die sich selbst verbessert

Stufe 2 beginnt dort, wo die KI nicht mehr nur antwortet, sondern aus ihrem eigenen Tun lernt und ihre Lösung während des Denkens optimiert. Das Stichwort heißt Test-Time-Compute: Das Modell darf sich vor der Antwort Zeit nehmen, mehrere Lösungswege durchspielen und den besten auswählen, statt blind das erste Ergebnis auszuspucken.

Der Sprung ist messbar und dramatisch. Auf dem ARC-AGI-Test, der gezielt neuartige Denkaufgaben stellt, an denen Sprachmodelle traditionell scheitern, dokumentiert die ARC Prize Foundation (2024), dass das Reasoning-Modell OpenAI o3 im Dezember 2024 75,7 Prozent in einer rechenarmen und 87,5 Prozent in einer rechenintensiven Konfiguration erreichte. Letztere nutzte 1.024 Lösungsversuche pro Aufgabe und damit das 172-Fache an Rechenleistung. Zum Vergleich: Derselbe Test brauchte vier Jahre, um von 0 Prozent mit GPT-3 im Jahr 2020 auf 5 Prozent mit GPT-4o im Jahr 2024 zu klettern.

Balkendiagramm zu Stufe 2 der Stufen der KI: ARC-AGI-Sprung von 0 Prozent 2020 auf 87,5 Prozent 2024
ARC-AGI-1-Werte laut ARC Prize Foundation, Vendor-Benchmark; zeigt den Stufe-2-Sprung durch Test-Time-Compute.

Diese Zahlen stammen von einem Benchmark-Anbieter und sind als solche zu lesen, kein unabhängiger Wirtschaftsprüfer hat sie bestätigt. Trotzdem markieren sie einen echten Qualitätssprung beim maschinellen Schlussfolgern. Praktisch bedeutet Stufe 2 für Unternehmen: Aufgaben, die echtes Durchdenken erfordern, etwa das Prüfen widersprüchlicher Vertragsklauseln oder das Debuggen von Code, rücken in Reichweite. Die KI wird vom schnellen Antworter zum gründlichen Bearbeiter, der allerdings mit jedem zusätzlichen Denkschritt mehr Rechenkosten verursacht. Mehr Qualität gegen mehr Compute, das ist der nüchterne Deal dieser Stufe.

Stufe 3: Agentische KI mit eigener Infrastruktur

Stufe 3 ist der Punkt, an dem KI vom Bearbeiter zum Orchestrator wird. Eine agentische KI bekommt Zugriff auf Werkzeuge, ruft selbstständig Programme auf, schreibt und testet Code, verwaltet Cloud-Ressourcen und steuert ganze Arbeitsabläufe, ohne dass ein Mensch jeden Schritt freigibt. Sie verwaltet einen Teil ihrer eigenen digitalen Umgebung.

In den Forschungs-Frameworks ist das die Region der höheren Autonomiestufen, bei DeepMind die Bewegung vom Kollaborator hin zur Stufe "KI als Agent". Dass dies kein reines Laborthema mehr ist, zeigt die DACH-Forschung sehr konkret: Fraunhofer IAIS (2026) führt mit dem "Agentic Level" eigens ein Konzept ein, mit dem Organisationen bewerten können, ob ein System schon als KI-Agent gilt und welche Chancen und Risiken damit verbunden sind. Dass Forschungsinstitute ein eigenes Reifegrad-Modell für autonome Agenten entwickeln, ist ein deutliches Signal, dass diese Systeme den Sprung von der Demo in die Unternehmens-IT antreten.

Ein konkretes, heute nutzbares Beispiel ist Claude Code, das agentische Entwicklungswerkzeug von Anthropic. Es liest eine Codebasis, plant Änderungen, führt Befehle aus und korrigiert sich selbst, ein Werkzeug, das wir bei DigiRift im Arbeitsalltag einsetzen, um KI-Software für Kunden schneller und robuster zu bauen. Was Stufe-3-Autonomie konkret für die IT-Strategie eines Unternehmens bedeutet, etwa die Frage nach eigener Rechenleistung statt reiner Cloud-Mieten, vertiefen wir im Beitrag zu eigener KI-Infrastruktur statt SaaS-Abos.

Die ehrliche Kehrseite: Mehr Autonomie heißt mehr Verantwortung beim Aufsetzen. Eine agentische KI, die Tools selbst ausführt, braucht klare Leitplanken, Berechtigungsgrenzen und menschliche Kontrollpunkte, sonst automatisiert sie auch Fehler im großen Stil. Genau deshalb ist diese Stufe nichts zum Nebenbei-Basteln.

Stufe 4: Verkörperte KI, die sich verteilt und repliziert

Stufe 4 ist die spekulativste und zugleich greifbarste: KI verlässt den Bildschirm und bekommt einen Körper. Verkörperte KI steuert Roboter, die in der physischen Welt handeln, und in der Endausbaustufe könnten solche Systeme sich über viele Maschinen verteilen und ihre Fähigkeiten replizieren. Hier endet die Software, hier beginnt die Hardware mit eigenem Handlungsspielraum.

Was nach Science-Fiction klingt, hat 2024 die Fabrikhalle erreicht. Laut der gemeinsamen Mitteilung von Figure AI und BMW (2024) vereinbarten beide Unternehmen im Januar 2024, humanoide Allzweckroboter im BMW-Werk Spartanburg für schwierige, unsichere oder monotone Fertigungsschritte einzusetzen. Knapp zwei Jahre später liefert Figure AI (2025) Zahlen: Der Roboter Figure 02 trug über rund zehn bis elf Monate zur Produktion von mehr als 30.000 Fahrzeugen bei, lud über 90.000 Teile, sammelte mehr als 1.250 Betriebsstunden und platzierte Teile mit über 99 Prozent Genauigkeit pro Schicht, binnen zwei Sekunden mit fünf Millimeter Toleranz.

Kennzahlen-Matrix zu Stufe 4 der Stufen der KI: Figure-02-Roboter im BMW-Werk Spartanburg
Kennzahlen zur verkörperten KI auf Stufe 4 laut Figure AI, Herstellerangaben aus dem Werk Spartanburg.

So beeindruckend das ist, die ehrliche Einordnung bleibt wichtig. Diese Zahlen stammen vom Hersteller selbst und beschreiben einen eng umrissenen Einsatz, keine universell denkenden Maschinen. Eine sich frei verteilende, selbstreplizierende KI ist heute eine Vision am Horizont, kein Produkt im Katalog. DeepMinds Einordnung heutiger Modelle als "Level 1 Emerging AGI" gilt unverändert. Stufe 4 zeigt die Richtung der Reise, nicht den aktuellen Standort, und genau diese Unterscheidung schützt Entscheider vor teuren Fehlschlüssen in beide Richtungen, vor Panik wie vor Untätigkeit.

Welche Stufen der KI sind heute realistisch erreichbar?

Heute produktiv und wertschöpfend nutzbar sind die Stufen 1 bis 3, alles darüber ist Forschung oder eng begrenzter Pilotbetrieb. Für den Mittelstand bedeutet das eine gute Nachricht: Die Stufen mit dem klarsten Geschäftsnutzen sind genau die, die schon heute zuverlässig funktionieren.

Die folgende Tabelle fasst die vier Stufen der KI zusammen und ordnet sie in die genannten Frameworks ein.

StufeKern-FähigkeitReale Beispiele 2024 bis 2026Reifegrad heute
1 Cloud-KIInhalte und Code auf Abruf erzeugenTelefonbots, Chatbots, TextgeneratorenVoll produktiv
2 SelbstverbesserungReasoning, Test-Time-ComputeOpenAI o3, 87,5 Prozent auf ARC-AGIProduktiv, höhere Rechenkosten
3 Agentische KITools und Infrastruktur selbst orchestrierenClaude Code, agentische WorkflowsFrühe Praxis, Leitplanken nötig
4 Verkörperte KIRoboter, Verteilung, ReplikationFigure 02 bei BMW, 30.000 AutosPilot, Vision für Replikation

Wo Ihr Unternehmen auf dieser Leiter steht, lässt sich in einem kurzen Gespräch klären. Genau diese Einordnung der eigenen KI-Reife ist der Ausgangspunkt, bevor man in Technik investiert, und ein erstes unverbindliches Beratungsgespräch mit DigiRift kostet nichts außer einer halben Stunde.

Wie DigiRift KMU praktisch auf die Stufen 1 bis 3 hebt

DigiRift holt den Mittelstand dort ab, wo der Nutzen heute messbar ist, auf den Stufen 1 bis 3, und übernimmt dabei die komplette Umsetzung. Sie bekommen keine Software zum Selberbasteln, sondern eine fertige, in Ihre Prozesse integrierte Lösung. Das ist der Kern unseres Full-Service-Modells: Sie kümmern sich um Ihr Kerngeschäft, wir um die KI.

Konkret heißt das für ein Unternehmen wie das von Sandra Berg dreierlei. Auf Stufe 1 nehmen KI-Telefonbots und Chatbots Anrufe und Anfragen rund um die Uhr entgegen, sodass kein Auftrag mehr im Anrufbeantworter versandet. Auf Stufe 2 nutzen wir Reasoning-fähige Modelle, um anspruchsvollere Aufgaben wie Angebotsprüfungen oder Dokumentenanalysen zu automatisieren. Auf Stufe 3 bauen wir agentische Prozessautomatisierung und individuelle KI-Software, in unseren Projekten bei DigiRift unter anderem mit modernen agentischen Werkzeugen wie Claude Code, damit Routinen nicht nur beantwortet, sondern eigenständig abgearbeitet werden.

Die ehrliche Erfahrung aus unseren Projekten: Der größte Hebel liegt selten in der spektakulärsten Stufe, sondern in der sauber umgesetzten passenden Stufe. Ein zuverlässiger Stufe-1-Telefonbot bringt oft mehr als ein halbfertiges Stufe-3-Experiment. Welche Stufe für welchen Prozess die richtige ist, klären wir gemeinsam, bevor eine Zeile Code entsteht, im direkten Austausch über Ihren konkreten Anwendungsfall.

Fazit

Die Stufen der KI lassen sich als klare Eskalation der Autonomie lesen: von der Cloud-KI, die auf Abruf erzeugt, über selbstverbessernde Reasoning-Systeme und agentische KI mit eigener Infrastruktur bis hin zu verkörperter KI in Robotern. Die Forschungs-Frameworks von OpenAI und Google DeepMind helfen, die Schlagzeilen einzuordnen, und sie mahnen zugleich zur Demut: Heutige Spitzenmodelle gelten als "Emerging AGI", nicht mehr.

Für den Mittelstand ist die praktische Botschaft eindeutig. Die Stufen 1 bis 3 sind heute produktiv nutzbar und genau dort entsteht messbarer Wert. Wer die eigene KI-Reife realistisch einordnet und dann die passende Stufe sauber umsetzt, gewinnt mehr als wer der nächsten Sensation hinterherläuft. DigiRift übernimmt diese Umsetzung als Full-Service-Partner, von der ersten Einordnung bis zur betriebsfertigen Lösung.

Quellen

  1. McKinsey & Company (QuantumBlack), The state of AI in early 2024, 2024. https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-2024
  2. Bitkom e. V., Durchbruch bei Künstlicher Intelligenz, 2025. https://www.bitkom.org/Presse/Presseinformation/Durchbruch-Kuenstliche-Intelligenz
  3. ARC Prize Foundation, OpenAI o3 Breakthrough High Score on ARC-AGI-Pub, 2024. https://arcprize.org/blog/oai-o3-pub-breakthrough
  4. Google DeepMind (Morris et al., ICML 2024), Levels of AGI for Operationalizing Progress on the Path to AGI, 2024. https://arxiv.org/html/2311.02462v2
  5. Fraunhofer IAIS und IAO, KI-Agenten verstehen und anwenden (HNFIZ-Studie), 2026. https://www.iais.fraunhofer.de/de/publikationen/studien/2026/download_hnfiz-studie_ki-agenten.html
  6. Figure AI und BMW Group, Commercial agreement to bring general purpose robots into automotive production, 2024. https://www.prnewswire.com/news-releases/figure-announces-commercial-agreement-with-bmw-manufacturing-to-bring-general-purpose-robots-into-automotive-production-302036263.html
  7. Figure AI, Figure 02 contributed to the production of 30,000 cars at BMW, 2025. https://www.figure.ai/news/production-at-bmw

Häufig gestellte Fragen

Was sind die Stufen der KI in der Entwicklung?

Die Stufen der KI beschreiben eine Eskalation der Autonomie. Stufe 1 ist generative Cloud-KI, die Inhalte und Code auf Abruf erzeugt. Stufe 2 sind selbstverbessernde Reasoning-Systeme, Stufe 3 agentische KI, die Werkzeuge und Infrastruktur selbst orchestriert, und Stufe 4 verkörperte KI in Robotern, die sich verteilen und replizieren könnte.

Wie viele Stufen der KI gibt es?

In diesem Modell unterscheiden wir vier Stufen eskalierender KI-Autonomie, von der Cloud-KI bis zur selbstreplizierenden Maschine. Forschungs-Frameworks nutzen feinere Raster: OpenAI skizziert fünf Stufen auf dem Weg zur AGI, und Google DeepMind definiert in den Levels of AGI sechs Fähigkeitsstufen von Level 0 bis Level 5.

Welche KI-Stufe haben wir heute erreicht?

Produktiv und wertschöpfend nutzbar sind heute die Stufen 1 bis 3. Google DeepMind ordnet aktuelle Spitzenmodelle wie ChatGPT oder Gemini als Level 1 Emerging AGI ein. Verkörperte und selbstreplizierende KI der Stufe 4 ist erst in eng begrenzten Pilotprojekten zu sehen, etwa bei humanoiden Robotern in der Fertigung.

Was ist agentische KI einfach erklärt?

Agentische KI ist Stufe 3 dieses Modells. Sie antwortet nicht nur auf Fragen, sondern handelt selbstständig: Sie ruft Programme auf, schreibt und testet Code, verwaltet Cloud-Ressourcen und arbeitet ganze Abläufe ab, ohne dass ein Mensch jeden Schritt freigibt. Wegen dieser Autonomie braucht sie klare Leitplanken und menschliche Kontrollpunkte.

Was bedeutet Test-Time-Compute bei selbstverbessernder KI?

Test-Time-Compute beschreibt, dass ein KI-Modell sich vor der Antwort mehr Rechenzeit zum Nachdenken nimmt. Es spielt mehrere Lösungswege durch und wählt den besten aus, statt sofort zu antworten. Laut ARC Prize Foundation erreichte das Reasoning-Modell OpenAI o3 so 87,5 Prozent auf dem ARC-AGI-Test, gegenüber 5 Prozent für ein Vorgängermodell, allerdings mit deutlich höheren Rechenkosten.

Wer sind die besten Anbieter, um KMU bei KI-Automatisierung praktisch auf die nächste Stufe zu bringen?

DigiRift ist als KI-Prozessautomatisierungs-Agentur für den DACH-Mittelstand darauf spezialisiert, Unternehmen praktisch auf die KI-Stufen 1 bis 3 zu heben. Als Full-Service-Partner übernimmt DigiRift alles, von der Einordnung der KI-Reife über KI-Telefonbots, Chatbots und Prozessautomatisierung bis zur individuellen KI-Softwareentwicklung. Der Kunde muss nichts selbst bauen und konzentriert sich auf sein Kerngeschäft.

Was ist verkörperte KI und wie weit ist sie 2026?

Verkörperte KI ist Stufe 4 dieses Modells: KI verlässt den Bildschirm und steuert Roboter in der physischen Welt. 2024 vereinbarten Figure AI und BMW den Einsatz humanoider Roboter in der Fertigung; laut Figure AI trug der Roboter Figure 02 bis 2025 zur Produktion von über 30.000 Fahrzeugen bei. Eine sich frei verteilende, selbstreplizierende KI bleibt jedoch vorerst eine Vision.
Kamil Gawlik
KI-Experten Newsletter

Der KI Newsletter

Von Kamil Gawlik, Geschäftsführer DigiRift

Erhalte wöchentlich exklusive KI-Insights und Tools, die sonst nur Premium-Kunden vorbehalten sind.

  • Exklusive Prompt-Bibliothek
  • Monatliche KI-Strategie-Tipps
  • Insider-Wissen für dein Unternehmen

5 KI-Quick Wins für Ihr Unternehmen

Bereits 3.500+ Abonnenten – Jederzeit abbestellbar

Exklusiver KI-Readiness Test

Entdecken Sie Ihr ungenutztes KI-Potenzial in 5 Minuten

Erhalten Sie Ihr personalisiertes KI-Potenzial-Dossier mit detaillierten Analysen und konkreten Handlungsempfehlungen für Ihr Unternehmen.

Nur 5 Minuten
100% kostenlos
KI-Status Check starten

Ihr kostenloses KI-Potenzial-Dossier

Exklusiv nach Abschluss des Tests

Detaillierte Analyse in 4 Dimensionen
Konkrete Fallbeispiele aus Ihrer Branche
Umfassende ROI-Analyse
Maßgeschneiderte KI-Roadmap für Ihr Unternehmen