Die Level der KI-gestützten Softwareentwicklung
Alle reden über KI in der Softwareentwicklung, aber die Reifegrade sind sehr unterschiedlich. Ein Einordnungsmodell in fünf Stufen – von der Suchmaschine bis zur autonomen Entwicklung.
- KI-gestützte Entwicklung lässt sich in fünf Reifegrade einteilen – von AI als Suchmaschine (L1) bis zur autonomen Weiterentwicklung (L5, noch hypothetisch)
- Der größte ROI für KMU liegt auf Level 3 (Agentic Development), wo AI ganze Features implementiert und der Mensch als Reviewer und Steuermann agiert
- Der Sprung auf L3 erfordert keine KI-Expertise beim Kunden – er erfordert einen Dienstleister, der dort arbeitet, und eine Codebasis, die dafür ausgelegt ist
Auf einer Konferenz Anfang 2026 stellte ein Teilnehmer die Frage: "Nutzen Sie KI in der Entwicklung?" Fast alle Hände im Raum gingen hoch. Die Anschlussfrage, "Und für was genau?", brachte ein aufschlussreiches Spektrum: von "Ich frage ChatGPT, wenn ich nicht weiterkomme" bis "Unsere AI-Agenten schreiben eigenständig Features und Tests." Beide Antworten fallen unter "KI in der Entwicklung", beschreiben aber grundlegend verschiedene Arbeitsweisen mit grundlegend verschiedenen Auswirkungen auf Produktivität und Kosten.
Was fehlt, ist ein gemeinsames Modell zur Einordnung. Dieser Artikel schlägt eines vor: fünf Level der KI-gestützten Softwareentwicklung, von der einfachsten Nutzung bis zur heute noch hypothetischen vollständigen Autonomie.
Fünf Level im Überblick
Level 1: KI als Suchmaschine
Auf dem ersten Level dient ein Sprachmodell wie ChatGPT als Ersatz für Stack Overflow oder Google. Ein Entwickler stößt auf ein Problem, formuliert eine Frage, erhält eine Antwort und kopiert einen Code-Ausschnitt in sein Projekt. Der Workflow ändert sich kaum. Statt in einer Suchmaschine zu recherchieren und sich durch Foren-Antworten zu arbeiten, erhält man eine direkte, kontextualisierte Antwort.
Ein Produktivitätseffekt ist vorhanden, aber begrenzt. Die eigentliche Entwicklungsarbeit, also Architektur, Implementierung, Testing und Deployment, bleibt unverändert. Level 1 beschreibt den Einstieg, den die meisten Entwickler bereits hinter sich haben.
Level 2: AI Code Completion
Ab Level 2 arbeitet die KI direkt in der Entwicklungsumgebung. Tools wie GitHub Copilot oder JetBrains AI ergänzen Code in Echtzeit, schlagen Funktionen vor und vervollständigen Muster. Der Entwickler schreibt den Anfang, die KI ergänzt den Rest. Bei Routineaufgaben, etwa dem Schreiben von Getter-Methoden, Konfigurationsdateien oder einfachen CRUD-Operationen, spart das spürbar Zeit.
Der JetBrains State of PHP 2025 zeigt, dass 80 Prozent der PHP-Entwickler solche Tools regelmäßig nutzen. Der Stack Overflow Developer Survey 2025 relativiert allerdings: Nur 3,1 Prozent vertrauen dem generierten Code vollständig. Die Produktivitätsgewinne auf diesem Level liegen bei 10 bis 20 Prozent für Routinetätigkeiten, aber der Mensch bleibt in jeder Zeile der Entscheider.
Level 3: Agentic Development
Level 3 markiert einen qualitativen Sprung. Hier schreibt die KI nicht einzelne Zeilen oder Funktionen, sondern ganze Features. Der Entwickler formuliert eine Anforderung, etwa "Erstelle Oberfläche zur Verwaltung von Aufträgen im Stile eines Knaben-Boards", und ein AI-Agent wie Copilot, Claude Code oder Cursor implementiert die Funktionalität, schreibt Tests, erstellt Dokumentation und schlägt Datenbankmigrationen vor. Der Mensch wechselt von der Rolle des Implementierers in die des Reviewers und Steuermanns.
So arbeiten wir in den meisten Szenarien. Die kombinierte Wirkung aus modularem Baukasten, der 60 bis 70 Prozent der Basisfunktionalität als erprobte Module bereitstellt, und AI-gestützter Entwicklung für den individuellen Anteil verkürzt Projektlaufzeiten um 40 bis 60 Prozent gegenüber klassischer Individualentwicklung. Die Details dazu beschreiben wir im Artikel AI-Assisted PHP Development und im Werkstattbericht So verändert KI die Softwarelandschaft.
Die Voraussetzung für produktives Arbeiten auf Level 3 ist nicht die KI selbst, sondern die Codebasis: Modulare Architektur, durchgängige Tests und klare Typisierung sind die Grundlage dafür, dass AI-Agenten zuverlässige Ergebnisse liefern. KI arbeitet besser auf stabilen, gut strukturierten Ökosystemen, wie wir im Artikel PHP im AI-Zeitalter beschreiben.
Level 4: Spec-Driven Development
Auf Level 4 verschiebt sich die Rolle des Menschen weiter. Er definiert Spezifikationen, beschreibt das gewünschte Verhalten und die Architekturprinzipien, und die KI setzt die Spezifikation eigenständig um. Der Mensch wird zum Architekten und Qualitätssicherer. Die Implementierungsdetails delegiert er vollständig.
Dieses Level existiert heute in Ansätzen. Für klar definierte, abgegrenzte Aufgaben funktioniert es bereits. Für komplexe Geschäftslogik, die Domänenwissen und Urteilsvermögen erfordert, stößt es an Grenzen. Die Branche bewegt sich in diese Richtung, aber der Weg ist weiter als viele Anbieter suggerieren. Es erfordert außerdem die Ausarbeitung der Spezifikation bis ins kleinste Detail, was sich in der Praxis als schwierig herausstellt; oft ist es besser mit kleineren Arbeitspaketen auf Level 3 zu arbeiten, um eine enge Kontrolle zu behalten.
Unsere Erfahrung ist aber, dass für bestimmte Softwarekomponenten wie UI, die sich gut zusammen mit dem Kunden spezifizieren lassen, oder auch für Prototypen, Level 4 bereits produktiv möglich ist.
Level 5: Autonome Evolution
Level 5 beschreibt eine hypothetische Stufe, auf der Software sich eigenständig weiterentwickelt. Die KI erkennt Probleme, Engpässe oder veränderte Anforderungen und passt die Anwendung ohne menschliche Intervention an. Die ungeklärten Fragen auf diesem Level, insbesondere Sicherheit, Kontrollierbarkeit und Verantwortlichkeit, machen es zum Gegenstand der Forschung, nicht der Praxis.
Wo stehen die meisten Unternehmen?
Die Mehrheit der Entwicklerteams arbeitet auf Level 1 bis 2. Sie nutzen ChatGPT als Recherchetool und Copilot als Autovervollständigung. Der Sprung auf Level 3 findet bisher vor allem bei spezialisierten Dienstleistern und in Teams statt, die ihre Codebasis gezielt für AI-gestützte Entwicklung vorbereitet haben.
Das ist kein Versäumnis. Level 1 und 2 bringen für viele interne Teams bereits einen spürbaren Produktivitätsgewinn. Die Frage ist nicht, auf welchem Level ein Unternehmen intern steht, sondern auf welchem Level der Dienstleister arbeitet, der die Software entwickelt.
Was braucht man für den Sprung auf Level 3?
Der Übergang von Level 2 zu Level 3 ist weniger eine Frage der Tools als eine Frage der Codebasis und der Arbeitsweise. Vier Voraussetzungen sind entscheidend.
Eine saubere Codebasis mit Tests und Typisierung ist die Grundlage. AI-Agenten können in einer gut strukturierten Codebasis zuverlässig arbeiten. In einer chaotischen Codebasis ohne Tests produzieren sie chaotischen Code ohne Tests. Die Qualität des Inputs bestimmt die Qualität des Outputs.
Modulare Architektur ist der zweite Faktor. AI arbeitet in klar abgegrenzten Modulen mit definierten Schnittstellen besser als in monolithischen Systemen, in denen alles mit allem zusammenhängt. Das ist einer der Gründe, warum unser Baukasten-Ansatz mit eigenständigen Business-Modulen für AI-gestützte Entwicklung gut geeignet ist, wie wir im Artikel Kein Standard-Framework: Warum eigene Architektur sich lohnt erläutern.
Review-Kompetenz wird wichtiger als Implementierungskompetenz. Wenn AI den Code schreibt, muss der Mensch ihn lesen, bewerten und korrigieren können. Die Fähigkeit, generierten Code kritisch zu prüfen, ist auf Level 3 die zentrale Entwicklerkompetenz.
Security-Awareness schließlich betrifft sowohl den Umgang mit AI-generierten Code-Vorschlägen als auch die Absicherung der Entwicklungsumgebung. AI-Agenten brauchen Zugriff auf Code und Dateisystem, und dieser Zugriff muss kontrolliert und begrenzt sein.
Warum Level 3 der Sweet Spot für KMU ist
Die Level 4 und 5 klingen beeindruckend, sind aber für die meisten mittelständischen Softwareprojekte weder verfügbar noch nötig. Level 3 liefert den größten Produktivitätsgewinn bei überschaubarem Risiko. Der Mensch behält die Kontrolle über Architekturentscheidungen und Geschäftslogik, profitiert aber von der Geschwindigkeit der AI-gestützten Implementierung.
Für KMU, die Software entwickeln lassen, ist dabei ein Punkt entscheidend: Der Kunde muss nicht selbst auf Level 3 arbeiten. Er muss keinen AI-Agenten konfigurieren und keine Prompt-Strategien entwickeln. Er braucht einen Dienstleister, der auf diesem Level arbeitet und die Vorteile in Form kürzerer Projektlaufzeiten und niedrigerer Kosten weitergibt.
Stabile Technologien wie PHP, die seit Jahrzehnten im Einsatz sind und zu den am besten dokumentierten Ökosystemen gehören, bilden dafür eine gute Basis. AI-Tools performen in Umgebungen mit umfangreichen Trainingskorpora und bewährten Mustern zuverlässiger als in Nischen-Technologien. Das ist einer der Gründe, warum "langweilige" Technologien im AI-Zeitalter besser dastehen als viele erwarten, wie der Artikel PHP im AI-Zeitalter beschreibt.
Fazit
Die fünf Level bieten eine Orientierung, keine Wertung. Level 1 ist nicht schlecht und Level 5 ist nicht das Ziel. Entscheidend ist, welches Level für den jeweiligen Kontext den größten Nutzen liefert. Für interne Teams ist Level 2 oft ein guter und pragmatischer Stand. Für Dienstleister, die Individualsoftware entwickeln, ist Level 3 der aktuelle Stand der Technik und der größte Hebel für Kosteneffizienz.
Wenn Sie wissen möchten, wie sich das konkret auf Ihr Projekt auswirkt, finden Sie weitere Details in unseren Artikeln zu AI-Assisted PHP Development und Individualsoftware: Kalkulierbare Kosten dank Baukastensystem. Oder Sie sprechen direkt mit uns.