KI-PilotenDigitaler Zwilling

Warum 95 % der KI-Piloten im Mittelstand scheitern — und was ein digitaler Zwilling daran ändert

95 % der GenAI-Piloten liefern keinen messbaren P&L-Beitrag. Woran das im Mittelstand wirklich liegt — und warum der Weg über den digitalen Organisations-Zwilling führt, nicht über das nächste Tool.

18. Mai 2026·Eva Jacob·3 Min. Lesezeit

In einem unserer Erstgespräche zeigte uns der Geschäftsführer eines Mittelständlers kürzlich seine KI-Rezeptionistin: ohne Testing eingeführt, direkt produktiv geschaltet. Vier Monate später — über 4.000 € Kosten pro Monat, Fehlerquote über 90 %. Anrufer werden nicht richtig identifiziert, Anliegen falsch aufgenommen — das Ergebnis: mehrere Personen, die nun die Daten händisch bearbeiten müssen. Seine Schlussfolgerung daraus: nicht weiter einzelne KI-Tools an einzelnen Stellen ausprobieren, sondern das Unternehmen ganzheitlich betrachten. Das ist die Realität im Mittelstand gerade, und es ist kein Einzelfall.

Die Zahlen, die niemand mehr ignorieren kann

Eine Studie des MIT NANDA-Projekts vom Sommer 2025 hat 300 öffentlich gemeldete KI-Initiativen und über 150 Senior-Leader-Interviews ausgewertet. Ergebnis: 95 % der GenAI-Piloten liefern keinen messbaren Beitrag zur Gewinn- und Verlustrechnung. Nur 5 % erreichen echte Wertschöpfung. Fortune hat die Zahl im August 2025 prominent aufgegriffen, seitdem geht sie durch die internationale Presse.

RAND kommt unabhängig davon auf über 80 %, doppelt so hoch wie bei klassischen IT-Projekten. Die Bitkom-Studie zu Künstlicher Intelligenz 2025 zeigt für den deutschen Mittelstand das Bild von der anderen Seite: 53 % der Unternehmen kämpfen mit fehlendem technischen Know-how, 51 % mit fehlenden personellen Ressourcen, 36 % berichten von unzureichender Qualität der KI-Ergebnisse.

Bemerkenswert an diesen Studien ist, was sie nicht sagen. Sie sagen nicht, dass die Modelle zu schwach sind. Sie sagen nicht, dass die Technologie noch nicht reif ist. Sie sagen: Es fehlt an Struktur. An Daten, an Prozessdokumentation, an klarer Use-Case-Auswahl. BCG bringt es in ihrer 2024er-Erhebung auf eine Faustformel: 70 % People und Process, 20 % Technologie, 10 % Algorithmen.

Das zweite Beispiel zeigt das eigentliche Problem

Ein anderer Mittelständler hat uns einen Prozess gezeigt, der eine ganze Mitarbeiterin voll bindet: Wasserrechtsanträge. Auf jeder Kreisebene sehen die Formulare anders aus, jeder Landkreis hat eigene Anforderungen, eigene Formulare. Manuelle Befüllung, Vergleich mit Altanträgen, Rückfragen bei den Behörden. Eine Vollzeitstelle, jeden Monat.

Das ist ein Fall, in dem KI tatsächlich Sinn ergeben kann. Aber: Niemand löst das mit einem Standard-Agenten von der Stange. Wer hier ein Tool kauft, das „Formularausfüllung mit KI" verspricht, wird in sechs Monaten wieder im Status quo landen. Plus Lizenzkosten. Die Lösung muss die spezifische Aktenlage des Unternehmens kennen, die Logik der jeweiligen Behörden, die Eigenheiten der eigenen Vorgangshistorie. Das ist unternehmensspezifisch.

Und genau zwischen diesen beiden Beispielen liegt die ganze Misere des aktuellen Mittelstand-KI-Diskurses. Auf der einen Seite Anbieter, die Pauschallösungen verkaufen, die für niemanden wirklich funktionieren. Auf der anderen Seite reale Prozesse, in denen 30, 50 % Produktivitätsgewinn drinstecken — aber nur, wenn man sie tatsächlich versteht.

Was das Team von Ankerkern anders macht

Bastian Etzold von der FAU Erlangen-Nürnberg bringt es im Forschungsbericht zum digitalen Zwilling im Mittelstand auf den Punkt: „Gerade bei kleineren und mittleren Unternehmen können Investitionsentscheidungen nur schlecht in einem Pilotversuch angetestet werden und müssen direkt sitzen." Die Logik dahinter ist auch unsere: lieber drei Wochen im Modell rechnen als drei Monate falsch produktiv.

Wir bauen deshalb für jeden Mittelständler erst den digitalen Organisations-Zwilling, gemeinsam mit Inhaber und Kernteam: Wir bilden das Unternehmen mit Bereichen, Rollen und Prozessen als Zwilling ab. Anschließend lassen wir echte Anfragen parallel durch den Zwilling laufen. Der KI-Agent für die Wasserrechtsanträge wird an realen Vorgängen trainiert, in einer Umgebung, in der Fehler keinen Schaden anrichten. Wir messen Genauigkeit, Latenz, Edge Cases.

Live geht der Agent erst, wenn die Fehlerquote im Parallelbetrieb stabil unter 10 % liegt, bei sicherheitskritischen Prozessen deutlich darunter. Nicht, wenn der Vertrieb es verspricht. Nicht, wenn die Demo gut aussah. Sondern wenn das System auf den echten Vorgängen des Unternehmens nachweislich liefert.

Das klingt langsamer, als es ist. Eine erste nutzbare Demo entsteht in wenigen Wochen. Aber die KI-Rezeptionistin mit knapp 90 % Fehlerquote hätte es so nie in den Produktivbetrieb geschafft. Und das ist genau der Punkt.

Unser Rat an jeden Geschäftsführer, der gerade über KI-Einführung nachdenkt: Fangen Sie nicht mit dem Tool an, sondern mit dem Prozess. Lassen Sie sich keine Pauschallösung verkaufen. Bestehen Sie auf Parallelbetrieb, bevor irgendetwas live geht. Und definieren Sie vorher, welche Fehlerquote akzeptabel ist, nicht nachher.

Sie überlegen, wo in Ihrem Betrieb ein digitaler Zwilling tatsächlich Wert stiftet? 45 Minuten Erstgespräch, ehrlich und unverbindlich.

Kostenloses Erstgespräch

Lust auf ein Gespräch zum Thema?

45 Minuten, ehrlich, kostenlos. Wenn KI für Sie keinen messbaren Unterschied macht, sagen wir das.

Termin wählen →