Die meisten Unternehmen suchen beim KI-Dienstleister nach Zertifizierungen, Referenzlisten und Technologie-Expertise. Das ist verständlich, aber es ist die falsche Suchrichtung.
Was tatsächlich über Erfolg oder Misserfolg entscheidet: Kann dieser Dienstleister das implizite Wissen Ihres Unternehmens in funktionierende KI-Systeme übersetzen? Versteht er, wie Ihre Mitarbeiter wirklich arbeiten, wo der eigentliche Flaschenhals liegt, was in Ihren Dokumenten drinsteckt, das nirgendwo aufgeschrieben ist?
Diese Fähigkeit lässt sich prüfen. Es gibt klare Kriterien, die auch Nicht-Techniker anwenden können, und es gibt Red Flags, die man früh erkennen kann.
Ergebnisse prüfen, nicht Versprechungen
Der erste und wichtigste Test ist einfach: Zeig mir, was du gebaut hast.
Ein seriöser KI-Dienstleister zeigt funktionierende Software. Videos von echten Systemen im Einsatz. Testlinks, mit denen man selbst ausprobieren kann. Live-Demos mit realen Daten. Seeing is believing, und wer das nicht liefern kann, sollte es auch nicht tun.
Viele Dienstleister präsentieren stattdessen Architekturdiagramme, Technologie-Stacks und Foliensätze über KI-Trends. Das ist kein Zeichen von Substanz, sondern von fehlenden echten Projekten. Die Frage "Kann ich das System heute testen?" ist der direkteste Weg zur Wahrheit.
Dabei geht es nicht darum, perfekte Systeme zu sehen. Erfahrene Teams zeigen auch unfertige Versionen, erklären, was noch nicht funktioniert, und begründen, warum sie diese Entscheidungen getroffen haben. Das ist ein Qualitätssignal, kein Schwächezeichen.
Was ein guter Dienstleister tut, den Sie nicht erwarten
Ehrliche Beratung bedeutet manchmal: Wir sind nicht die richtige Wahl.
Ein erfahrener KI-Dienstleister empfiehlt in manchen Situationen eine Standardsoftware statt eines Eigenprojekts. Er rät von Projekten ab, wenn die Voraussetzungen fehlen. Er sagt, wenn ein Problem besser durch einen besseren Prozess als durch KI gelöst werden sollte.
Das klingt wie ein schlechtes Geschäftsmodell. In der Praxis ist es das Gegenteil: Es ist das Merkmal von Dienstleistern, die so viel Erfahrung haben, dass sie auf kurzfristigen Umsatz verzichten können.
Die Frage, die man stellen sollte: "Was würden Sie mir abraten?" Wer diese Frage nicht beantworten kann oder sofort auf Standardantworten ausweicht, denkt vermutlich mehr an seine Rechnung als an Ihren Erfolg.
Drei Kriterien, die Sie im ersten Gespräch prüfen können
Iteratives Vorgehen statt Hinterzimmer-Entwicklung
KI-Projekte funktionieren iterativ. Der richtige Dienstleister liefert nach wenigen Wochen eine erste lauffähige Version, die gemeinsam verbessert wird. Keine monatelange Konzeptionsphase, kein Versprechen von Perfektion zum Projektende.
Als Erfahrungswert aus mehreren Projekten gilt: Nach etwa zwei Wochen ist ein funktionierendes Grundsystem sinnvoll. Die Ergebnisqualität liegt dann erfahrungsgemäß bei 60 Prozent des Zielzustands. Bis zur Produktivnahme nach drei bis vier Monaten steigt sie auf 90 bis 95 Prozent. Dieser Weg über kontinuierliche Verbesserung schützt vor teuren Fehlentwicklungen.
Fragen Sie konkret: "Wann sehe ich das erste Ergebnis?" Wer mehr als vier Wochen bis zur ersten Demo veranschlagt, betreibt klassische IT-Entwicklung, keine KI-Entwicklung.

Quelltransparenz als Grundlage
Jede Antwort, die ein KI-System gibt, muss auf ihre Quellen zurückführbar sein. Nicht als technisches Schmankerl, sondern als Grundprinzip. Nur so kann ein Mitarbeiter überprüfen, ob die KI-Antwort stimmt. Nur so baut man Vertrauen auf, anstatt blindes Vertrauen vorauszusetzen.
Wenn ein Dienstleister das nicht als Selbstverständlichkeit behandelt, sondern als optionales Feature, ist das ein Qualitätsproblem.
Schutz vor Abhängigkeit
Sprachmodelle entwickeln sich schnell. Ein System, das heute GPT-4o nutzt, sollte in einem Jahr auf ein besseres Modell wechseln können, ohne das Gesamtsystem neu bauen zu müssen.
Das geht nur mit einer Software-Schicht, die Modelle austauschbar macht. Ein Dienstleister, der hart auf ein einziges Modell oder einen einzigen Anbieter setzt, baut Ihnen Abhängigkeit ein, die Sie später teuer bezahlen werden.
Fünf Warnsignale, die einen schlechten Dienstleister verraten
-
Er zeigt nichts Funktionierendes: Viele Dienstleister präsentieren Architekturdiagramme, Technologie-Stacks und Foliensätze. Was sie nicht zeigen: ein System, das heute läuft. Wer nach einer Demo gefragt wird und stattdessen eine Konzeptionsphase anbietet, hat wahrscheinlich noch nie ein Projekt bis in den Produktivbetrieb gebracht.
-
Er fragt nicht nach Ihrem Fachexperten: Die wichtigste Ressource für ein KI-Projekt ist nicht das Budget, sondern ein Mensch auf Kundenseite, der den Prozess wirklich kennt. Wenn ein Dienstleister im Erstgespräch nicht aktiv nach dieser Person fragt und ihre Verfügbarkeit einfordert, plant er entweder ohne echtes Domänenwissen zu arbeiten oder kennt die Dynamik realer Projekte nicht.
-
Er sagt nie Nein: Ein erfahrener Dienstleister lehnt Projekte ab, bei denen die Voraussetzungen fehlen. Er empfiehlt Standardsoftware, wenn die besser passt. Er benennt Grenzen. Wer zu jedem Anwendungsfall nickt und nie auf Risiken hinweist, optimiert auf seinen Umsatz, nicht auf Ihren Erfolg.
-
Er verspricht Vollautomatisierung: Wer behauptet, ein KI-System könne Prozesse vollständig ohne menschliche Prüfung übernehmen, unterschätzt entweder die Risiken oder kennt sie nicht. Seriöse Anbieter sprechen von sich aus über Human-in-the-Loop, über Fälle, die nicht automatisiert werden sollten, und über die Grenzen der aktuellen Technologie.
-
Er hat keine Antwort auf "Was passiert nach dem Go-live?": KI-Systeme veralten anders als klassische Software. Modelle werden ausgetauscht, Anforderungen ändern sich, Quellen müssen gepflegt werden. Wer das Thema Wartung und Weiterentwicklung im Erstgespräch nicht von sich aus anspricht, denkt nur bis zum Projektabschluss.

Was auf Ihrer Seite stimmen muss
Die beste Dienstleister-Auswahl hilft wenig, wenn die Grundvoraussetzungen beim Kunden fehlen. Drei Dinge sind notwendig:
-
Cloud-Readiness: Mindestens die Bereitschaft, mit einer DSGVO-konformen Cloud-Infrastruktur zu arbeiten. Unternehmen, die jede Cloud-Lösung grundsätzlich ablehnen, schränken die Qualität des Ergebnisses erheblich ein.
-
Entscheider mit Mandat: Jemand auf Geschäftsführungs- oder Leitungsebene, der das Projekt trägt, Entscheidungen trifft und intern Türen öffnet. KI-Projekte brauchen Reibung im Unternehmen, keine Absicherung gegen sie.
-
Fachexperte mit verfügbarer Zeit: Die Person, die den zu automatisierenden Prozess am besten kennt, muss regelmäßig ansprechbar sein. Zwei bis vier Stunden pro Woche über drei bis vier Monate ist die realistischere Anforderung, als viele Auftraggeber zunächst erwarten.

Fehlt eine dieser Voraussetzungen, ist der Rat: Warten, bis sie gegeben sind. Ein mittelmäßiges Projekt mit guten Voraussetzungen bringt mehr als ein gutes Projekt mit schlechten.
Datenqualität: Kein Ko-Kriterium mehr
Viele Unternehmen glauben, ihre Daten seien nicht gut genug für KI. Dokumente in verschiedenen Formaten, unstrukturierte Ablagesysteme, lückenhafte Metadaten.
Das war lange eine ernsthafte Einschränkung. Seit Mitte 2025 ist es das nicht mehr. Moderne Modelle verarbeiten heterogene Datenquellen direkt, ohne aufwändige Vorverarbeitung. Qualitätsprobleme in KI-Systemen liegen heute fast immer an den Quellen selbst, nicht an der KI: falsche, veraltete oder widersprüchliche Informationen in den Ausgangsdokumenten. Das ist ein inhaltliches Problem, kein technisches.
Die richtige Frage ist nicht: "Sind unsere Daten gut genug?" Sondern: "Sind die Informationen in unseren Quellen korrekt und aktuell?"
Was KI von klassischer IT-Entwicklung unterscheidet
Ein Aspekt, den viele Entscheider unterschätzen: KI-Systeme veralten anders als klassische Software.
Ein CRM-System, das heute gebaut wird, ist in zwei Jahren noch im Wesentlichen dasselbe. Ein KI-System, das heute auf dem Stand der Technik ist, arbeitet in 18 Monaten mit Modellen, die deutlich leistungsfähiger sind. Das ist kein Problem, sondern ein Vorteil, wenn das System modular gebaut wurde.
Konkret bedeutet das zwei Dinge. Erstens: Die Investitionsrechnung für KI ist dynamischer als für klassische Software. Was heute nach zwei Jahren Amortisation aussieht, kann durch bessere Modelle schneller wirtschaftlich werden. Zweitens: Wartungskosten einplanen. Als Erfahrungswert gilt, dass jährlich etwa 15 bis 20 Prozent der ursprünglichen Entwicklungskosten für Pflege und Weiterentwicklung anfallen.
Wie ein risikoarmer Einstieg aussieht
Der häufigste Fehler bei KI-Projekten ist nicht der falsche Dienstleister, sondern der falsche Startpunkt.
Nicht: das größte oder strategisch wichtigste Problem angehen. Sondern: den engsten Flaschenhals. Den Prozess, bei dem ein Mitarbeiter täglich eine Stunde mit einer Aufgabe verbringt, die sich zu 80 Prozent wiederholt. Dort ist der ROI am schnellsten sichtbar, das Risiko am geringsten, und der Lerneffekt für alle Beteiligten am größten.
Der risikoarme Einstieg läuft immer im Parallelbetrieb: Das KI-System läuft neben dem bisherigen Prozess, nicht statt ihm. Erst wenn die Qualität überzeugt, wird der manuelle Schritt reduziert. Das macht den Einstieg jederzeit umkehrbar und schafft Vertrauen, das kein Versprechen ersetzen kann.
Wenn dieser erste Schritt gut geht, entsteht im Unternehmen Erfahrung: mit dem Dienstleister, mit der Technologie, mit dem eigenen Umgang damit. Das ist wertvoller als jedes Zertifikat.
Für wen diese Überlegungen besonders relevant sind
-
Unternehmen mit wissensintensiven Prozessen: Angebotserstellung, Dokumentenverarbeitung, interne Wissensrecherche, Kundenanfragen. Überall dort, wo Mitarbeiter viel Zeit mit dem Lesen, Verstehen und Zusammenfassen von Informationen verbringen.
-
Unternehmen mit hohen Vertraulichkeitsanforderungen: Mit der richtigen Infrastruktur und Architektur ist DSGVO-konforme KI auch für Unternehmen mit strengen Vertraulichkeitspflichten umsetzbar.
-
Unternehmen, die schlechte Erfahrungen mit KI-Projekten gemacht haben: Häufig liegt das nicht an der Technologie, sondern an fehlenden Voraussetzungen oder falschen Erwartungen. Ein neues Projekt mit dem richtigen Startpunkt kann deutlich anders verlaufen.
Was es nicht braucht: Einen perfekten Datenbestand. Ein großes KI-Budget. Einen IT-Leiter mit KI-Erfahrung. Es braucht einen klaren Flaschenhals, einen Entscheider mit Mandat, und einen Dienstleister, der Ergebnisse zeigt statt Folien.
