Semjon Mössinger
Warum Unternehmen AI Coding Tools noch nicht einführen
Abstract
KI-Tools wie ChatGPT, GitHub Copilot oder Claude Code sind in vielen Entwicklerteams bereits Alltag; die Softwareentwicklung zählt zu den Bereichen mit der höchsten KI-Adoption. Gleichzeitig erlauben zahlreiche Unternehmen den Einsatz solcher Werkzeuge noch nicht – meist aus nachvollziehbaren Gründen rund um Vertraulichkeit, Datenschutz, Security und Compliance. Dieser Artikel ordnet die typischen Bedenken, bewertet sie nach Eintrittswahrscheinlichkeit und Auswirkung und zeigt einen pragmatischen Umgang samt Gegenmaßnahmen. Die Grundidee: Eine kontrollierte Einführung mit klaren Leitplanken schafft Sicherheit. Zum Schluss folgen konkrete Empfehlungen für drei Rollen: KI-Enthusiasten, Gatekeeper und Entscheider.
Einleitung
Unter „KI-Tool“ sind hier KI-Programmierassistenten (AI Coding Assistants) und Coding Agents zu verstehen: Werkzeuge, die auf Large Language Models (LLMs) basieren, in IDEs oder Plattformen integriert sind und beim Entwickeln direkt auf den Code zugreifen. Ein typischer Ablauf lässt sich einfach beschreiben: (1) Der Assistent sendet Quellcode-Ausschnitte und Prompts an ein Modell. (2) Bei KI-Programmieragenten kann das KI-Tool darüber hinaus noch das System des Entwicklers zugreifen. (3) Das Modell liefert Codevorschläge oder erklärende Informationen, etwa zur Fehlersuche oder als Rechercheergebnisse. (4) Der Entwickler prüft das Resultat und entscheidet, was in die Codebasis übernommen wird.
Aus diesem Ablauf ergeben sich vier Risikofelder: Was geht raus und was macht der Agent auf meinem System? (Weitergabe von Code und Daten an Dritte), was kommt rein? (Qualität, Security und Lizenzfragen bei KI-generierten Ergebnissen) und was ändert sich in der Organisation? (Auswirkungen auf Prozesse, Rollen, Kompetenzen und digitale Souveränität). Die Risiken sind real – lassen sich jedoch durch kontrollierten Einsatz, klare Regeln und technische Kontrollen deutlich reduzieren.
Weitergabe von Code und Daten an Dritte
Bei GitHub Copilot – wie bei den meisten KI-Programmierassistenten – läuft das „Herz“ des Systems, das Large Language Model (LLM), nicht lokal auf der eigenen Hardware sondern in der Cloud und oft in den USA. Damit stellt sich zuerst die Frage der Vertraulichkeit von Quellcode; anschließend der speziellere Aspekt Datenschutz.
Vertraulichkeit des Codes
In Unternehmen werden KI-Tools bei offizieller Freigabe meist über Business-Lizenzen genutzt. Diese verwenden typischerweise Cloud-LLMs (z. B. von OpenAI, Google oder Anthropic) und sichern in den Nutzungsbedingungen häufig zu, dass übermittelte Inhalte nicht als Trainingsdaten verwendet und nicht dauerhaft gespeichert werden. Vorteil: sehr gute Modelle zu überschaubaren Kosten (oft ca. 20-30 € pro Entwickler und Monat, wer das Potential von agentischem Coden ausschöpfen will auch schnell 100-200€) bei geringem Einführungs- und Betriebsaufwand.
Wer vermeiden will, dass Code außerhalb der EU verarbeitet wird, kann bei einigen Anbietern inzwischen EU Data Residency buchen (z. B. GitHub Copilot). Das reduziert regulatorische Risiken, ist aber in der Regel teurer. Vollständige rechtliche „Absolutsicherheit“ bietet auch EU-Hosting bei US-Anbietern nicht, etwa wegen Zugriffsmöglichkeiten nach US-Recht.
In der Praxis entscheiden sich viele Organisationen – aus Kosten-, Komfort- und Funktionsgründen – für eine dieser zwei Cloud-Varianten. Für Software ohne besondere Schutzanforderungen ist das oft vertretbar, solange klare Regeln gelten.
Als Alternative gibt es lokale oder europäisch gehostete LLMs: auf dem Entwicklerrechner, auf zentraler Hardware (z. B. GPU-Server) oder bei einem EU-Provider. Viele Assistenten (z. B. JetBrains AI Assistant, Kilo Code, Cline, OpenCode) lassen sich daran anbinden. Der Nachteil: Die leistungsfähigsten „Top-Modelle“ der großen US-Anbieter sind in solchen Szenarien grundsätzlich nicht verfügbar, und Integrationen (z. B. in GitHub/GitLab) sind nur mit Aufwand und eingeschränkt verfügbar. Sinnvoll ist diese Option vor allem dort, wo andere US-Cloud-Services bereits konsequent vermieden werden oder besonders strenge Schutzanforderungen gelten.
Checkliste (unabhängig vom Hostingmodell):
Keine Secrets ins Repository (war schon vorher Pflicht, wird mit KI noch wichtiger). Das hier noch weitere Maßnahmen notwendig sind, zeigt Abschnitt Coding Agents
Ignore-/Exclude-Funktionen der Tools nutzen, um sensible Pfade/Dateien auszuschließen.
Besonders sensible Repositories ggf. komplett ausnehmen (z. B. durch separate IDE/Umgebung ohne KI-Plugin).
Eine konkretere Gefahr besteht, wenn LLM-Betreiber versehentlich Prompts von Nutzern offenlegen – etwa durch Konfigurations- oder Implementierungsfehler (konkretes Beispiel siehe hier) oder weil Mitarbeiter Opfer einer Cyberattacke (z. B. Phishing) werden. Deshalb ist das Einhalten der Checkliste auch dann sinnvoll, wenn man dem Betreiber grundsätzlich vertraut.
Open-Source-Projekte sind von der Vertraulichkeitsfrage normalerweise nicht betroffen, weil der Code ohnehin öffentlich ist.
Wichtig: Viele Anbieter behandeln explizites Feedback (z. B. „Daumen hoch/runter“) vertraglich anders als reine Nutzung. Es kann dazu führen, dass Inhalte eines Chats doch für Qualitätsverbesserung oder Training herangezogen werden. Das sollte in Policies berücksichtigt werden.
Einen Überblick über die Optionen bietet Tabelle 1.