Künstliche Intelligenz

6 Min.

Wie treffen Kommunen die richtige Modellwahl: Open Weight, Closed Weight oder Hybrid?

Was ist die entscheidende Frage bei der Nutzung von KI-Modellen in Kommunen?


Die entscheidende Weichenstellung ist: Nutze ich ein Modell, das ich selbst betreiben und voll kontrollieren kann („Open Weight“), oder setze ich auf die umfangreiche Infrastruktur externer Anbieter und damit auf Komfort („Closed Weight“)? Diese Wahl beeinflusst Datenschutz, Kosten, Flexibilität und Zukunftssicherheit von KI in jeder Kommune.


Das Wichtigste in Kürze 

  • Die grundlegende Unterscheidung ist: Kann ich das KI-Modell selbst betreiben (Open Weight/Self-hosted) oder kann ich es nur per Cloud-Service (Closed Weight/API) nutzen?

  • Open-Weight-Modelle bringen maximale Datenhoheit, Anpassbarkeit und rechtliche Sicherheit, fordern dafür aber eigene Ressourcen.

  • Closed-Weight-Modelle sind extrem zugänglich und pflegeleicht - haben aber Abhängigkeiten, Datenschutzprobleme und häufig hohe laufende Kosten.

  • Modelltyp und Architektur sollten immer zum kommunalen Use Case passen: 90% der Praxisanwendungen funktionieren bestens mit Sprachmodellen.

  • Die wichtigsten Fragen lauten: Wie sensibel sind die Daten? Wie hoch ist das Anfragevolumen? Wie wichtig ist Unabhängigkeit?

Erst einmal: Wie trainiert man ein KI-Modell - und was steckt konkret dahinter?


Was genau heißt „Training“ eines Modells?
Training ist im Prinzip simpel: Man füttert eine statistische Formel mit sehr vielen Variablen (den sogenannten „Weights“) mit großen Mengen von Daten und passt diese Variablen solange an, bis die Vorhersagen möglichst optimal sind.
Der entscheidende Aufwand: Die eigentliche Trainingsformel ist oft schnell aufgesetzt, aber das Beschaffen, Labeln und Reinigen der Trainingsdaten verschlingt in der Praxis den Großteil der Zeit.


Praxisbeispiel:
Das Klassifizieren von Verwaltungsdokumenten. Die Formel selbst ist nach zwei Tagen aufgesetzt. Die nächsten drei Monate ging es aber darum, die Trainingsdaten zu säubern, zu labeln und zu erweitern. Das Modell ist nur so gut wie seine Trainingsdaten.



Wofür nutzt man welche Daten?

Use Case

Trainingsdaten

Effekt nach Training

Spam-Filter

E-Mails mit Labels

E-Mail → „Spam“/„Kein Spam“

Kreditkarten-Betrug

Zahlungstransaktionen

Transaktion → „verdächtig“/„nicht verdächtig“

Sprache

Texte

Wortfolge → Vorhersage nächstes Wort

Bilder

Text-Bild-Paare

Text → Bildgenerierung

Welche Modelltypen gibt es und für welchen Einsatz sind sie geeignet?


Welche Modellfamilien spielen aktuell eine Rolle?
Nach praktischer Erfahrung lassen sich Modelle für (fast) alle kommunalen Aufgaben wie folgt einteilen:

Modelltyp

Input/Output

Eigenschaften/Besonderheiten

Beispiele

Language Models

Input Text → Output Text

  • Die Lösung für 80% der Business Use Cases

  • Training auf Textdaten, Vorhersage von Wortsequenzen

GPT, Claude, Llama

Vision Models

Input Text + Bild → Output Text

  • Das Modell "kann sehen"

  • Kritisch für Dokumentenverarbeitung, Quality Control

GPT-4V, Claude mit Vision

Image Models

Input Text → Output Bild

  • Für Marketing, Prototyping, Design

  • Training auf Text-Bild-Paaren

DALL-E, Midjourney, Stable Diffusion

Embedding Models

Input Text → Output Vektor

  • Die unterschätzten Helden für Suche und Ähnlichkeitsanalysen

  • Verwandeln Text in Zahlen, mit denen man rechnen kann

text-embedding-ada-002, e5-mistral

Multi-Modal

Kombinationen der obigen; Input kann mehrere Typen haben (Text + Audio + Bild)

Die Zukunft, aber noch experimentell

Gemini Ultra, GPT-4o


Learning aus der Praxis:
Der Modelltyp sollte nach der Problemstellung ausgewählt werden. In Kommunen reichen meist solide Sprachmodelle. Multi-Modal klingt zwar vielversprechend, scheitert aber häufig an Alltagstauglichkeit und Infrastruktur.

Was bedeuten Open Weight und Closed Weight konkret für Kommunen?


Was ist der Unterschied Open Weight vs. Closed Weight?
Open Weight heißt: Die Weights (alle gelernten Modellparameter) sind frei verfügbar, du kannst das Modell selbst herunterladen, auf eigenen Systemen betreiben und nach Bedarf anpassen.


Closed Weight bedeutet: Die Weights bleiben Eigentum des Herstellers und du kannst das Modell nur über dessen API (Cloud-Service) nutzen. Der Zugriff auf die „Formel“ und alle Anpassungen bleiben dir verwehrt.

Modell(-Familie)

Weights veröffentlicht?

Hersteller

Land

Claude (Anthropic)

Anthropic

USA

GPT-4/GPT-4o

OpenAI

USA

Gemini Pro/Flash

Google

USA

Llama 3

Meta

USA

Mistral/Mixtral

teilweise

Mistral

Frankreich

Qwen, DeepSeek

Alibaba, DeepSeek

China


Achtung: Open Weight ≠ Open Source! Oft ist nur das Modell („Weights“), nicht aber der gesamte Trainingscode oder die Datenbasis offen zugänglich.

Wie wirken sich diese Unterschiede auf Betrieb und Datensouveränität aus?


Ansatz

Vorteile

Nachteile

Closed Weight (API-basiert)

- Sofort einsatzbereit, keine Infrastruktur nötig

- Immer die neueste Version

- Support und SLAs vom Anbieter

- Keine GPU-Kosten

- Daten verlassen die eigene Infrastruktur (DSGVO-Alptraum)

- Kosten skalieren linear mit Nutzung (kann explodieren)

- Vendor Lock-in

- Internet-Abhängigkeit, Latenz-Issues

- Anbieter kann Modell jederzeit ändern/abschalten

Open Weight (Self-hosted)

- Volle Datenkontrolle - nichts verlässt deine Server

- Einmalige sowie laufende Infrastruktur-Kosten (wie z.B. Strom und Wartung)

- Anpassbar (Fine-tuning möglich)

- Keine Abhängigkeit von externen Services

- Deterministische Outputs

- GPU-Server sind teuer (A100 = 10k€+)

- DevOps-Aufwand nicht zu unterschätzen

- Selbst verantwortlich für Updates

- Skalierung muss selbst behandelt werden


Typische Nutzung für Kommunen:

  • Erste Prototypen und Pilotdienste: Closed-Weight-API, da schnell und unkompliziert.

  • Produktivbetrieb bei sensiblen Daten oder hohen Volumina: Eigenbetrieb (Open Weight) lohnend - oder hybride Ansätze.

Welche Fehler passieren am häufigsten bei der Modellwahl?

  • Zu spätes Berücksichtigen von Datenschutz - APIs können im Ruhestand scheitern.

  • Kosten-Bumerang: Viele API-Aufrufe bedeuten explodierende Cloud-Kosten.

  • Unterschätzter DevOps- und Betriebsaufwand bei Open-Weight-Selfhosting.

  • Überzogene Erwartungen: Multi-Modal und Bildmodelle sind oft überdimensioniert.

  • Zu lange Konzeptphasen - Experience gewinnt: Schrittweise starten, iterieren, anpassen.

FAQ: Häufig gestellte Fragen aus der kommunalen Praxis


  1. Was ist ein Open-Weight-Modell?
    Ein Modell, dessen trainierte Parameter öffentlich verfügbar sind. Es kann unabhängig selbst betrieben, angepasst und in die eigene Infrastruktur integriert werden.


  2. Warum sind Weights so wertvoll?
    Sie enthalten das komplette „Wissen“ und Verhalten des Modells - wer sie hält, hält das KI-Modell selbst.


  3. Was bringt ein Hybrid-Ansatz?
    Du kannst Entwicklung und Tests mit APIs durchführen und dann für Live-Betrieb sensible Prozesse mit einem eigenen Modell (Open Weight) absichern.


  4. Welcher Modelltyp ist für Kommunen am wichtigsten?
    Sprachmodelle (Language Models) sind echte „Arbeitspferde“ für die allermeisten Aufgaben - von Korrespondenz bis Sachbearbeitung.


  5. Wie kann ich flexibel bleiben?
    Setze auf Lösungen, die nahtlos Open und Closed Weight kombinieren, etwa Ayunis Core: DSGVO-konform, souverän, auf Kommunen ausgelegt. Mehr zu Ayunis Core für Kommunen

Fazit: Worauf kommt es bei der Modellentscheidung an?


Das sind die drei wichtigsten Punkte bei der Entscheidung für ein Modell:


Erstens: KI-Modelle sind keine Magie. Es sind mathematische Formeln mit sehr vielen Variablen, die durch Training auf Daten angepasst wurden. Wenn du das verstehst, fallen viele Entscheidungen leichter. Ein Sprachmodell "denkt" nicht - es sagt sehr gut vorher, welches Wort als nächstes kommt. Das zu wissen hilft, realistische Erwartungen zu setzen.


Zweitens: Die Weights sind das Modell. Diese Milliarden von Zahlen sind das Ergebnis von Millionen Dollar Trainingskosten. Kein Wunder, dass Firmen wie OpenAI sie geheim halten. Aber es gibt auch eine wachsende Open Weight Bewegung - angeführt von Meta's Llama und anderen - die diese Weights öffentlich macht. Das verändert die Spielregeln fundamental.


Drittens: Open vs. Closed Weight ist die kritischste Architekturentscheidung. Nicht welches Modell die besten Benchmarks hat. Nicht welche API am einfachsten zu integrieren ist. Sondern: Willst du Kontrolle über deine Daten und Infrastruktur, oder willst du Convenience? Beides sind valide Entscheidungen - aber du solltest sie bewusst treffen.



Die beiden Fragen, die sich Kommunen immer stellen sollten

  1. Wie sensibel sind meine Daten?
    Unkritisch: API ist in Ordnung.
    Personenbezogen/vertrauliche Daten: Self-Hosting könnte eine Lösung sein.

  2. Wie wichtig ist Kontrolle?
    Es geht um einen Prototype/Experiment: Kontrolle ist nebensächlich.
    Es geht um eine Production mit SLAs: Abhängigkeit von OpenAI-Outages vermeiden.


Praktische nächste Schritte

Falls Sie direkt loslegen wollen: 

  • Zum Experimentieren: Claude oder GPT API. In 5 Minuten sind Sie startklar.

  • Für erste Self-Hosting Versuche: Gwen 3 7B auf einer kleinen GPU. 

  • Zum Vergleichen: artificialanalysis.ai - aktuelle Benchmarks aller relevanten Modelle.


Die Alternative, die wir bei Ayunis entwickelt haben: Mit Ayunis Core ist es möglich, beide Welten zu kombinieren - Open Weight Modelle wie Gwen DSGVO-konform nutzen, ohne selbst hosten zu müssen, und bei Bedarf auf Closed Weight Modelle wie GPT-5 zugreifen. Der ganze Infrastruktur-Stress entfällt, die Datenhoheit bleibt gewahrt.


Das Wichtigste: Einfach anfangen. Die perfekte Modellwahl gibt es nicht und die KI-Landschaft entwickelt sich rasant. Was heute State-of-the-Art ist, ist in sechs Monaten überholt. Aber die Grundlagen - Modelle als Formeln, Weights als Wert, Open vs. Closed als strategische Entscheidung - bleiben bestehen.

  • artificialanalysis.ai: Modellübersicht (Stand September 2025)

  • Eigene Produktentwicklung & Marktbeobachtungen