On-Device LLMs sind grosse Sprachmodelle, die direkt auf dem Endgeraet des Nutzers ausgefuehrt werden — etwa auf Smartphones, Laptops oder Tablets. Im Gegensatz zu Cloud-basierten Modellen wie ChatGPT oder Claude, bei denen jede Anfrage an einen externen Server gesendet wird, verarbeiten On-Device LLMs alle Daten lokal. Dadurch verlassen sensible Informationen das Geraet nicht, Antworten kommen ohne Netzwerkverzoegerung und die KI funktioniert auch ohne Internetverbindung.
Grosse Sprachmodelle wie GPT-4 oder Claude haben Hunderte Milliarden Parameter und benoetigen leistungsstarke GPU-Cluster fuer die Ausfuehrung. Diese Rechenleistung ist auf normalen Endgeraeten nicht verfuegbar. Deshalb werden Anfragen an Cloud-Server gesendet, die das Modell ausfuehren und die Antwort zurueckschicken.
Der Nachteil: Jede Eingabe — auch persoenliche Nachrichten, Dokumente oder Suchanfragen — wird an externe Server uebertragen. Fuer Unternehmen mit strengen Datenschutzanforderungen ist das ein Problem.
On-Device LLMs sind deutlich kleinere Modelle, die speziell fuer die Ausfuehrung auf Endgeraeten optimiert wurden. Typische Techniken:
Typische On-Device-Modelle haben 1 bis 7 Milliarden Parameter — im Vergleich zu Hunderten Milliarden bei Cloud-Modellen. Trotzdem liefern sie fuer viele Alltagsaufgaben ausreichend gute Ergebnisse.
On-Device LLMs loesen mehrere Probleme, die bei Cloud-basierten Modellen auftreten.
| Merkmal | Cloud-LLM | On-Device LLM |
|---|---|---|
| Datenschutz | Daten werden an externe Server gesendet | Daten bleiben auf dem Geraet |
| Latenz | Abhaengig von Netzwerkgeschwindigkeit | Sofortige Verarbeitung |
| Offline-Faehigkeit | Nur mit Internetverbindung | Funktioniert ohne Internet |
| Kosten | Laufende API-Kosten pro Anfrage | Keine laufenden Kosten nach Installation |
| Modellqualitaet | Groessere, leistungsfaehigere Modelle | Kleinere Modelle mit Einschraenkungen |
Mehrere Technologieunternehmen bieten bereits On-Device-Loesungen an:
Fuer Unternehmen sind On-Device LLMs besonders relevant, wenn sensible Daten im Spiel sind.
On-Device LLMs bringen KI-Faehigkeiten direkt auf das Endgeraet — ohne Cloud-Abhaengigkeit, ohne Datenuebertragung, ohne Latenz. Die Modelle sind kleiner und weniger leistungsfaehig als ihre Cloud-Pendants, genuegen aber fuer viele Alltagsaufgaben. Fuer Unternehmen mit hohen Datenschutzanforderungen bieten sie eine Moeglichkeit, KI-Funktionen zu nutzen, ohne sensible Daten an Dritte weiterzugeben.
Die bereitgestellten Informationen dienen ausschließlich der allgemeinen Orientierung. Für Richtigkeit, Vollständigkeit und Aktualität wird keine Gewähr übernommen. Die Inhalte sind nicht rechtsverbindlich und nicht Bestandteil einer Leistungsbeschreibung.