# Unsloth Studio vorstellen Heute bringen wir **Unsloth Studio** (Beta) auf den Markt: eine Open-Source-Web-UI ohne Code zum Trainieren, Ausführen und Exportieren offener Modelle in einer einheitlichen **lokalen** Oberfläche. Schnellstart Funktionen Github * **GGUF ausführen** und safetensor-Modelle lokal auf **Mac**, Windows, Linux ausführen. * 500+ Modelle 2x schneller trainieren mit 70 % weniger VRAM (kein Genauigkeitsverlust) * Text-, Vision-, TTS-Audio- und Embedding-Modelle ausführen und trainieren {% hint style="success" %} **Für die neuesten Updates siehe unsere** [**neue Changelog-Seite hier**](/docs/de/neu/changelog.md)**!** ✨ {% endhint %}

* **MacOS** und **CPU** funktionieren für [Chat](#run-models-locally) GGUF-Inferenz und [Datenrezepte](/docs/de/neu/studio/data-recipe.md). MLX-Training kommt bald. * Kein Datensatz erforderlich. [**Datensätze automatisch erstellen**](/docs/de/neu/studio/data-recipe.md) aus **PDF, CSV, JSON, DOCX, TXT** Dateien. * [Exportieren oder speichern](/docs/de/neu/studio/export.md) Sie Ihr Modell als GGUF, 16-Bit-Safetensor usw. * [**Selbstheilendes Tool-Calling**](/docs/de/neu/studio/chat.md#auto-healing-tool-calling) / erweitert [**Websuche**](/docs/de/neu/studio/chat.md#advanced-web-search) + [**Code-Ausführung**](/docs/de/neu/studio/chat.md#code-execution) * [Automatische Inferenz-Einstellungen](/docs/de/neu/studio/chat.md#auto-parameter-tuning), Chat-Vorlagen bearbeiten, Unsloth als [**API-Endpunkt**](#unsloth-as-an-api-endpoint). ## ⭐ Funktionen {% columns %} {% column %} ### **Modelle lokal ausführen** [GGUFs suchen und ausführen](/docs/de/neu/studio/chat.md) und safetensor-Modelle mit selbstheilender [Tool-Aufrufen](#execute-code--heal-tool-calling), erweiterten [Websuche](/docs/de/neu/studio/chat.md#advanced-web-search), [automatischen Inferenz](/docs/de/neu/studio/chat.md#auto-parameter-tuning) Einstellungen, [**Code-Ausführung**](/docs/de/neu/studio/chat.md#code-execution) (Bash + Python), [APIs](/docs/de/grundlagen/api.md). Bilder, Dokumente, Audio, Code hochladen. [Modelle Seite an Seite vergleichen](/docs/de/neu/studio.md#model-arena). Angetrieben von llama.cpp + Hugging Face unterstützt Unsloth **Multi-GPU-Inferenz,** automatisches Auslagern und Anpassen sowie die meisten Modelle. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} ### Code ausführen + Tool-Calling reparieren Unsloth Studio lässt LLMs Bash und Python ausführen, nicht nur JavaScript. Es sandboxt außerdem Programme wie Claude Artifacts, sodass Modelle Code testen, Dateien generieren und Antworten mit echter Berechnung verifizieren können. Z. B. suchte Qwen3.5-4B auf 20+ Websites und zitierte Quellen, wobei die Websuche innerhalb seines Denkverlaufs stattfand. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} ### Unsloth als API-Endpunkt Sie können lokale LLMs jetzt über Tools wie [Claude Code](/docs/de/grundlagen/claude-code.md) und [Codex](/docs/de/grundlagen/codex.md) verwenden, indem Sie es mit [Unsloths API-Endpunkt](/docs/de/grundlagen/api.md)verbinden. Das bedeutet, dass Sie Qwen- und Gemma-Modelle in diesen Tools direkt mit Unsloths Inferenz ausführen können, einschließlich Funktionen wie selbstheilendes Tool-Calling, Websuche usw. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} ### **Training ohne Code** [PDF, CSV, JSON,](#data-recipes) Doks oder YAML-Konfigurationen hochladen und sofort auf NVIDIA mit dem Training beginnen. Die Kernel von Unsloth optimieren LoRA, FP8, FFT, PT über 500+ Text-, Vision-, TTS-/Audio- und Embedding-Modelle hinweg. Die neuesten LLMs feinabstimmen wie [Qwen3.5](/docs/de/modelle/qwen3.5/fine-tune.md) und NVIDIA [Nemotron 3](/docs/de/modelle/nemotron-3.md). [Multi-GPU](/docs/de/grundlagen/multi-gpu-training-with-unsloth.md) funktioniert automatisch, eine neue Version ist unterwegs. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} ### Datenrezepte [**Datenrezepte**](/docs/de/neu/studio/data-recipe.md) verwandelt Ihre Dokumente über einen Graph-Node-Workflow in nutzbare / synthetische Datensätze. Laden Sie unstrukturierte oder strukturierte Dateien wie PDFs, CSV und JSON hoch. Unsloth Data Recipes, betrieben von NVIDIA Nemo [Data Designer](https://github.com/NVIDIA-NeMo/DataDesigner), wandelt Dokumente automatisch in Ihre gewünschten Formate um. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} ### Beobachtbarkeit Gewinnen Sie [vollständige Transparenz](/docs/de/neu/studio/start.md#training-progress) über und Kontrolle über Ihre Trainingsläufe. Verfolgen Sie den Trainingsverlust, die Gradienten-Normen und die GPU-Auslastung in Echtzeit und passen Sie alles nach Ihren Wünschen an. Sie können den Trainingsfortschritt sogar auf anderen Geräten wie Ihrem Telefon ansehen. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} ### Modelle exportieren / speichern [**Jedes Modell exportieren**](/docs/de/neu/studio/export.md), einschließlich Ihrer feinabgestimmten Modelle, in safetensors oder GGUF zur Verwendung mit llama.cpp, vLLM, Ollama, LM Studio und mehr. Speichert Ihren Trainingsverlauf, sodass Sie Läufe erneut aufrufen, erneut exportieren und experimentieren können. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} ### Modell-Arena Chatten Sie mit und [vergleichen Sie 2 verschiedene](/docs/de/neu/studio/chat.md#model-arena) Modelle, z. B. ein Basismodell und ein feinabgestimmtes, um zu sehen, wie sich ihre Ausgaben unterscheiden. Laden Sie einfach Ihr erstes GGUF/Modell, dann das zweite, und voilà! Die Inferenz lädt zunächst das eine Modell, dann das zweite. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} ### Datenschutz zuerst + Sicher Unsloth Studio kann 100 % offline und lokal auf Ihrem Computer verwendet werden. Seine tokenbasierte Authentifizierung, einschließlich verschlüsseltem Passwort sowie JWT-Zugriffs- / Refresh-Flows, hält Ihre Daten sicher. Sie können bereits vorhandene / alte Modelle oder GGUFs verwenden, die zuvor von HF usw. heruntergeladen wurden. Lesen Sie [Anweisungen hier](/docs/de/neu/studio/chat.md#using-old-existing-gguf-models). {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% hint style="warning" %} Bitte beachten Sie, dass dies die **BETA** Version von Unsloth Studio ist. Erwarten Sie in den kommenden Tagen und Wochen viele Verbesserungen, Fehlerbehebungen und neue Funktionen. {% endhint %} ## ⚡ Schnellstart Unsloth Studio funktioniert auf Windows, Linux, WSL und MacOS (derzeit nur Chat). * **CPU:** Unsloth funktioniert auch ohne GPU, aber nur für [Chat](#run-models-locally) Inferenz und [Datenrezepte](/docs/de/neu/studio/data-recipe.md). * **Training:** Funktioniert auf **NVIDIA**: RTX 30, 40, 50, Blackwell, DGX Spark/Station usw. + **Intel** GPUs * **Mac:** Wie CPU - Chat und [Datenrezepte](/docs/de/neu/studio/data-recipe.md) funktioniert derzeit nur. **MLX** Training kommt sehr bald. * **AMD:** Chat funktioniert. Trainieren mit [Unsloth Core](/docs/de/loslegen/install/amd.md). Studio-Unterstützung kommt bald. * **Demnächst verfügbar:** Trainingsunterstützung für **Apple MLX** und **AMD.** * **Multi-GPU:** Funktioniert bereits, mit einem größeren Upgrade in Arbeit. Verwenden Sie zum Aktualisieren dieselben Installationsbefehle unten: ### **MacOS, Linux, WSL:** ```bash curl -fsSL https://unsloth.ai/install.sh | sh ``` ### **Windows PowerShell:** ```bash irm https://unsloth.ai/install.ps1 | iex ``` #### Unsloth starten ```bash unsloth studio -H 0.0.0.0 -p 8888 ``` ### Docker: Verwenden Sie unser offizielles **Docker-Image**: [`unsloth/unsloth`](https://hub.docker.com/r/unsloth/unsloth) das derzeit für Windows, WSL und Linux funktioniert. MacOS-Unterstützung kommt bald. {% code overflow="wrap" expandable="true" %} ```bash docker run -d -e JUPYTER_PASSWORD="mypassword" \ -p 8888:8888 -p 8000:8000 -p 2222:22 \ -v $(pwd)/work:/workspace/work \ --gpus all \ unsloth/unsloth ``` {% endcode %} {% hint style="success" %} **Die Erstinstallation sollte jetzt 6x schneller sein und aufgrund vorab kompilierter llama.cpp-Binärdateien 50 % kleiner.** {% endhint %} **Für weitere Details zur Installation und Deinstallation besuchen Sie bitte den** [**Unsloth Studio-Installations**](/docs/de/neu/studio/install.md) **Abschnitt.** {% content-ref url="/pages/fd472c5a40e73b8e54cee17244010f121bf38286" %} [Installation](/docs/de/neu/studio/install.md) {% endcontent-ref %} ### Google Colab-Notebook Wir haben ein [kostenloses Google Colab-Notebook](https://colab.research.google.com/github/unslothai/unsloth/blob/main/studio/Unsloth_Studio_Colab.ipynb) erstellt, damit Sie alle Funktionen von Unsloth auf Colabs T4-GPUs erkunden können. Sie können die meisten Modelle bis zu 22B Parametern trainieren und ausführen und für größere Modelle auf eine größere GPU umschalten. Klicken Sie einfach auf 'Run all', und die UI sollte nach der Installation erscheinen. {% columns %} {% column %} {% embed url="" %} Sobald die Installation abgeschlossen ist, scrollen Sie zu **Start Unsloth Studio** und klicken Sie auf **Open Unsloth Studio** in der weißen Box, die links angezeigt wird: **Scrollen Sie weiter nach unten, um die eigentliche UI zu sehen.** {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% hint style="warning" %} Manchmal kann der Studio-Link einen Fehler zurückgeben. Das passiert, weil Sie möglicherweise Cookies deaktiviert haben oder einen Adblocker oder Mozilla verwenden. Sie können weiterhin auf die UI zugreifen, indem Sie unterhalb des Buttons scrollen. {% endhint %} ## Workflow Hier ist ein typischer Workflow von Unsloth Studio, um Ihnen den Einstieg zu erleichtern: 1. Studio starten von [Installationsanweisungen](/docs/de/neu/studio/install.md). 2. Laden Sie ein Modell aus lokalen Dateien oder einer unterstützten Integration. 3. Importieren Sie Trainingsdaten aus PDFs, CSVs oder JSONL-Dateien, oder erstellen Sie einen Datensatz von Grund auf neu. 4. Bereinigen, verfeinern und erweitern Sie Ihren Datensatz in [Datenrezepte](/docs/de/neu/studio/data-recipe.md). 5. Beginnen Sie mit dem Training mit empfohlenen Presets oder passen Sie die Konfiguration selbst an. 6. Chatten Sie mit dem trainierten Modell und vergleichen Sie seine Ausgaben mit dem Basismodell. 7. [Speichern oder exportieren](/docs/de/neu/studio.md#export-save-models) Sie lokal in den Stack, den Sie bereits verwenden. Sie können unsere einzelnen Deep Dives zu jedem Abschnitt von Unsloth Studio lesen: {% columns %} {% column width="50%" %} {% content-ref url="/pages/bf6b637872d3a9f534daa54866ec7d33d9b369a2" %} [Get Started](/docs/de/neu/studio/start.md) {% endcontent-ref %} {% content-ref url="/pages/13c9d0063a9732a68734b74792f3e30153873bf4" %} [Model Export](/docs/de/neu/studio/export.md) {% endcontent-ref %} {% endcolumn %} {% column width="50%" %} {% content-ref url="/pages/dd9f9c69fff351709e4886e820d7d6facf3ec2b3" %} [Data Recipes](/docs/de/neu/studio/data-recipe.md) {% endcontent-ref %} {% content-ref url="/pages/73168493b14a89fa27e95b776ade6bd93679a3e5" %} [Studio Chat](/docs/de/neu/studio/chat.md) {% endcontent-ref %} {% endcolumn %} {% endcolumns %} ## Video-Tutorials {% hint style="warning" %} Die in den Videos gezeigten Unsloth-Studio-Versionen sind alt und geben die aktuelle Version nicht wieder. {% endhint %} {% columns fullWidth="false" %} {% column %} {% embed url="" fullWidth="false" %} Hier ist ein von NVIDIA erstelltes Video-Tutorial, um Ihnen den Einstieg in Studio zu erleichtern: {% endcolumn %} {% column %} {% embed url="" %} So installieren Sie Unsloth Studio Video-Tutorial {% endcolumn %} {% endcolumns %} ## FAQ **Sammelt oder speichert Unsloth Daten?**\ Unsloth sammelt keine Nutzungs-Telemetriedaten. Unsloth sammelt nur die minimalen Hardwareinformationen, die für die Kompatibilität erforderlich sind, wie z. B. GPU-Typ und Gerät (z. B. Mac). Unsloth Studio läuft 100 % offline und lokal. **Wie verwende ich ein altes / vorhandenes Modell, das ich zuvor von Hugging Face heruntergeladen habe?**\ Ja, Sie können bereits vorhandene / alte Modelle oder GGUFs verwenden, die Sie zuvor von Hugging Face usw. heruntergeladen haben. Sie sollten jetzt automatisch von Unsloth erkannt werden, andernfalls lesen Sie unsere [Anweisungen hier](/docs/de/neu/studio/chat.md#using-old-existing-gguf-models). **Warum ist die Inferenz in Unsloth manchmal langsamer?**\ Unsloth wird wie andere lokale Inferenz-Apps von llama.cpp angetrieben, daher sollten die Geschwindigkeiten größtenteils gleich sein. Manchmal kann Unsloth langsamer sein, weil Sie Websuche, Codeausführung oder selbstheilendes Tool-Calling aktiviert haben. All diese Funktionen können Ihre Inferenz verlangsamen. Wenn der Geschwindigkeitsunterschied bei deaktivierten allen Funktionen immer noch langsamer ist, erstellen Sie bitte ein GitHub-Issue! **Unterstützt Unsloth Studio OpenAI-kompatible APIs?**\ Ja, siehe unseren [API-Endpunkt-Leitfaden hier](/docs/de/grundlagen/api.md). **Steht Unsloth jetzt unter der Lizenz AGPL-3.0?**\ Unsloth verwendet ein Dual-Licensing-Modell aus Apache 2.0 und AGPL-3.0. Das Kernpaket von Unsloth bleibt lizenziert unter [**Apache 2.0**](https://github.com/unslothai/unsloth?tab=Apache-2.0-1-ov-file), während bestimmte optionale Komponenten, wie die Unsloth-Studio-UI, lizenziert sind unter [**AGPL-3.0**](https://github.com/unslothai/unsloth?tab=AGPL-3.0-2-ov-file). Diese Struktur trägt dazu bei, die fortlaufende Entwicklung von Unsloth zu unterstützen, während das Projekt Open Source bleibt und das breitere Ökosystem weiter wachsen kann. **Unterstützt Studio nur LLMs?**\ Nein. Studio unterstützt eine Reihe unterstützter `transformers` kompatibler Modellfamilien, einschließlich Text-, multimodaler Modelle, [Text-zu-Sprache](/docs/de/grundlagen/text-to-speech-tts-fine-tuning.md), Audio, [Embeddings](/docs/de/grundlagen/embedding-finetuning.md), und BERT-ähnlichen Modellen. **Kann ich meine eigene Trainingskonfiguration verwenden?**\ Ja. Importieren Sie eine YAML-Konfiguration, und Studio füllt die relevanten Einstellungen voraus. **Wie kann ich meine Kontextlänge anpassen?**\ Eine Anpassung der Kontextlänge ist mit dem intelligenten Auto-Kontext von llama.cpp nicht mehr notwendig, da nur der benötigte Kontext verwendet wird, ohne etwas Zusätzliches zu laden. Bald werden wir die Funktion trotzdem noch hinzufügen, falls Sie sie verwenden möchten. **Müssen Sie Modelle trainieren, um die UI zu nutzen?**\ Nein, Sie können einfach jedes GGUF oder Modell herunterladen, ohne ein Modell feinabzustimmen. #### Zukunft von Unsloth Wir arbeiten hart daran, Open-Source-KI so zugänglich wie möglich zu machen. Als Nächstes veröffentlichen wir für Unsloth und Unsloth Studio die offizielle Unterstützung für: Multi-GPU, Apple Silicon/MLX und AMD. Erinnerung: Dies ist die BETA-Version von Unsloth Studio, also erwarten Sie in den kommenden Wochen viele Ankündigungen und Verbesserungen. Wir arbeiten außerdem eng mit NVIDIA an der Multi-GPU-Unterstützung zusammen, um das bestmögliche und einfachste Erlebnis zu bieten. #### Danksagungen Ein großes Dankeschön an NVIDIA und Hugging Face, dass sie Teil unseres Launches sind. Außerdem vielen Dank an alle frühen Beta-Tester von Unsloth Studio; wir schätzen Ihre Zeit und Ihr Feedback sehr. Wir möchten uns auch bei llama.cpp, PyTorch und open model labs dafür bedanken, dass sie die Infrastruktur bereitgestellt haben, die Unsloth Studio möglich gemacht hat. --- # Agent Instructions: Querying This Documentation If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question. Perform an HTTP GET request on the current page URL with the `ask` query parameter: ``` GET https://unsloth.ai/docs/de/neu/studio.md?ask= ``` The question should be specific, self-contained, and written in natural language. The response will contain a direct answer to the question and relevant excerpts and sources from the documentation. Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.