# Unsloth-Dokumentation Unsloth ermöglicht es Ihnen, KI-Modelle auf Ihrer eigenen lokalen Hardware auszuführen und zu trainieren. Unsere Doku führt Sie durch das lokale Ausführen und Trainieren Ihres eigenen Modells. Loslegen Unser GitHub

		Titelbild
Qwen3.6	Das neue Modell Qwen3.6-27B ist da!	/files/886818e8e3fce3c9103f22c33715d36f27c6c21a	/pages/efc00d6b1d286a029d0eec8a5a6a24d50b063840
Unsloth-API-Endpunkt	Führen Sie Inferenz mit Unsloth über unsere neue API aus.	/files/1cd126b6bc3f32688a987931c1d54a4680278773	/pages/70002e65495a1a44f155c9dabf1fb52b9d84de66
Google Gemma 4	Führen und trainieren Sie Googles neue Gemma-4-Modelle!	/files/2f875f196a54dad3331f08ac0392b28245c8612c	/pages/774ab7ebd11d30a8067d492668e9dd61a8b209fb
NVIDIA Nemotron 3 Omni	Führen Sie das stärkste 30B-Omi-Modell lokal aus.	/files/c979119f74bb412d3d09ab0f33a943cc6ec49dd8	/pages/78057bfde350b3d5e5b61e20e35b56d077a87d6e
Unsloth Studio vorstellen	Neue offene No-Code-Oberfläche zum Trainieren und Ausführen von LLMs.	/files/d7c42ebe749f1a6355e750ad6d546c1c25be81de	/pages/0eb7cfce0eb5651e720ac0944c9e36f7124bc8de
Kimi K2.6	Führen Sie das neue SOTA-Open-Model aus.	/files/f40e22686c5f036ee2a57cfaa09a75d8315b510d	/pages/66ff370179820adad5a2dd2711d47bd05d4bbe2e

{% columns %} {% column width="50%" %} {% content-ref url="/pages/44aed34263310d67280841ab6b72ea1e5648761f" %} [Fine-tuning Guide](/docs/de/loslegen/fine-tuning-llms-guide.md) {% endcontent-ref %} {% content-ref url="/pages/c96e3433e67c1b26226b1118128145a6ff8a990a" %} [Unsloth-Notebooks](/docs/de/loslegen/unsloth-notebooks.md) {% endcontent-ref %} {% endcolumn %} {% column width="50%" %} {% content-ref url="/pages/0d4e311c01cc0577c64d15b8a41f22ba29eab7fd" %} [All Our Models](/docs/de/loslegen/unsloth-model-catalog.md) {% endcontent-ref %} {% content-ref url="/pages/9b29615ab338f1d1924174468718cfeab406f641" %} [Complete LLM Directory](/docs/de/modelle/tutorials.md) {% endcontent-ref %} {% endcolumn %} {% endcolumns %} ### 🦥 Warum Unsloth? * Wir arbeiten direkt mit den Teams hinter [gpt-oss](https://docs.unsloth.ai/new/gpt-oss-how-to-run-and-fine-tune#unsloth-fixes-for-gpt-oss), [Qwen3](https://www.reddit.com/r/LocalLLaMA/comments/1kaodxu/qwen3_unsloth_dynamic_ggufs_128k_context_bug_fixes/), [Llama 4](https://github.com/ggml-org/llama.cpp/pull/12889), [Mistral](https://huggingface.co/mistralai/Mistral-Medium-3.5-128B/discussions/18), [Gemma 1-3](https://news.ycombinator.com/item?id=39671146) und [Phi-4](https://unsloth.ai/blog/phi4), wobei wir **kritische Fehler behoben haben** die die Modellgenauigkeit erheblich verbessert haben. Andrej Karpathy hat zum Beispiel [unsere Arbeit gelobt](https://x.com/karpathy/status/1765473722985771335). * Unsloth vereinfacht lokales Training, Inferenz, Daten und Bereitstellung * Unsloth unterstützt Inferenz und Training für über 500 Modelle: [Vision](/docs/de/grundlagen/vision-fine-tuning.md), [TTS](/docs/de/grundlagen/text-to-speech-tts-fine-tuning.md), [Embedding](/docs/de/grundlagen/embedding-finetuning.md), [RL](/docs/de/loslegen/reinforcement-learning-rl-guide.md) ### ⭐ Funktionen Unsloth ermöglicht es Ihnen, Modelle für Text, [Audio](https://unsloth.ai/docs/basics/text-to-speech-tts-fine-tuning), [Embedding](https://unsloth.ai/docs/new/embedding-finetuning), [Vision](https://unsloth.ai/docs/basics/vision-fine-tuning) und mehr auszuführen und zu trainieren. Unsloth bietet viele wichtige Funktionen sowohl für Inferenz als auch für Training: #### Inferenz * Suchen + herunterladen + jedes Modell ausführen, z. B. GGUFs, LoRA-Adapter, Safetensors. * [Selbstheilende Tool-Aufrufe](/docs/de/neu/studio/chat.md#auto-healing-tool-calling) / Websuche und Aufruf von OpenAI-kompatiblen APIs. * [Automatische Inferenzparameter](/docs/de/neu/studio/chat.md#auto-parameter-tuning) optimieren und Chatvorlagen bearbeiten. * [Exportieren oder speichern](/docs/de/neu/studio/export.md) Sie Ihr Modell als GGUF, 16-Bit-Safetensor usw. * [Ausgaben vergleichen](/docs/de/neu/studio/chat.md#model-arena) mit zwei verschiedenen Modellen nebeneinander. #### Training * Trainieren und [RL](/docs/de/loslegen/reinforcement-learning-rl-guide.md) über 500 Modelle \~2x schneller mit \~70 % weniger VRAM (kein Genauigkeitsverlust) * Unterstützt Full Fine-Tuning, Pre-Training, 4-Bit-, 16-Bit- und FP8-Training. * [Datensätze automatisch erstellen](/docs/de/neu/studio/data-recipe.md) aus PDF-, CSV- und DOCX-Dateien. Daten in einem visuellen Node-Workflow bearbeiten. * Beobachtbarkeit: Training live überwachen, Loss und GPU-Auslastung verfolgen, Diagramme anpassen * Effizienteste [**Reinforcement-Learning-**](/docs/de/loslegen/reinforcement-learning-rl-guide.md) Bibliothek, die für GRPO 80 % weniger VRAM verwendet, [FP8](/docs/de/loslegen/reinforcement-learning-rl-guide/fp8-reinforcement-learning.md) usw. * [Multi-GPU](/docs/de/grundlagen/multi-gpu-training-with-unsloth.md) funktioniert, aber eine viel bessere Version kommt bald! ### Schnellstart Unsloth unterstützt MacOS, Linux, [Windows](/docs/de/loslegen/install/windows-installation.md), [NVIDIA](/docs/de/loslegen/install/pip-install.md), Intel- und CPU-Setups. Siehe: [Unsloth-Anforderungen](/docs/de/loslegen/fine-tuning-for-beginners/unsloth-requirements.md). Verwenden Sie dieselben Befehle zum Aktualisieren: #### **MacOS, Linux, WSL:** ```bash curl -fsSL https://unsloth.ai/install.sh | sh ``` #### **Windows PowerShell:** ```bash irm https://unsloth.ai/install.ps1 | iex ``` #### Docker Verwenden Sie unser offizielles **Docker-Image**: [`unsloth/unsloth`](https://hub.docker.com/r/unsloth/unsloth) das derzeit für Windows, WSL und Linux funktioniert. MacOS-Unterstützung kommt bald. #### Unsloth starten ```bash unsloth studio -H 0.0.0.0 -p 8888 ``` ### Was ist Fine-Tuning und RL? Warum? [**Fine-Tuning** eines LLM](/docs/de/loslegen/fine-tuning-llms-guide.md) passt sein Verhalten an, erweitert das Domänenwissen und optimiert die Leistung für bestimmte Aufgaben. Durch das Fine-Tuning eines vortrainierten Modells (z. B. Llama-3.1-8B) auf einem Datensatz können Sie: * **Wissen aktualisieren**: Neue domänenspezifische Informationen einbringen. * **Verhalten anpassen**: Ton, Persönlichkeit oder Antwortstil des Modells anpassen. * **Für Aufgaben optimieren**: Genauigkeit und Relevanz für bestimmte Anwendungsfälle verbessern. [**Reinforcement Learning (RL)**](/docs/de/loslegen/reinforcement-learning-rl-guide.md) ist, wenn ein „Agent“ lernt, Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und **Feedback** in Form von **Belohnungen** oder **Strafen**. * **Aktion:** Was das Modell erzeugt (z. B. einen Satz). * **Belohnung:** Ein Signal, das angibt, wie gut oder schlecht die Aktion des Modells war (z. B. ob die Antwort den Anweisungen gefolgt ist? War sie hilfreich?). * **Umgebung:** Das Szenario oder die Aufgabe, an der das Modell arbeitet (z. B. die Beantwortung einer Frage eines Nutzers). **Beispiele für Fine-Tuning- oder RL-Anwendungsfälle**: * Ermöglicht es LLMs vorherzusagen, ob eine Überschrift ein Unternehmen positiv oder negativ beeinflusst. * Kann historische Kundeninteraktionen für genauere und individuellere Antworten nutzen. * LLM mit Rechtstexten feinabstimmen für Vertragsanalyse, Rechtsprechungsrecherche und Compliance. Sie können sich ein feinabgestimmtes Modell als einen spezialisierten Agenten vorstellen, der dafür entwickelt wurde, bestimmte Aufgaben effektiver und effizienter auszuführen. **Fine-Tuning kann alle Fähigkeiten von RAG replizieren**, aber nicht umgekehrt. {% columns %} {% column width="50%" %} {% content-ref url="/pages/247e762fc931f96d3998ecfa1a4402cf524e9e97" %} [FAQ + Ist Feinabstimmung das Richtige für mich?](/docs/de/loslegen/fine-tuning-for-beginners/faq-+-is-fine-tuning-right-for-me.md) {% endcontent-ref %} {% content-ref url="/pages/03532de69dfe0230fe5114e809721d8b7dd74ca6" %} [Inferenz & Bereitstellung](/docs/de/grundlagen/inference-and-deployment.md) {% endcontent-ref %} {% endcolumn %} {% column width="50%" %} {% content-ref url="/pages/5b0f8932321e8767d629a7ca0f24c3e9add748f5" %} [Reinforcement Learning Guide](/docs/de/loslegen/reinforcement-learning-rl-guide.md) {% endcontent-ref %} {% content-ref url="/pages/abe22dcb3049581e00371a1b82b9e9cf6821a9b0" %} [Dynamic 2.0 GGUFs](/docs/de/grundlagen/unsloth-dynamic-2.0-ggufs.md) {% endcontent-ref %} {% endcolumn %} {% endcolumns %}

--- # Agent Instructions: Querying This Documentation If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question. Perform an HTTP GET request on the current page URL with the `ask` query parameter: ``` GET https://unsloth.ai/docs/de/loslegen/readme.md?ask= ``` The question should be specific, self-contained, and written in natural language. The response will contain a direct answer to the question and relevant excerpts and sources from the documentation. Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.