# Loslegen

- [Unsloth-Dokumentation](https://unsloth.ai/docs/de/loslegen/readme.md): Unsloth ist ein Open-Source-Framework zum Ausführen und Trainieren von Modellen.
- [Feinabstimmung für Anfänger](https://unsloth.ai/docs/de/loslegen/fine-tuning-for-beginners.md)
- [Unsloth-Anforderungen](https://unsloth.ai/docs/de/loslegen/fine-tuning-for-beginners/unsloth-requirements.md): Hier sind die Anforderungen von Unsloth, einschließlich System- und GPU-VRAM-Anforderungen.
- [FAQ + Ist Feinabstimmung das Richtige für mich?](https://unsloth.ai/docs/de/loslegen/fine-tuning-for-beginners/faq-+-is-fine-tuning-right-for-me.md): Wenn du unsicher bist, ob Feinabstimmung das Richtige für dich ist, sieh hier nach! Erfahre mehr über Missverständnisse zur Feinabstimmung, wie sie sich im Vergleich zu RAG verhält und mehr:
- [Unsloth-Notebooks](https://unsloth.ai/docs/de/loslegen/unsloth-notebooks.md): Notebooks zur Feinabstimmung: Entdecke den Unsloth-Katalog.
- [Unsloth-Modellkatalog](https://unsloth.ai/docs/de/loslegen/unsloth-model-catalog.md)
- [Unsloth-Installation](https://unsloth.ai/docs/de/loslegen/install.md): Lerne, Unsloth lokal oder online zu installieren.
- [Unsloth via pip und uv installieren](https://unsloth.ai/docs/de/loslegen/install/pip-install.md): Um Unsloth lokal über Pip zu installieren, befolge die folgenden Schritte:
- [Unsloth auf MacOS installieren](https://unsloth.ai/docs/de/loslegen/install/mac.md)
- [Wie man LLMs unter Windows mit Unsloth feinabstimmt (Schritt-für-Schritt-Anleitung)](https://unsloth.ai/docs/de/loslegen/install/windows-installation.md): Sieh, wie du Unsloth unter Windows installierst, um lokal mit der Feinabstimmung von LLMs zu beginnen.
- [Unsloth via Docker installieren](https://unsloth.ai/docs/de/loslegen/install/docker.md): Unsloth mit unserem offiziellen Docker-Container installieren
- [Unsloth aktualisieren](https://unsloth.ai/docs/de/loslegen/install/updating.md): Um eine alte Version von Unsloth zu aktualisieren oder zu verwenden, befolge die folgenden Schritte:
- [Leitfaden zur Feinabstimmung von LLMs auf AMD-GPUs mit Unsloth](https://unsloth.ai/docs/de/loslegen/install/amd.md): Lerne, wie man große Sprachmodelle (LLMs) auf AMD-GPUs mit Unsloth feinabstimmt.
- [AMD AI Reinforcement Learning Hackathon mit Unsloth](https://unsloth.ai/docs/de/loslegen/install/amd/amd-hackathon.md): Lerne praktische Techniken für Reinforcement Learning für KI-Modelle mit Unsloth von Daniel Han, dem Ersteller von Unsloth.
- [LLMs auf Intel-GPUs mit Unsloth feinabstimmen](https://unsloth.ai/docs/de/loslegen/install/intel.md): Lerne, wie man große Sprachmodelle auf Intel-GPUs trainiert und feinabstimmt.
- [Conda-Installation](https://unsloth.ai/docs/de/loslegen/install/conda-install.md): Um Unsloth lokal mit Conda zu installieren, befolge die folgenden Schritte:
- [Wie man LLMs in VS Code mit Unsloth und Colab-GPUs feinabstimmt](https://unsloth.ai/docs/de/loslegen/install/vs-code.md): Leitfaden zur Feinabstimmung von Modellen direkt in Visual Studio Code über Unsloth und Google Colab.
- [Google Colab](https://unsloth.ai/docs/de/loslegen/install/google-colab.md): Um Unsloth auf Google Colab zu installieren und auszuführen, befolge die folgenden Schritte:
- [Leitfaden zur Feinabstimmung von LLMs](https://unsloth.ai/docs/de/loslegen/fine-tuning-llms-guide.md): Lerne alle Grundlagen und Best Practices der Feinabstimmung. Anfängerfreundlich.
- [Leitfaden zu Datensätzen](https://unsloth.ai/docs/de/loslegen/fine-tuning-llms-guide/datasets-guide.md): Lerne, wie man einen Datensatz für die Feinabstimmung erstellt und vorbereitet.
- [Leitfaden zu Hyperparametern für LoRA-Feinabstimmung](https://unsloth.ai/docs/de/loslegen/fine-tuning-llms-guide/lora-hyperparameters-guide.md): Lerne Schritt für Schritt die besten Einstellungen für die Feinabstimmung von LLMs – LoRA-Rang & Alpha, Epochen, Batchgröße + Gradient Accumulation, QLoRA vs. LoRA, Zielmodule und mehr.
- [Welches Modell sollte ich für die Feinabstimmung verwenden?](https://unsloth.ai/docs/de/loslegen/fine-tuning-llms-guide/what-model-should-i-use.md)
- [Tutorial: Wie man Llama-3 feinabstimmt und in Ollama verwendet](https://unsloth.ai/docs/de/loslegen/fine-tuning-llms-guide/tutorial-how-to-finetune-llama-3-and-use-in-ollama.md): Anfängerleitfaden zum Erstellen eines maßgeschneiderten persönlichen Assistenten (wie ChatGPT), der lokal in Ollama läuft
- [Leitfaden zu Reinforcement Learning (RL)](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide.md): Lerne alles über Reinforcement Learning (RL) und wie du mit Unsloth und GRPO dein eigenes DeepSeek-R1-Reasoning-Modell trainierst. Ein vollständiger Leitfaden von Anfänger bis Fortgeschrittene.
- [Reinforcement Learning GRPO mit 7x längerem Kontext](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/grpo-long-context.md): Lerne, wie Unsloth ultralange Kontext-RL-Feinabstimmung ermöglicht.
- [Vision Reinforcement Learning (VLM RL)](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/vision-reinforcement-learning-vlm-rl.md): Trainiere Vision-/Multimodal-Modelle via GRPO und RL mit Unsloth!
- [FP8 Reinforcement Learning](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/fp8-reinforcement-learning.md): Trainiere Reinforcement Learning (RL) und GRPO mit FP8-Präzision mit Unsloth.
- [Tutorial: Trainiere dein eigenes Reasoning-Modell mit GRPO](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/tutorial-train-your-own-reasoning-model-with-grpo.md): Anfängerleitfaden, um ein Modell wie Llama 3.1 (8B) mithilfe von Unsloth und GRPO in ein Reasoning-Modell zu verwandeln.
- [Dokumentation für fortgeschrittenes Reinforcement Learning](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/advanced-rl-documentation.md): Erweiterte Dokumentationseinstellungen bei der Verwendung von Unsloth mit GRPO.
- [GSPO Reinforcement Learning](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/advanced-rl-documentation/gspo-reinforcement-learning.md): Trainiere mit GSPO (Group Sequence Policy Optimization) RL in Unsloth.
- [RL Reward Hacking](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/advanced-rl-documentation/rl-reward-hacking.md): Lerne, was Reward Hacking im Reinforcement Learning ist und wie man es bekämpft.
- [FP16 vs BF16 für RL](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/advanced-rl-documentation/fp16-vs-bf16-for-rl.md): Defeating the Training-Inference Mismatch via FP16 https://arxiv.org/pdf/2510.26788 zeigt, dass die Verwendung von float16 besser ist als bfloat16
- [Speichereffizientes RL](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/memory-efficient-rl.md)
- [Training zur Präferenzoptimierung - DPO, ORPO & KTO](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/preference-dpo-orpo-and-kto.md): Lerne über Präferenzabstimmungs-Feinabstimmung mit DPO, GRPO, ORPO oder KTO über Unsloth; befolge die folgenden Schritte:
- [KI-Agenten mit RL trainieren](https://unsloth.ai/docs/de/loslegen/reinforcement-learning-rl-guide/training-ai-agents-with-rl.md): Lerne, wie man KI-Agenten für Aufgaben aus der realen Welt mit Reinforcement Learning (RL) trainiert.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/de/loslegen.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
