# Feinabstimmung von LLMs auf der NVIDIA DGX Station mit Unsloth Sie können jetzt LLMs lokal auf Ihrer NVIDIA DGX Station mit trainieren [Unsloth](https://github.com/unslothai/unsloth). Die DGX Station verfügt über mehr als **\~200GB VRAM** und über **700GB vereinheitlichten GPU/CPU-Speicher** und kombiniert eine Grace-CPU und eine Blackwell-GPU in einem eng verbundenen System, das für groß angelegte KI-Workloads ausgelegt ist. Durch NVLink-C2C verbunden bleiben CPU und GPU getrennt, arbeiten jedoch weit effizienter zusammen als in einer klassischen CPU-GPU-Konfiguration. In diesem Leitfaden verwenden wir Unsloth-Notebooks, um zu trainieren [Qwen3.5](#qwen3.5-35b-a3b-fine-tuning) und [gpt-oss-120b](#gpt-oss-120b-fine-tuning) auf der DGX Station. Vielen Dank an NVIDIA für die Bereitstellung von frühem Zugang zur DGX Station-Hardware, um Unsloth darauf zu testen! ### Schnellstart Sie benötigen `python3` installiert; insbesondere werden die Entwickler-Header benötigt. Auf unserem System haben wir `python 3.12` deshalb werden wir die 3.12-Dev-Header installieren. ```bash sudo apt update sudo apt install python3.12-dev ``` Erstellen Sie dann eine frische virtuelle Umgebung, um zu installieren [Unsloth](https://github.com/unslothai/unsloth). Auf diese Weise minimieren wir Abhängigkeitskonflikte und bewahren den Zustand der aktuellen Arbeitsumgebung. {% code overflow="wrap" %} ```bash python3 -m venv .unsloth source .unsloth/bin/activate pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu130 ``` {% endcode %} {% hint style="warning" %} Installieren Sie zuerst `torch` aus dem `cuda 13` Index, andernfalls könnten wir die CPU-Version oder eine Inkompatibilität in Architektur und Fähigkeiten erhalten! {% endhint %}

Jetzt können wir Unsloth installieren: ```bash pip install unsloth ```

Nun lassen Sie uns installieren `xformers` und optional bauen `flash-attention` aus dem Quellcode. Beide Pakete benötigen Zeit, also bitte haben Sie Geduld, während sie gebaut werden. {% code overflow="wrap" expandable="true" %} ```bash pip install --no-deps --no-build-isolation xformers==0.0.33.post1 # Optional flash-attn # Klonen und bauen (zielt auf sm_100 für B300) git clone https://github.com/Dao-AILab/flash-attention cd flash-attention # B300 = sm_100, Architektur explizit setzen TORCH_CUDA_ARCH_LIST="10.0" MAX_JOBS=8 pip install . --no-build-isolation cd .. ``` {% endcode %}

{% columns %} {% column %} Für Qwen 3.5 MoE möchten wir zwei Kernel-Pakete herunterladen `flash-linear-attention` und `causal-conv1d` um es schnell zu machen. {% code overflow="wrap" expandable="true" %} ```bash pip install --no-build-isolation flash-linear-attention causal_conv1d==1.6.0 ``` {% endcode %} {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} Wenn Sie noch keinen Notebook-Client haben, installieren Sie einen. Für diesen Leitfaden verwenden wir Jupyter Notebook: {% code overflow="wrap" expandable="true" %} ```bash cd .. pip install notebook pip install ipywidgets ``` {% endcode %} Schließlich laden wir die eigentlichen Unsloth-Notebooks zum Ausführen herunter. Es gibt mehr als 250 Notebooks für LLM-Training sowie Python-Skripte. {% code overflow="wrap" expandable="true" %} ```bash git clone https://github.com/unslothai/notebooks.git cd notebooks ``` {% endcode %} ### Trainingstutorials {% columns %} {% column %} Jetzt können wir Jupyter Notebook starten und in einem Browser zur Benutzeroberfläche navigieren. {% code overflow="wrap" expandable="true" %} ```bash jupyter notebook ``` {% endcode %} {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} Kopieren Sie die `localhost` Site mit Token-Parameter und fügen Sie sie in Ihren Browser ein. Sie sollten etwa Folgendes sehen: Der `nb` Ordner enthält alle Notebooks zum Ausführen. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} #### Qwen3.5-35B-A3B Training {% columns %} {% column %} Öffnen Sie die Datei `nb/Qwen3_5_MoE.ipynb`. Überspringen Sie den Installationsabschnitt, da wir bereits alles Notwendige vorher installiert haben. Navigieren Sie zum Unsloth-Abschnitt und beginnen Sie dort mit der Ausführung der Zellen. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} Das Notebook behandelt Modellkonfiguration, Datensatzvorbereitung und Trainer-Konfiguration. Jeder Schritt kann einige Zeit in Anspruch nehmen, da wir ein sehr großes Modell herunterladen, Milliarden von Gewichten initialisieren und weiter optimieren, damit es schnell läuft. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} Das Training ist mit den Standardeinstellungen sehr schnell. Auf der DGX Station gibt es ausreichend Speicher, sodass Sie mit den standardmäßigen Trainings-Hyperparametern spielen können, um Speicher und Rechenleistung wirklich auszureizen. Nach dem Training können Sie das Modell für später speichern, das Modell zum Teilen in das Hugging Face Hub hochladen oder in ein quantisiertes Format exportieren. #### gpt-oss-120b Training {% columns %} {% column %} Öffnen Sie die Datei `nb/gpt-oss-(120B)_A100-Fine-tuning.ipynb`. Überspringen Sie den Installationsabschnitt, da wir die Voraussetzungen bereits installiert haben, und navigieren Sie zum Unsloth-Abschnitt. Wir können das Notebook von dort aus ausführen. Das Notebook wird etwa 72 GB GPU-Speicher verwenden und etwa 10 Minuten dauern. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} {% columns %} {% column %} Jede Zelle kann einige Zeit zum Ausführen benötigen, da wir das Modell herunterladen, die Gewichte initialisieren und weiter optimieren müssen, um ein schnelles Erlebnis zu gewährleisten. Das Notebook behandelt die Datenvorverarbeitung und die Einrichtung des Trainers. Sobald wir zur `trainer.train()` Zelle gelangen und diese ausführen, beginnt das Training. {% endcolumn %} {% column %}

{% endcolumn %} {% endcolumns %} Jetzt können wir das Modell nach Abschluss für die spätere Verwendung speichern, es ins Hugging Face Hub hochladen, um es mit der Welt zu teilen, oder es ins GGUF-Format exportieren.

Lesen Sie mehr über NVIDIAs DGX Station unter --- # Agent Instructions: Querying This Documentation If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question. Perform an HTTP GET request on the current page URL with the `ask` query parameter: ``` GET https://unsloth.ai/docs/de/blog/dgx-station.md?ask= ``` The question should be specific, self-contained, and written in natural language. The response will contain a direct answer to the question and relevant excerpts and sources from the documentation. Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.