square-up-rightFinetuning von LLMs auf AMD-GPUs mit Unsloth-Anleitung

Lerne, wie man große Sprachmodelle (LLMs) auf AMD-GPUs mit Unsloth finetunt.

Sie können jetzt LLMs mit Unsloth auf Ihrem eigenen lokalen AMD-Setup feinabstimmen. Unsloth unterstützt AMD Radeon RX, MI300X (192 GB) GPUs und mehr.

1

Erstellen Sie eine neue isolierte Umgebung (optional)

Um keine Systempakete zu beschädigen, können Sie eine isolierte pip-Umgebung erstellen. Erinnerung: Überprüfen Sie, welche Python-Version Sie haben! Es könnte sein pip3, pip3.13, python3, python.3.13 usw.

apt install python3.10-venv python3.11-venv python3.12-venv python3.13-venv -y

python -m venv unsloth_env
source unsloth_env/bin/activate
2

PyTorch installieren

Installieren Sie die neueste PyTorch-, TorchAO- und Xformers-Version von https://pytorch.org/arrow-up-right Überprüfen Sie Ihre ROCM-Version über amd-smi version dann ändern Sie https://download.pytorch.org/whl/rocm7.0 um sie anzupassen.

uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm7.0 --upgrade --force-reinstall

Wir haben auch einen einzelnen Terminalbefehl geschrieben, um die korrekte ROCM-Version zu extrahieren, falls das hilfreich ist.

ROCM_TAG="$({ command -v amd-smi >/dev/null 2>&1 && amd-smi version 2>/dev/null | awk -F'ROCm version: ' 'NF>1{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { [ -r /opt/rocm/.info/version ] && awk -F. '{print "rocm"$1"."$2; exit}' /opt/rocm/.info/version; } || { command -v hipconfig >/dev/null 2>&1 && hipconfig --version 2>/dev/null | awk -F': *' '/HIP version/{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { command -v dpkg-query >/dev/null 2>&1 && ver="$(dpkg-query -W -f="${Version}\n" rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; } || { command -v rpm >/dev/null 2>&1 && ver="$(rpm -q --qf '%{VERSION}\n' rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; })"; [ -n "$ROCM_TAG" ] && uv pip install torch torchvision torchaudio --index-url "https://download.pytorch.org/whl/$ROCM_TAG" --upgrade --force-reinstall
3

Unsloth installieren

Installieren Sie die dedizierte AMD-Branch von Unsloth:

pip install --no-deps unsloth unsloth-zoo
pip install --no-deps git+https://github.com/unslothai/unsloth-zoo.git
pip install "unsloth[amd] @ git+https://github.com/unslothai/unsloth"
4

Beginnen Sie mit der Feinabstimmung mit Unsloth!

Und das war's. Probieren Sie einige Beispiele in unseren Unsloth-Notebooks Seite!

Sie können unsere dedicated Feinabstimmung oder Verstärkungslernen Anleitungen ansehen.

🔢 Verstärkungslernen auf AMD-GPUs

Sie können unser 📒gpt-oss RL auto win 2048arrow-up-right Beispiel auf einer MI300X (192 GB) GPU verwenden. Das Ziel ist, das 2048-Spiel automatisch mit RL zu spielen und zu gewinnen. Das LLM (gpt-oss 20b) entwickelt automatisch eine Strategie, um das 2048-Spiel zu gewinnen; wir bewerten gewinnende Strategien mit hoher Belohnung und erfolglose Strategien mit niedrigen Belohnungen.

Die Belohnung steigt im Laufe der Zeit nach etwa 300 Schritten oder so!

Das Ziel für RL ist es, die durchschnittliche Belohnung zu maximieren, um das 2048-Spiel zu gewinnen.

Wir verwendeten eine AMD MI300X-Maschine (192 GB), um das 2048-RL-Beispiel mit Unsloth auszuführen, und es funktionierte gut!

Sie können auch unser 📒Notebook zur automatischen Kernel-Generierung für RLarrow-up-right auch mit gpt-oss verwenden, um automatisch Matrixmultiplikations-Kernel in Python zu erstellen. Das Notebook entwickelt außerdem mehrere Methoden, um Reward-Hacking entgegenzuwirken.

Das Prompt, das wir verwendet haben, um diese Kernel automatisch zu erstellen, war:

Der RL-Prozess lernt zum Beispiel, wie man den Strassen-Algorithmus anwendet, um schnellere Matrixmultiplikation in Python zu erreichen.

📚AMD Free One-Click-Notebooks

AMD stellt One-Click-Notebooks mit kostenlosen 192GB VRAM MI300X-GPUs über ihre Dev Cloud zur Verfügung. Trainieren Sie große Modelle völlig kostenlos (keine Anmeldung oder Kreditkarte erforderlich):

Sie können jedes Unsloth-Notebook verwenden, indem Sie voranstellen https://oneclickamd.ai/github/unslothai/notebooks/blob/main/nb in Unsloth-Notebooks indem Sie den Link ändern von https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Gemma3_(270M).ipynbarrow-up-right zu https://oneclickamd.ai/github/unslothai/notebooks/blob/main/nb/Gemma3_(270M).ipynbarrow-up-right

Zuletzt aktualisiert

War das hilfreich?