Feinabstimmung von LLMs auf AMD-GPUs mit Unsloth - Anleitung

Lerne, wie man große Sprachmodelle (LLMs) auf AMD-GPUs mit Unsloth feinabstimmt.

Sie können jetzt LLMs mit Unsloth auf Ihrem eigenen lokalen AMD-Setup feinabstimmen. Unsloth unterstützt AMD Radeon RX, MI300X (192 GB) GPUs und mehr.

Erstellen Sie eine neue isolierte Umgebung (optional)

Um keine Systempakete zu beschädigen, können Sie eine isolierte pip-Umgebung erstellen. Erinnerung: Überprüfen Sie, welche Python-Version Sie haben! Es könnte sein pip3, pip3.13, python3, python.3.13 usw.

apt install python3.10-venv python3.11-venv python3.12-venv python3.13-venv -y

python -m venv unsloth_env
source unsloth_env/bin/activate

PyTorch installieren

Installieren Sie die neueste PyTorch-, TorchAO- und Xformers-Version von https://pytorch.org/ Überprüfen Sie Ihre ROCM-Version über amd-smi version dann ändern Sie https://download.pytorch.org/whl/rocm7.0 um sie anzupassen.

uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm7.0 --upgrade --force-reinstall

Wir haben auch einen einzelnen Terminalbefehl geschrieben, um die korrekte ROCM-Version zu extrahieren, falls das hilfreich ist.

ROCM_TAG="$({ command -v amd-smi >/dev/null 2>&1 && amd-smi version 2>/dev/null | awk -F'ROCm version: ' 'NF>1{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { [ -r /opt/rocm/.info/version ] && awk -F. '{print "rocm"$1"."$2; exit}' /opt/rocm/.info/version; } || { command -v hipconfig >/dev/null 2>&1 && hipconfig --version 2>/dev/null | awk -F': *' '/HIP version/{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { command -v dpkg-query >/dev/null 2>&1 && ver="$(dpkg-query -W -f="${Version}\n" rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; } || { command -v rpm >/dev/null 2>&1 && ver="$(rpm -q --qf '%{VERSION}\n' rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; })"; [ -n "$ROCM_TAG" ] && uv pip install torch torchvision torchaudio --index-url "https://download.pytorch.org/whl/$ROCM_TAG" --upgrade --force-reinstall

Unsloth installieren

Installieren Sie die dedizierte AMD-Branch von Unsloth:

pip install --no-deps unsloth unsloth-zoo
pip install --no-deps git+https://github.com/unslothai/unsloth-zoo.git
pip install "unsloth[amd] @ git+https://github.com/unslothai/unsloth"

Beginnen Sie mit der Feinabstimmung mit Unsloth!

Und das war's. Probieren Sie einige Beispiele in unseren Unsloth-Notebooks Seite!

Sie können unsere dedicated Feinabstimmung oder Verstärkungslernen Anleitungen ansehen.

🔢 Verstärkungslernen auf AMD-GPUs

Sie können unser 📒gpt-oss RL auto win 2048 Beispiel auf einer MI300X (192 GB) GPU verwenden. Das Ziel ist, das 2048-Spiel automatisch mit RL zu spielen und zu gewinnen. Das LLM (gpt-oss 20b) entwickelt automatisch eine Strategie, um das 2048-Spiel zu gewinnen; wir bewerten gewinnende Strategien mit hoher Belohnung und erfolglose Strategien mit niedrigen Belohnungen.

Die Belohnung steigt im Laufe der Zeit nach etwa 300 Schritten oder so!

Das Ziel für RL ist es, die durchschnittliche Belohnung zu maximieren, um das 2048-Spiel zu gewinnen.

Wir verwendeten eine AMD MI300X-Maschine (192 GB), um das 2048-RL-Beispiel mit Unsloth auszuführen, und es funktionierte gut!

Sie können auch unser 📒Notebook zur automatischen Kernel-Generierung für RL auch mit gpt-oss verwenden, um automatisch Matrixmultiplikations-Kernel in Python zu erstellen. Das Notebook entwickelt außerdem mehrere Methoden, um Reward-Hacking entgegenzuwirken.

Das Prompt, das wir verwendet haben, um diese Kernel automatisch zu erstellen, war:

Erstellen Sie eine neue schnelle Matrixmultiplikationsfunktion, die nur nativen Python-Code verwendet.
Sie erhalten eine Liste von Listen mit Zahlen.
Geben Sie Ihre neue Funktion in Backticks im folgenden Format aus:
```
python
def matmul(A, B):
    return ...
```

Der RL-Prozess lernt zum Beispiel, wie man den Strassen-Algorithmus anwendet, um schnellere Matrixmultiplikation in Python zu erreichen.

📚AMD Free One-Click-Notebooks

AMD stellt One-Click-Notebooks mit kostenlosen 192GB VRAM MI300X-GPUs über ihre Dev Cloud zur Verfügung. Trainieren Sie große Modelle völlig kostenlos (keine Anmeldung oder Kreditkarte erforderlich):

Loading GitHub Notebook - AMD Dev Cloudoneclickamd.ai

Sie können jedes Unsloth-Notebook verwenden, indem Sie voranstellen https://oneclickamd.ai/github/unslothai/notebooks/blob/main/nb in Unsloth-Notebooks indem Sie den Link ändern von https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Gemma3_(270M).ipynb zu https://oneclickamd.ai/github/unslothai/notebooks/blob/main/nb/Gemma3_(270M).ipynb

VorherigeWindows NächsteIntel

Zuletzt aktualisiert vor 18 Tagen

War das hilfreich?

hashtag🔢 Verstärkungslernen auf AMD-GPUs

hashtag📚AMD Free One-Click-Notebooks

🔢 Verstärkungslernen auf AMD-GPUs

📚AMD Free One-Click-Notebooks