square-up-rightFinetuning von LLMs auf AMD-GPUs mit Unsloth - Anleitung

Lerne, wie man große Sprachmodelle (LLMs) auf AMD-GPUs mit Unsloth finetunt.

Sie können jetzt LLMs lokal auf Ihrem eigenen AMD-Setup mit Unsloth feinabstimmen. Unsloth unterstützt AMD Radeon RX, MI300X (192GB)-GPUs und mehr.

1

Erstellen Sie eine neue isolierte Umgebung (optional)

Um keine Systempakete zu beschädigen, können Sie eine isolierte pip-Umgebung erstellen. Erinnerung daran, welche Python-Version Sie haben! Es könnte sein pip3, pip3.13, python3, python.3.13 usw.

apt install python3.10-venv python3.11-venv python3.12-venv python3.13-venv -y

python -m venv unsloth_env
source unsloth_env/bin/activate
2

Installieren Sie PyTorch

Installieren Sie das neueste PyTorch, TorchAO, Xformers von https://pytorch.org/arrow-up-right Überprüfen Sie Ihre ROCM-Version über amd-smi version dann ändern Sie https://download.pytorch.org/whl/rocm7.0 um sie anzupassen.

uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm7.0 --upgrade --force-reinstall

Wir haben auch einen einzelnen Terminalbefehl geschrieben, um die korrekte ROCM-Version zu extrahieren, falls das hilft.

ROCM_TAG="$({ command -v amd-smi >/dev/null 2>&1 && amd-smi version 2>/dev/null | awk -F'ROCm version: ' 'NF>1{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { [ -r /opt/rocm/.info/version ] && awk -F. '{print "rocm"$1"."$2; exit}' /opt/rocm/.info/version; } || { command -v hipconfig >/dev/null 2>&1 && hipconfig --version 2>/dev/null | awk -F': *' '/HIP version/{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { command -v dpkg-query >/dev/null 2>&1 && ver="$(dpkg-query -W -f="${Version}\n" rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; } || { command -v rpm >/dev/null 2>&1 && ver="$(rpm -q --qf '%{VERSION}\n' rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; })"; [ -n "$ROCM_TAG" ] && uv pip install torch torchvision torchaudio --index-url "https://download.pytorch.org/whl/$ROCM_TAG" --upgrade --force-reinstall
3

Installieren Sie Unsloth

Installieren Sie Unsloths dedizierten AMD-Zweig:

pip install --no-deps unsloth unsloth-zoo
pip install --no-deps git+https://github.com/unslothai/unsloth-zoo.git
pip install "unsloth[amd] @ git+https://github.com/unslothai/unsloth"
4

Starten Sie die Feinabstimmung mit Unsloth!

Und das war's. Probieren Sie einige Beispiele in unseren Unsloth-Notebooks Seite!

Sie können unseren dedizierten Feinabstimmungs- oder Reinforcement-Learning- Anleitungen ansehen.

🔢 Reinforcement Learning auf AMD-GPUs

Sie können unser 📒gpt-oss RL auto win 2048arrow-up-right Beispiel auf einer MI300X (192GB)-GPU verwenden. Das Ziel ist es, das 2048-Spiel automatisch zu spielen und mit RL zu gewinnen. Das LLM (gpt-oss 20b) entwickelt automatisch eine Strategie, um das 2048-Spiel zu gewinnen; wir berechnen hohe Belohnungen für Gewinnstrategien und niedrige Belohnungen für scheiternde Strategien.

Die Belohnung steigt im Laufe der Zeit nach etwa 300 Schritten oder so!

Das Ziel für RL ist es, die durchschnittliche Belohnung zu maximieren, um das 2048-Spiel zu gewinnen.

Wir haben eine AMD MI300X-Maschine (192GB) verwendet, um das 2048-RL-Beispiel mit Unsloth auszuführen, und es hat gut funktioniert!

Sie können auch unser 📒Notizbuch für automatische Kernel-Generierung RLarrow-up-right auch mit gpt-oss verwenden, um automatisch Matrixmultiplikations-Kernel in Python zu erstellen. Das Notebook entwickelt auch mehrere Methoden, um Belohnungsmanipulation entgegenzuwirken.

Die Eingabeaufforderung, die wir verwendet haben, um diese Kernel automatisch zu erstellen, war:

Der RL-Prozess lernt zum Beispiel, wie man den Strassen-Algorithmus anwendet, um die Matrixmultiplikation in Python zu beschleunigen.

📚AMD Free One-Click-Notebooks

AMD bietet One-Click-Notebooks an, die ausgestattet sind mit kostenlosen 192GB VRAM MI300X-GPUs über ihre Dev Cloud. Trainieren Sie große Modelle völlig kostenlos (keine Anmeldung oder Kreditkarte erforderlich):

Sie können jedes Unsloth-Notebook verwenden, indem Sie voranstellen https://oneclickamd.ai/github/unslothai/notebooks/blob/main/nb in Unsloth-Notebooks indem Sie den Link ändern von https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Gemma3_(270M).ipynbarrow-up-right zu https://oneclickamd.ai/github/unslothai/notebooks/blob/main/nb/Gemma3_(270M).ipynbarrow-up-right

Zuletzt aktualisiert

War das hilfreich?