AMD GPU での Unsloth による LLM ファインチューニングガイド

Unsloth を使って AMD GPU 上で大規模言語モデル（LLM）をファインチューニングする方法を学びます。

Unslothを使って、ローカルのAMD環境でLLMをファインチューニングできるようになりました。UnslothはAMD Radeon RX、MI300X（192GB）GPUなどをサポートしています。

新しい隔離環境を作成する（任意）

システムのパッケージを壊さないように、隔離されたpip環境を作成できます。お使いのPythonバージョンを確認することを忘れないでください！以下の可能性があります pip3, pip3.13, python3, python.3.13 など。

apt install python3.10-venv python3.11-venv python3.12-venv python3.13-venv -y

python -m venv unsloth_env
source unsloth_env/bin/activate

PyTorchをインストール

最新のPyTorch、TorchAO、Xformersを以下からインストールしてください https://pytorch.org/ ROCMバージョンを確認するには amd-smi version 次に変更します https://download.pytorch.org/whl/rocm7.0 に合わせてください。

uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm7.0 --upgrade --force-reinstall

また、必要であれば正しいROCMバージョンを抽出する単一のターミナルコマンドも用意しました。

ROCM_TAG="$({ command -v amd-smi >/dev/null 2>&1 && amd-smi version 2>/dev/null | awk -F'ROCm version: ' 'NF>1{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { [ -r /opt/rocm/.info/version ] && awk -F. '{print "rocm"$1"."$2; exit}' /opt/rocm/.info/version; } || { command -v hipconfig >/dev/null 2>&1 && hipconfig --version 2>/dev/null | awk -F': *' '/HIP version/{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { command -v dpkg-query >/dev/null 2>&1 && ver="$(dpkg-query -W -f="${Version}\n" rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; } || { command -v rpm >/dev/null 2>&1 && ver="$(rpm -q --qf '%{VERSION}\n' rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; })"; [ -n "$ROCM_TAG" ] && uv pip install torch torchvision torchaudio --index-url "https://download.pytorch.org/whl/$ROCM_TAG" --upgrade --force-reinstall

Unslothをインストール

Unslothの専用AMDブランチをインストール：

pip install --no-deps unsloth unsloth-zoo
pip install --no-deps git+https://github.com/unslothai/unsloth-zoo.git
pip install "unsloth[amd] @ git+https://github.com/unslothai/unsloth"

Unslothでファインチューニングを開始！

以上です。いくつかの例を私たちの Unslothノートブック ページで試してみてください！

私たちの専用のファインチューニングまたは強化学習ガイドを見ることができます。

🔢 AMD GPUでの強化学習

私たちの 📒gpt-oss RL auto win 2048 の例はMI300X（192GB）GPUで使用できます。目標は2048ゲームを自動でプレイし、RLで勝利することです。LLM（gpt-oss 20b）は2048ゲームに勝つ戦略を自動的に考案し、勝利する戦略には高い報酬を、失敗する戦略には低い報酬を与えます。

報酬は約300ステップ前後で時間とともに増加します！

RLの目標は、2048ゲームで勝つために平均報酬を最大化することです。

私たちはUnslothで2048のRL例を実行するためにAMD MI300X（192GB）マシンを使用し、うまく動作しました！

また、私たちの 📒自動カーネル生成RLノートブックもgpt-ossとともに使用して、Pythonで行列乗算カーネルを自動生成できます。このノートブックは報酬ハッキングに対抗するための複数の手法も提供します。

これらのカーネルを自動生成するために使用したプロンプトは次のとおりです：

ネイティブなPythonコードのみを用いて、新しい高速な行列乗算関数を作成してください。
あなたには数値のリストのリストが与えられます。
以下の形式でバッククォート内に新しい関数を出力してください：
```
python
def matmul(A, B):
    return ...
```

RLプロセスは、例えばPython内でより高速な行列乗算を行うためにストラッセンアルゴリズムを適用する方法を学習します。

📚AMDの無料ワンクリックノートブック

AMDはDev Cloudを通じて、以下を備えたワンクリックノートブックを提供しています： 無料の192GB VRAM MI300X GPU で大規模モデルを完全に無料で（サインアップやクレジットカード不要で）トレーニングできます：

Loading GitHub Notebook - AMD Dev Cloudoneclickamd.ai

任意のUnslothノートブックを使用するには、先頭に次を付けてください https://oneclickamd.ai/github/unslothai/notebooks/blob/main/nb に Unsloth ノートブックリンクを次のように変更して https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Gemma3_(270M).ipynb に https://oneclickamd.ai/github/unslothai/notebooks/blob/main/nb/Gemma3_(270M).ipynb

前へWindows 次へIntel

最終更新 22 日前

役に立ちましたか？

hashtag🔢 AMD GPUでの強化学習

hashtag📚AMDの無料ワンクリックノートブック

🔢 AMD GPUでの強化学習

📚AMDの無料ワンクリックノートブック