Guide : Affinage de LLM sur GPU AMD avec Unsloth

Apprenez comment affiner des grands modèles de langage (LLM) sur des GPU AMD avec Unsloth.

Vous pouvez désormais effectuer l'affinage (fine-tuning) de LLM localement sur votre configuration AMD avec Unsloth. Unsloth prend en charge les GPU AMD Radeon RX, MI300X (192 Go) et d'autres.

Créer un nouvel environnement isolé (Optionnel)

Pour ne pas casser les paquets système, vous pouvez créer un environnement pip isolé. Pensez à vérifier la version de Python que vous avez ! Il se peut que ce soit pip3, pip3.13, python3, python.3.13 etc.

apt install python3.10-venv python3.11-venv python3.12-venv python3.13-venv -y

python -m venv unsloth_env
source unsloth_env/bin/activate

Installer PyTorch

Installez la dernière version de PyTorch, TorchAO, Xformers depuis https://pytorch.org/ Vérifiez votre version de ROCM via amd-smi version puis changez https://download.pytorch.org/whl/rocm7.0 pour qu'elle corresponde.

uv pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm7.0 --upgrade --force-reinstall

Nous avons également écrit une seule commande terminal pour extraire la version ROCM correcte si cela peut aider.

ROCM_TAG="$({ command -v amd-smi >/dev/null 2>&1 && amd-smi version 2>/dev/null | awk -F'ROCm version: ' 'NF>1{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { [ -r /opt/rocm/.info/version ] && awk -F. '{print "rocm"$1"."$2; exit}' /opt/rocm/.info/version; } || { command -v hipconfig >/dev/null 2>&1 && hipconfig --version 2>/dev/null | awk -F': *' '/HIP version/{split($2,a,"."); print "rocm"a[1]"."a[2]; ok=1; exit} END{exit !ok}'; } || { command -v dpkg-query >/dev/null 2>&1 && ver="$(dpkg-query -W -f="${Version}\n" rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; } || { command -v rpm >/dev/null 2>&1 && ver="$(rpm -q --qf '%{VERSION}\n' rocm-core 2>/dev/null)" && [ -n "$ver" ] && awk -F'[.-]' '{print "rocm"$1"."$2; exit}' <<<"$ver"; })"; [ -n "$ROCM_TAG" ] && uv pip install torch torchvision torchaudio --index-url "https://download.pytorch.org/whl/$ROCM_TAG" --upgrade --force-reinstall

Installer Unsloth

Installez la branche AMD dédiée d'Unsloth :

pip install --no-deps unsloth unsloth-zoo
pip install --no-deps git+https://github.com/unslothai/unsloth-zoo.git
pip install "unsloth[amd] @ git+https://github.com/unslothai/unsloth"

Commencez l'affinage avec Unsloth !

Et c'est tout. Essayez quelques exemples dans notre Notebooks Unsloth page !

Vous pouvez consulter notre affinage ou apprentissage par renforcement guides.

🔢 Apprentissage par renforcement sur GPU AMD

Vous pouvez utiliser notre 📒exemple gpt-oss RL auto win 2048 sur un GPU MI300X (192 Go). L'objectif est de jouer automatiquement au jeu 2048 et de le gagner avec le RL. Le LLM (gpt-oss 20b) élabore automatiquement une stratégie pour gagner au 2048, et nous attribuons une forte récompense aux stratégies gagnantes et de faibles récompenses aux stratégies qui échouent.

La récompense augmente au fil du temps après environ 300 étapes environ !

L'objectif pour le RL est de maximiser la récompense moyenne pour gagner au jeu 2048.

Nous avons utilisé une machine AMD MI300X (192 Go) pour exécuter l'exemple RL 2048 avec Unsloth, et cela a bien fonctionné !

Vous pouvez aussi utiliser notre 📒notebook RL de génération automatique de kernels également avec gpt-oss pour créer automatiquement des kernels de multiplication de matrices en Python. Le notebook propose aussi plusieurs méthodes pour contrer le piratage des récompenses.

Le prompt que nous avons utilisé pour créer automatiquement ces kernels était :

Créez une nouvelle fonction de multiplication de matrices rapide en n'utilisant que du code Python natif.
On vous fournit une liste de listes de nombres.
Sortez votre nouvelle fonction entre backticks en utilisant le format ci‑dessous :
```
python
def matmul(A, B):
    return ...
```

Le processus RL apprend par exemple comment appliquer l'algorithme de Strassen pour accélérer la multiplication de matrices en Python.

📚Notebooks AMD gratuits en un clic

AMD propose des notebooks en un clic équipés de GPU MI300X gratuits avec 192 Go de VRAM via leur Dev Cloud. Entraînez des modèles de grande taille complètement gratuitement (inscription ou carte de crédit non requise) :