For the complete documentation index, see llms.txt. This page is also available as Markdown.

Affinage des LLM avec Blackwell, la série RTX 50 et Unsloth

Apprenez à affiner des LLM sur les GPU Blackwell RTX 50 et B200 de NVIDIA grâce à notre guide étape par étape.

Unsloth prend désormais en charge les GPU de l’architecture Blackwell de NVIDIA, y compris les GPU RTX série 50 (5060–5090), RTX PRO 6000, ainsi que des GPU tels que B200, B40, GB100, GB102 et plus encore ! Vous pouvez lire l’article officiel de blog NVIDIA ici.

Unsloth est maintenant compatible avec tous les GPU NVIDIA depuis 2018+, y compris le DGX Spark.

Notre nouvelle image Docker prend en charge Blackwell. Exécutez l’image Docker et commencez l’entraînement ! Guide

Installation pip

Installez simplement Unsloth :

pip install unsloth

Si vous rencontrez des problèmes, une autre option consiste à créer un environnement isolé séparé :

python -m venv unsloth
source unsloth/bin/activate
pip install unsloth

Notez que cela pourrait être pip3 http://localhost:8888 pip3.13 et aussi python3 http://localhost:8888 python3.13

Vous pourriez rencontrer certains problèmes avec Xformers, auquel cas vous devriez compiler depuis les sources :

# Désinstallez d’abord xformers installé par les bibliothèques précédentes
pip uninstall xformers -y

# Cloner et compiler
pip install ninja
export TORCH_CUDA_ARCH_LIST="12.0"
git clone --depth=1 https://github.com/facebookresearch/xformers --recursive
cd xformers && python setup.py install && cd ..

Docker

unsloth/unsloth est la seule image Docker d’Unsloth. Pour Blackwell et les GPU série 50, utilisez cette même image - aucune image séparée n’est nécessaire.

Pour les instructions d’installation, veuillez suivre notre guide Docker Unsloth.

uv

uv (Avancé)

L’ordre d’installation est important, puisque nous voulons écraser les dépendances regroupées avec des versions spécifiques (à savoir, xformers et triton).

  1. Je préfère utiliser uv plutôt que pip car c’est plus rapide et meilleur pour résoudre les dépendances, en particulier pour les bibliothèques qui dépendent de torch mais pour lesquelles une version spécifique de CUDA est requise dans ce scénario.

    Installer uv

    Créez un répertoire de projet et un venv :

  2. Installer vllm

    Notez que nous devons spécifier cu128, sinon vllm installera torch==2.7.0 mais avec des dépendances cu126.

  3. Installer . Une fois le modèle chargé, l’URL du point de terminaison et la clé API s’affichent dans votre console. Copiez-les dans le client de votre choix et vous êtes prêt. dependencies

    Si vous remarquez d’étranges problèmes de résolution dus à Xformers, vous pouvez aussi installer Unsloth depuis les sources sans Xformers :

  4. Télécharger et compiler xformers (Optionnel)

    Xformers est optionnel, mais il est nettement plus rapide et utilise moins de mémoire. Nous utiliserons le SDPA natif de PyTorch si vous ne voulez pas Xformers. Compiler Xformers depuis les sources peut être lent, alors attention !

    Notez que nous devons définir explicitement TORCH_CUDA_ARCH_LIST=12.0.

  5. transformers Installez n’importe quelle version de transformers, mais il est préférable d’obtenir la plus récente.

Conda ou mamba (Avancé)

  1. Installer conda/mamba

    Exécutez le script d’installation

    Créez un environnement conda ou mamba

    Activez l’environnement nouvellement créé

  2. Installer vllm

    Assurez-vous d’être dans l’environnement conda/mamba activé. Vous devriez voir le nom de votre environnement comme préfixe dans votre terminal, comme ceci votre (unsloth-blackwell)user@machine:

    Notez que nous devons spécifier cu128, sinon vllm installera torch==2.7.0 mais avec des dépendances cu126.

  3. Installer . Une fois le modèle chargé, l’URL du point de terminaison et la clé API s’affichent dans votre console. Copiez-les dans le client de votre choix et vous êtes prêt. dependencies

    Assurez-vous d’être dans l’environnement conda/mamba activé. Vous devriez voir le nom de votre environnement comme préfixe dans votre terminal, comme ceci votre (unsloth-blackwell)user@machine:

  4. Télécharger et compiler xformers (Optionnel)

    Xformers est optionnel, mais il est nettement plus rapide et utilise moins de mémoire. Nous utiliserons le SDPA natif de PyTorch si vous ne voulez pas Xformers. Compiler Xformers depuis les sources peut être lent, alors attention !

    Vous devriez voir le nom de votre environnement comme préfixe dans votre terminal, comme ceci votre (unsloth-blackwell)user@machine:

    Notez que nous devons définir explicitement TORCH_CUDA_ARCH_LIST=12.0.

  5. Mettre à jour triton

    Assurez-vous d’être dans l’environnement conda/mamba activé. Vous devriez voir le nom de votre environnement comme préfixe dans votre terminal, comme ceci votre (unsloth-blackwell)user@machine:

    triton>=3.3.1 est requis pour la prise en charge de Blackwell .

  6. Transformers Installez n’importe quelle version de transformers, mais il est préférable d’obtenir la plus récente.

Si vous utilisez mamba comme gestionnaire de paquets, remplacez simplement conda par mamba pour toutes les commandes affichées ci-dessus.

Notes spécifiques à WSL

Si vous utilisez WSL (Windows Subsystem for Linux) et rencontrez des problèmes pendant la compilation de xformers (rappel : Xformers est optionnel, mais plus rapide pour l’entraînement), suivez ces étapes supplémentaires :

  1. Augmenter la limite de mémoire WSL Créez ou modifiez le fichier de configuration WSL :

    Après avoir effectué ces modifications, redémarrez WSL :

  2. Installer xformers Utilisez la commande suivante pour installer xformers avec une compilation optimisée pour WSL :

    Le --no-build-isolation drapeau aide à éviter les problèmes potentiels de compilation dans les environnements WSL.

Mis à jour

Ce contenu vous a-t-il été utile ?