sparkleAjustement des LLM avec NVIDIA DGX Spark et Unsloth

Tutoriel sur la façon d'affiner et de faire de l'apprentissage par renforcement (RL) avec OpenAI gpt-oss sur NVIDIA DGX Spark.

Unsloth permet l'affinage local de LLMs jusqu'à 200 milliards de paramètres sur le NVIDIA DGX™ Spark. Avec 128 Go de mémoire unifiée, vous pouvez entraîner des modèles massifs tels que gpt-oss-120b, et exécuter ou déployer l'inférence directement sur DGX Spark.

Comme montré à OpenAI DevDayarrow-up-right, gpt-oss-20b a été entraîné avec RL et Unsloth sur DGX Spark pour gagner automatiquement à 2048. Vous pouvez entraîner en utilisant Unsloth dans un conteneur Docker ou un environnement virtuel sur DGX Spark.

Dans ce tutoriel, nous allons entraîner gpt-oss-20b avec RL en utilisant les notebooks Unsloth après avoir installé Unsloth sur votre DGX Spark. gpt-oss-120b utilisera environ 68 Go de mémoire unifiée.

Après 1 000 étapes et 4 heures d'entraînement par RL, le modèle gpt-oss surpasse largement l'original sur 2048, et un entraînement plus long améliorerait encore les résultats.

Vous pouvez regarder Unsloth présenté lors d'OpenAI DevDay 2025 iciarrow-up-right.
gpt-oss entraîné avec RL surpasse constamment sur 2048.

⚡ Tutoriel étape par étape

1

Commencer avec l'image Docker Unsloth pour DGX Spark

Tout d'abord, construisez l'image Docker en utilisant le Dockerfile DGX Spark qui peut être trouvé iciarrow-up-right. Vous pouvez aussi exécuter ce qui suit dans un terminal sur le DGX Spark :

Ensuite, construisez l'image Docker d'entraînement en utilisant le Dockerfile sauvegardé :

chevron-rightVous pouvez aussi cliquer pour voir le Dockerfile complet pour DGX Sparkhashtag
2

Lancer le conteneur

Lancez le conteneur d'entraînement avec accès GPU et montages de volumes :

3

Démarrer Jupyter et exécuter les notebooks

Dans le conteneur, démarrez Jupyter et exécutez le notebook requis. Vous pouvez utiliser le notebook Reinforcement Learning gpt-oss 20b pour gagner à 2048 notebook iciarrow-up-right. En fait, tous les notebooks Unslotharrow-up-right fonctionnent sur DGX Spark y compris le 120b notebook ! Il suffit de supprimer les cellules d'installation.

Les commandes ci-dessous peuvent également être utilisées pour exécuter le notebook RL. Après le lancement de Jupyter Notebook, ouvrez le “gpt_oss_20B_RL_2048_Game.ipynb

N'oubliez pas qu'Unsloth vous permet aussi de sauvegarder et exécuter vos modèles après l'affinage afin que vous puissiez les déployer localement directement sur votre DGX Spark ensuite.

Un grand merci à Lakshmi Ramesharrow-up-right et Barath Anandanarrow-up-right de NVIDIA pour avoir aidé au lancement d'Unsloth sur DGX Spark et pour la construction de l'image Docker.

Utilisation de la mémoire unifiée

L'affinage QLoRA 4 bits de gpt-oss-120b utilisera environ 68 Go de mémoire unifiée. À quoi votre utilisation de la mémoire unifiée devrait ressembler avant (gauche) et après (droite) pendant l'entraînement :

Et voilà ! Amusez-vous à entraîner et exécuter des LLMs entièrement localement sur votre NVIDIA DGX Spark !

Tutoriels vidéo

Merci à Tim de AnythingLLMarrow-up-right pour avoir fourni un excellent tutoriel d'affinage avec Unsloth sur DGX Spark :

Mis à jour

Ce contenu vous a-t-il été utile ?