sparkleNVIDIA DGX Spark と Unsloth を使った LLM ファインチューニング

NVIDIA DGX Spark 上で OpenAI gpt-oss を使ってファインチューニングや強化学習(RL)を行う方法のチュートリアル。

Unslothは最大 200Bのパラメータ を持つLLMのローカルファインチューニングをNVIDIA DGX™ Spark上で可能にします。128 GBのユニファイドメモリにより、次のような大規模モデルをトレーニングできます: gpt-oss-120b、およびDGX Spark上で直接推論を実行またはデプロイできます。

で示されているように OpenAI DevDayarrow-up-right、gpt-oss-20bはDGX Spark上でRLとUnslothを用いて2048を自動で勝利するように訓練されました。DGX Spark上のDockerコンテナまたは仮想環境でUnslothを使用してトレーニングできます。

このチュートリアルでは、DGX SparkにUnslothをインストールした後、Unslothノートブックを使ってRLでgpt-oss-20bをトレーニングします。gpt-oss-120bはおおよそ 68GB のユニファイドメモリを使用します。

1,000ステップおよび4時間のRLトレーニングの後、gpt-ossモデルは2048で元のモデルを大きく上回り、さらに長いトレーニングで結果はさらに改善されます。

UnslothがOpenAI DevDay 2025で紹介された様子を視聴できます ここarrow-up-right.
RLで訓練されたgpt-ossは2048で一貫して優れた性能を発揮します。

⚡ ステップバイステップチュートリアル

1

DGX Spark用Unsloth Dockerイメージから始める

まず、DGX Spark用Dockerfileを使用してDockerイメージをビルドします。Dockerfileは こちらで見つけることができますarrow-up-right。または、DGX Sparkのターミナルで以下を実行できます:

次に、保存したDockerfileを使ってトレーニング用Dockerイメージをビルドします:

chevron-rightDGX Spark用の完全なDockerfileを見るにはここをクリックできますhashtag
2

コンテナを起動

GPUアクセスとボリュームマウントでトレーニングコンテナを起動:

3

Jupyterを起動してノートブックを実行

コンテナ内でJupyterを起動し、必要なノートブックを実行します。Reinforcement Learning gpt-oss 20bを使用して2048に勝つノートブックを使用できます ノートブックはこちらarrow-up-right。実際、すべての Unslothノートブックarrow-up-right は、インストールセルを削除するだけでDGX Sparkで動作します(含まれている 120b ノートブックも同様です)。

以下のコマンドはRLノートブックを実行するためにも使用できます。Jupyter Notebookを起動したら、“gpt_oss_20B_RL_2048_Game.ipynb

Unslothはファインチューニング後にモデルを 保存して実行する ことも可能なので、ファインチューニング後にローカルで直接DGX Sparkにデプロイできます。

多大な感謝を Lakshmi Ramesharrow-up-right および Barath Anandanarrow-up-right に、UnslothのDGX SparkローンチとDockerイメージ構築の支援をしてくれたNVIDIAへ。

ユニファイドメモリの使用状況

gpt-oss-120bのQLoRA 4ビットファインチューニングはおおよそ 68GB のユニファイドメモリを使用します。ユニファイドメモリの使用状況は次のように表示されるべきです (左)および その後に (右)のトレーニング:

以上です!NVIDIA DGX Spark上で完全にローカルにLLMをトレーニングおよび実行して楽しんでください!

ビデオチュートリアル

に感謝します AnythingLLMarrow-up-right がDGX SparkでのUnslothを使った素晴らしいファインチューニングチュートリアルを提供してくれました:

最終更新

役に立ちましたか?