dockerUnsloth & Docker を使った LLM ファインチューニング方法

Unsloth の Docker イメージを使って LLM をファインチューニングしたり強化学習(RL)を行う方法を学びます。

ローカルトレーニングは依存関係の地獄や環境の破損により複雑になることがあります。Unslothの Dockerイメージarrow-up-right はこれらの問題を回避できます。セットアップは不要:イメージをプルして実行し、トレーニングを開始してください。

なぜUnslothとDockerを使うのか?

UnslothのDockerイメージは安定しており、最新で、 サポートされているセットアップ (例:Windows)で動作します。

  • 完全に含まれた依存関係によりシステムはクリーンに保たれます。root権限なしで安全に実行されます。

  • ローカルでも、ノートブックが事前にインストールされた任意のプラットフォームでも使用できます。

circle-check

⚡ ステップバイステップチュートリアル

1

DockerとNVIDIA Container Toolkitをインストールします。

Dockerをインストール(via) Linuxarrow-up-right または デスクトップarrow-up-right (その他)。 その後、次をインストールします NVIDIA Container Toolkitarrow-up-right:

export NVIDIA_CONTAINER_TOOLKIT_VERSION=1.17.8-1
sudo apt-get update && sudo apt-get install -y \
  nvidia-container-toolkit=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  nvidia-container-toolkit-base=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  libnvidia-container-tools=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  libnvidia-container1=${NVIDIA_CONTAINER_TOOLKIT_VERSION}
2

コンテナを実行します。

unsloth/unslotharrow-up-right はUnslothの唯一のDockerイメージです。と Blackwell および50シリーズGPUには、この同じイメージを使用してください — 別個のイメージは不要です。DGX Sparkを使用する場合は、当社の DGXガイド.

docker run -d -e JUPYTER_PASSWORD="mypassword" \
  -p 8888:8888 -p 2222:22 \
  -v $(pwd)/work:/workspace/work \
  --gpus all \
  unsloth/unsloth
3

Jupyter Labにアクセス

に移動します http://localhost:8888arrow-up-right そしてUnslothを開きます。

にアクセス unsloth-notebooks タブでUnslothのノートブックを確認できます。

4

Unslothでトレーニングを開始

初めての場合は、当社のステップバイステップの ファインチューニングガイド, RLガイド に従うか、または単に当社の事前作成された ノートブック.

を保存/コピーしてください。

  • 📂 コンテナ構成 /workspace/work/

  • — マウントされた作業ディレクトリ /workspace/unsloth-notebooks/

  • — ファインチューニングの例ノートブック /home/unsloth/

— ユーザーホームディレクトリ

📖 使用例

-p 8000:8000 -p 2222:22 \

SSHキーの設定

ssh -i ~/.ssh/container_key -p 2222 unsloth@localhost

⚙️ 詳細設定
変数
説明

デフォルト

JUPYTER_PASSWORD

unsloth

Jupyter Labのパスワード

JUPYTER_PORT

8888

コンテナ内のJupyter Labポート

SSH_KEY

認証用のSSH公開鍵

なし

USER_PASSWORD unsloth のパスワード

unsloth

  • -p <host_port>:<container_port> Jupyter Lab:

  • -p 8000:8888 SSHアクセス:

circle-exclamation

-v <local_folder>:<container_folder>

  • 🔒 セキュリティ注意事項 unsloth コンテナはデフォルトで非root

  • 使用する なし ユーザーとして実行されます

  • コンテナ内でのsudo操作には、公開鍵認証が必要です

最終更新

役に立ちましたか?