Unsloth Studioを始める

ファインチューニングスタジオ、データレシピ、モデルのエクスポート、チャットを始めるためのガイド。

Unsloth Studioは、コードを書かずにLLMをファインチューニングできる、ローカルで動作するブラウザベースのGUIです。学習パイプラインをすっきりしたインターフェースで包み込み、モデルの読み込み、データセットの整形、ハイパーパラメータの設定、ライブ学習の監視を行えます。

Studioデータレシピエクスポートチャット

Unsloth Studioをセットアップする

まず、ローカルインストールまたはクラウドオプションのいずれかを使ってUnsloth Studioを起動します。以下の インストール手順 をセットアップに合わせて進めるか、 無料のColab ノートブックを使ってください。ローカルセットアップの場合は、次を実行します:

unsloth studio -H 0.0.0.0 -p 8888

お好みのブラウザを開いて、 http://127.0.0.1:8888 をURL欄に入力してください。

初めてUnslothをインストールする場合は、 http://127.0.0.1:8888/change-password ページに移動します。ここで新しいパスワードを作成する必要があります。パスワードは後からいつでも変更できます。

チャット - クイックスタート

Unsloth Studio Chat では、モデルをコンピューター上で100%オフラインで実行できます。Hugging Faceまたはローカルファイルから、GGUFやsafetensorsなどのモデル形式を実行できます。

  • ダウンロード+実行 GGUF、ファインチューニング済みアダプター、safetensorsなど、あらゆるモデルを

  • 比較 異なるモデルの 出力を横並びで表示

  • アップロード ドキュメント、画像、音声をプロンプトに含める

  • 調整 推論 設定: temperature、top-p、top-k、システムプロンプト

Unsloth Studioでのモデル実行に関する詳細なチュートリアル/ガイドはこちらでご覧いただけます:

Studio Chat

モデル読み込みガイド

APIを使用する前に、使用したいモデルを 読み込む 必要があります。 Unsloth を開き、 モデルを選択 チャットページの左上隅にあるドロップダウンを開きます。

別のページにいる場合は、左側のサイドバーを使って 新しいチャット をクリックし、チャットページに戻ってください。

モデルを選択

検索バーを使って、Unslothに読み込みたいモデルを見つけます。

おすすめモデルを閲覧したり、Hugging Faceのモデルを直接検索したり、カスタムモデルディレクトリを設定したりできます。

ローカルで学習・エクスポートしたモデルは`Fine-tuned`タブから読み込めます。

GGUFの選択

モデルのリポジトリには複数の量子化版が含まれています。利用可能なRAM / VRAMに最も適した量子化を選択してください。 このガイドでは unsloth/gemma-4-26B-A4B-it-GGUF を使い、推奨の UD-Q4_K_XL バリアント

を選択します

使用したいモデルを検索してから、 クリックして ダウンロードと読み込みを開始します。

モデルバリアントを選択すると、Unslothはモデルのダウンロードを開始し、メモリに読み込みます。

読み込みが完了すると、次の確認が表示されます:

モデルは読み込まれ、使用可能です。これでUnsloth内でモデルと直接チャットするか、次のようなツールに接続できます: Claude Code および Codex.

Studio - クイックスタート

Unsloth Studioのホームページには、主に4つの領域があります: モデル, データセット, パラメータ学習/設定

  • モデルとデータの簡単なセットアップ Hugging Faceまたはローカルファイルから

  • 柔軟な学習方法 QLoRA、LoRA、フルファインチューニングなど。既定値はあらかじめ入力済み

  • 便利な設定ツール 分割、列マッピング、ハイパーパラメータ、YAML設定用

  • 優れた学習の可視化 ライブ進捗、GPU統計、グラフ、起動状況付き

1. モデルと手法を選択

モデルタイプ

ユースケースに合ったモダリティを選択してください:

種類
ユースケース

テキスト

チャット、指示追従、補完

ビジョン

画像+テキスト(VLM)

音声

音声/オーディオ理解

埋め込み

文埋め込み、検索

学習手法

3つの手法があり、ピル型セレクターで切り替えます:

手法
説明
VRAM

QLoRA

4ビット量子化ベースモデル+LoRAアダプター

最小

LoRA

フル精度ベースモデル+LoRAアダプター

フルファインチューニング

すべての重みを学習

最大

任意のHugging Faceモデル名を入力するか、コンボボックスからHubを直接検索してください。 ~/.unsloth/studio/models に保存されたローカルモデルと、Hugging Faceのキャッシュも一覧に表示されます。

モデルを選ぶと、Studioは自動的にバックエンドから設定を取得し、すべてのハイパーパラメータに妥当な既定値を事前入力します。

HuggingFaceトークン

モデルがゲート付き(例: Llama、Gemma)の場合は、Hugging Faceのアクセストークンをここに貼り付けてください。トークンはリアルタイムで検証され、無効な場合はその場でエラーが表示されます。

2. データセット

2つのタブを切り替えて、データの出所を選択します:

  • HuggingFace Hub - Hubに対するライブ検索。各結果の最終更新日が表示されます。

  • ローカル - ドラッグ&ドロップ、またはクリックして、次のような非構造化/構造化ファイルをアップロードします: PDF, DOCX, JSONL, JSON, CSV、または Parquet 形式。以前アップロードしたデータセットは一覧に表示され、自動的に更新されます。

詳細な データセットガイドはこちら.

Prompt Studioでデータをどう解釈し、どのように整形するか:

形式
使う場面

auto

Unslothに形式を自動検出させる

alpaca

instruction / input / output

chatml

OpenAI風 messages 配列

sharegpt

ShareGPT風の会話

分割とスライス

  • サブセット - データセットカードから自動で入力されます。

  • Train split / Eval split - 使用する分割を選択します。eval splitを設定すると、学習中に Eval Loss グラフが有効になります。

  • データセットスライス - 行範囲(開始インデックス/終了インデックス)を指定して学習を制限し、簡単な実験を行えます。

列マッピング

Studioがデータセットの列を正しい役割に自動マッピングできない場合は、 データセットプレビューのダイアログ が開きます。サンプル行を表示し、各列を instruction, input, output, 画像などに割り当てられます。可能な場合は、推奨マッピングが事前入力されます。

3. ハイパーパラメータ

パラメータは折りたたみ可能なセクションにまとめられています。詳細な LoRAハイパーパラメータガイド はこちら:

🧠Hyperparameters Guide
パラメータ
既定値
備考

Max Steps

0

0 はEpochの代わりに使用することを意味します

Context Length

2048

オプション: 512 → 32768

Learning Rate

2e-4

LoRA設定

(フルファインチューニング選択時は非表示)

パラメータ
既定値
備考

Rank

16

スライダー 4–128

Alpha

32

スライダー 4–256

Dropout

0.05

LoRAバリアント

LoRA

LoRA / RS-LoRA / LoftQ

対象モジュール

すべてオン

q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj

について ビジョン 画像データセットを持つモデルでは、追加のチェックボックスが4つ表示されます。ファインチューニング対象:

Vision Layers

Language Layers

Attention Modules

MLP Modules

学習ハイパーパラメータ

3つのタブに整理されています:

パラメータ
既定値

Epochs

3

Batch Size

4

Gradient Accumulation

8

Weight Decay

0.01

オプティマイザ

AdamW 8-bit

Unsloth Gradient Checkpointing: unsloth はUnsloth独自のメモリ効率の高い実装を使用しており、標準のPyTorchオプションと比べてVRAM使用量を大幅に削減できます。推奨の既定値です。

4. 学習と設定

右下のカードには3つの設定管理ボタンと 学習開始 ボタンがあります。

ボタン
操作

アップロード

以前に保存した .yaml 設定ファイルを読み込む

保存

現在の設定をYAMLとしてエクスポート

リセット

すべてのパラメータをモデルの既定値に戻す

学習開始ボタンは、モデルとデータセットの両方が設定されるまで無効のままです。検証エラーはその場で表示されます。たとえば、eval splitを選ばずにeval stepsを設定した場合や、テキスト専用モデルとビジョンデータセットを組み合わせた場合などです。

読み込み画面

をクリックすると、 学習開始バックエンドがすべての準備をしている間、全画面オーバーレイが表示されます。

オーバーレイには、ライブのフェーズ更新を表示するアニメーション端末が表示されます:

  • 青: モデル/データセットをダウンロード中

  • 琥珀: モデル/データセットを読み込み中

  • 青: 設定中

  • 緑: 学習中

いつでも × ボタンでキャンセルできます。停止される前に確認ダイアログが表示されます。

学習進捗と可観測性

最初の学習ステップに入るとオーバーレイは閉じ、ライブ学習ビューが表示されます。進捗バーが100%に達するとファインチューニングは完了です。経過時間とトークンを確認できます。

ステータスパネル

左カラムには以下が表示されます:

  • Epoch - 現在の小数付きEpoch(例: Epoch 1.23)

  • 進捗バー - ステップベース、パーセンテージ表示

  • 主要メトリクス:

    • Loss - 学習損失を小数点以下4桁で表示

    • LR - 現在の学習率を科学表記で表示

    • Grad Norm - 勾配ノルム

    • モデル - 学習中のモデル

    • 手法 - QLoRA / LoRA / フル

  • 時間行 - 経過時間、ETA、毎秒ステップ数、処理済み総トークン数

GPUモニター

右カラムには、数秒ごとに取得されるライブGPU統計が表示されます:

  • 使用率 - パーセンテージバー

  • 温度 - ℃バー

  • VRAM - 使用済み/総GB

  • 電力 - 消費/上限をワットで表示

学習の停止

を使ってください 学習停止 進捗カード右上のボタン。ダイアログで2つの選択肢が示されます:

  • 停止して保存 - 停止前にチェックポイントを保存

  • キャンセル - チェックポイントなしで即停止

グラフ

学習の進行に合わせて4つのライブグラフが更新されます:

  1. Training Loss - 生値に加え、EMAで平滑化した線と、移動平均の参照線

  2. Learning Rate - LRスケジュール曲線

  3. Gradient Norm - ステップごとの勾配ノルム

  4. Eval Loss - eval splitを設定した場合のみ表示

各グラフには設定(歯車アイコン)があり、以下を含みます:

オプション
既定値

表示範囲

直近Nステップのスライダー

EMA平滑化

0.6

生データを表示

オン

平滑化を表示

オン

平均線を表示

オン

スケール(系列ごと)

線形 / 対数

外れ値クリップ

クリップなし / p99 / p95

設定ファイル

すべての学習設定はYAMLファイルとして保存・再読み込みできます。ファイル名は自動的に次の形式になります:

YAMLは3つのセクションに分かれています:

これにより、実行の再現、設定の共有、実験のバージョン管理が容易になります。

データレシピ - クイックスタート

Unsloth Data Recipes では、PDFやCSVなどの文書をアップロードして、利用可能なデータセットに変換できます。グラフノードのワークフローを使って、視覚的にデータセットを作成・編集できます。

レシピページがメインの入口です。レシピはブラウザ内にローカル保存されるため、後で保存済みの作業に戻れます。ここから空のレシピを作成するか、ガイド付き学習レシピを開けます。

Data Recipesも同じ基本的な流れです。レシピページを開き、レシピを作成または選択し、エディタでワークフローを組み、検証してプレビューを実行し、出力が問題なければデータセット全体を実行します。シードデータと生成ブロックを追加し、ワークフローを検証し、サンプル出力をプレビューしてから、データセット全体をビルドします。Unsloth Data RecipesはNVIDIAの DataDesigner.

一目でわかる通常のワークフローは次のようになります:

  1. レシピページを開く。

  2. 新しいレシピを作成するか、既存のものを開く。

  3. ブロックを追加してデータセットのワークフローを定義する。

  4. クリックして 検証 して、設定の問題を早期に検出する。

  5. プレビューを実行してサンプル行をすばやく確認する。

  6. レシピの準備ができたら、データセット全体のビルドを実行する。

  7. 進捗と出力をグラフ上または 実行 ビューで詳細確認します。

  8. 結果のデータセットを Studio で選択し、モデルをファインチューニングします。

エクスポート - クイックスタート

Unsloth Studioの「Export」を使って、モデルをGGUF、Safetensors、またはLoRAへエクスポート、保存、変換し、Unsloth、llama.cpp、Ollama、vLLMなどでのデプロイ、共有、ローカル推論に利用できます。学習済みチェックポイントをエクスポートするか、既存のモデルを変換できます。

Unsloth Studioでのモデルのエクスポートに関する詳細なチュートリアル/ガイドはこちらでご覧いただけます:

Model Export

ビデオチュートリアル

Studioの使い始めに役立つ、NVIDIA作成のビデオチュートリアルはこちらです:

Unsloth Studioのインストール方法 ビデオチュートリアル

詳細設定

CLIコマンド

Unsloth CLI(cli.py)では、次のコマンドを利用できます:

プロジェクト構成

APIリファレンス

すべてのエンドポイントには、有効なJWT Authorization: Bearer <token> ヘッダーが必要です(ただし /api/auth/* および /api/health).

手法
エンドポイント
説明

GET

/api/health

ヘルスチェック

GET

/api/system

システム情報(GPU、CPU、メモリ)

POST

/api/auth/signup

アカウントを作成する(初回実行時にセットアップトークンが必要)

POST

/api/auth/login

ログインしてJWTトークンを受け取る

POST

/api/auth/refresh

期限切れのアクセストークンを更新する

GET

/api/auth/status

認証が初期化されているか確認する

POST

/api/train/start

学習ジョブを開始する

POST

/api/train/stop

実行中の学習ジョブを停止する

POST

/api/train/reset

学習状態をリセットする

GET

/api/train/status

現在の学習ステータスを取得する

GET

/api/train/metrics

学習メトリクス(損失、LR、ステップ)を取得する

GET

/api/train/stream

リアルタイムの学習進捗をSSEストリームで取得

GET

/api/models/

利用可能なモデルを一覧表示する

POST

/api/inference/chat

推論用のチャットメッセージを送信する

GET

/api/datasets/

データセットを一覧表示 / 管理する

最終更新

役に立ちましたか?