🦥Unsloth Studioの紹介

Unsloth Studioを使ってAIモデルをローカルで実行・学習しましょう。

本日、私たちはリリースします Unsloth Studio (ベータ版):オープンモデルの学習、実行、エクスポートを1つに統合した ローカル インターフェース向けの、オープンソースでノーコードのWeb UIです。

クイックスタート機能Github

  • GGUFを実行 および safetensor モデルをローカルで Mac、Windows、Linux 上で。

  • 500以上のモデルを、VRAM使用量を70%削減しながら2倍高速に学習(精度低下なし)

  • テキスト、ビジョン、TTS音声、埋め込みモデルを実行および学習

⭐ 機能

モデルをローカルで実行

GGUF を検索して実行 および safetensor モデルをセルフヒーリング付きで ツール呼び出し、高度な ウェブ検索, 自動推論 設定、 コード実行 (Bash + Python)、 API。画像、ドキュメント、音声、コードをアップロード。

モデルを並べて対戦比較。llama.cpp + Hugging Face によって支えられ、Unsloth は マルチGPU推論、 自動オフロードと自動フィット、およびほとんどのモデルをサポートします。

コードを実行 + Tool calling を修復

Unsloth Studio では、LLM は JavaScript だけでなく Bash と Python も実行できます。また、Claude Artifacts のようにプログラムをサンドボックス化するため、モデルはコードをテストし、ファイルを生成し、実際の計算で回答を検証できます。

例:Qwen3.5-4B は20以上のWebサイトを検索して情報源を引用し、そのWeb検索は思考トレース内で行われました。

API エンドポイントとしての Unsloth

これで、ローカル LLM を次のようなツール経由で使えるようになりました Claude Code および Codex それを接続することで Unsloth の API エンドポイント。つまり、それらのツール内で Qwen や Gemma モデルを、セルフヒーリング付きツールコーリングや Web 検索などの機能を含む Unsloth の推論で直接実行できるようになります。

ノーコード学習

PDF、CSV、JSON をアップロード ドキュメント、または YAML 設定をアップロードして、NVIDIA 上ですぐに学習を開始できます。Unsloth のカーネルは、500以上のテキスト、ビジョン、TTS/音声、埋め込みモデルにわたって LoRA、FP8、FFT、PT を最適化します。

次のような最新の LLM をファインチューニング Qwen3.5 および NVIDIA Nemotron 3. マルチGPU は自動で動作し、新しいバージョンも近日登場します。

Data Recipes

Data Recipes は、ドキュメントをグラフノードワークフローにより使用可能な/合成データセットへ変換します。PDF、CSV、JSON のような非構造化または構造化ファイルをアップロードしてください。NVIDIA Nemo を基盤とする Unsloth Data Recipes Data Designerは、文書を自動で希望の形式に変換します。

可観測性

獲得 完全な可視性 と、トレーニング実行に対する制御を実現します。トレーニング損失、勾配ノルム、GPU使用率をリアルタイムで追跡し、好みに合わせてカスタマイズできます。

スマートフォンなど他のデバイスでもトレーニングの進捗を確認できます。

モデルをエクスポート / 保存

任意のモデルをエクスポート、ファインチューニング済みモデルを含めて、safetensors や、llama.cpp、vLLM、Ollama、LM Studio などで使える GGUF に出力できます。

トレーニング履歴を保存するので、実行内容を後から見返したり、再エクスポートしたり、実験したりできます。

モデルアリーナ

チャットして 2つの異なる モデル、たとえばベースモデルとファインチューニング済みモデルを比較して、出力の違いを確認できます。

最初の GGUF/モデルを読み込み、その後2つ目を読み込むだけで、できあがり! 推論はまず1つ目のモデルに対して読み込まれ、その後2つ目が読み込まれます。

プライバシー優先 + セキュア

Unsloth Studio は 100% オフラインかつローカルで、お使いのコンピュータ上で利用できます。暗号化されたパスワードや JWT のアクセス/リフレッシュフローを含むトークンベース認証により、データの安全性が保たれます。

HF などから以前ダウンロードした既存/古いモデルや GGUF も使用できます。詳しくは こちらの手順.

⚡ クイックスタート

Unsloth Studio は Windows、Linux、WSL、MacOS(現在はチャットのみ)で動作します。

  • CPU: Unsloth は GPU がなくても動作しますが、対応するのは チャット 推論と Data Recipes.

  • トレーニング: 次で動作します NVIDIA: RTX 30、40、50、Blackwell、DGX Spark/Station など + Intel GPU

  • Mac: CPU と同様 - チャットと Data Recipes のみが今のところ動作します。 MLX トレーニングはまもなく登場します。

  • AMD: チャットは動作します。学習は Unsloth Coreで行ってください。Studio サポートは近日公開予定です。

  • 近日公開: 次のトレーニング対応 Apple MLX および AMD。

  • マルチGPU: すでに動作し、大規模なアップグレードも予定されています。

更新するには以下と同じインストールコマンドを使用してください:

MacOS、Linux、WSL:

Windows PowerShell:

Unsloth を起動

Docker:

公式の Docker イメージ: unsloth/unsloth を使用してください。現在は Windows、WSL、Linux で動作します。MacOS サポートは近日公開予定です。

インストールとアンインストールの詳細については、 Unsloth Studio インストール セクションをご覧ください。

Installation

Google Colab ノートブック

私たちは 無料の Google Colab ノートブック を作成しました。これにより Colab の T4 GPU 上で Unsloth の全機能を試せます。最大220億パラメータまでのほとんどのモデルを学習・実行でき、より大きなモデル用に大きな GPU に切り替えることもできます。『Run all』をクリックするだけで、インストール後に UI が表示されるはずです。

インストールが完了したら、 Start Unsloth Studio までスクロールして、 Open Unsloth Studio を左側に表示される白いボックス内でクリックしてください:

さらに下へスクロールすると、実際の UI が表示されます。

ワークフロー

使い始めるための、Unsloth Studio の一般的なワークフローはこちらです:

  1. Studio を起動 インストール手順.

  2. ローカルファイルまたは対応する連携先からモデルを読み込みます。

  3. PDF、CSV、JSONL ファイルからトレーニングデータを取り込むか、データセットをゼロから構築します。

  4. データセットをクリーンアップ、洗練、拡張 Data Recipes.

  5. 推奨プリセットでトレーニングを開始するか、自分で設定をカスタマイズします。

  6. 学習済みモデルとチャットし、その出力をベースモデルと比較します。

  7. 保存またはエクスポート すでに使用しているスタックへローカルに。

Unsloth Studio の各セクションについての詳細解説もご覧いただけます:

動画チュートリアル

Studio を始めるために NVIDIA が作成した動画チュートリアルはこちらです:

Unsloth Studio のインストール動画チュートリアル

FAQ

Unsloth はデータを収集または保存しますか? Unsloth は利用状況テレメトリを収集しません。互換性のために必要最小限のハードウェア情報、たとえば GPU の種類やデバイス(例:Mac)のみを収集します。Unsloth Studio は 100% オフラインかつローカルで動作します。

以前 Hugging Face からダウンロードした古い/既存のモデルをどう使えばいいですか? はい、以前 Hugging Face などからダウンロードした既存/古いモデルや GGUF を使用できます。現在は Unsloth が自動的に検出するはずですが、そうでない場合は私たちの こちらの手順.

なぜ Unsloth では推論が時々遅くなるのですか? Unsloth は他のローカル推論アプリと同様に llama.cpp を基盤としているため、速度はほぼ同じであるはずです。Unsloth が遅くなる場合は、Web 検索、コード実行、セルフヒーリング付きツールコーリングを有効にしている可能性があります。これらの機能はすべて推論を遅くする場合があります。すべての機能をオフにしてもなお遅い場合は、GitHub issue を作成してください!

Unsloth Studio は OpenAI 互換 API をサポートしていますか? はい、こちらの API エンドポイントガイドをご覧ください.

Unsloth は現在 AGPL-3.0 ライセンスですか? Unsloth は Apache 2.0 と AGPL-3.0 のデュアルライセンスモデルを採用しています。コアの Unsloth パッケージは引き続き Apache 2.0でライセンスされ、一方で Unsloth Studio UI などの一部のオプションコンポーネントは AGPL-3.0.

この構造により、プロジェクトをオープンソースに保ちつつ、より広いエコシステムの成長を可能にしながら、Unsloth の継続的な開発を支援できます。

Studio は LLM のみをサポートしていますか? いいえ。Studio は、対応するさまざまな transformers 互換モデルファミリーをサポートしており、テキスト、マルチモーダルモデル、 テキスト読み上げ、音声、 埋め込み、BERT スタイルのモデルを含みます。

自分のトレーニング設定を使えますか? はい。YAML 設定をインポートすると、Studio が関連設定を事前入力します。

コンテキスト長はどう調整できますか? llama.cpp のスマート自動コンテキストにより、必要なコンテキストだけを使用し、余分なものを読み込まないため、コンテキスト長の調整はもはや不要です。ただし、必要な場合に使えるよう、この機能は近いうちに追加する予定です。

UI を使うにはモデルを学習させる必要がありますか? いいえ、どのモデルもファインチューニングせずに、任意の GGUF やモデルをダウンロードして使えます。

Unsloth の今後

私たちは、オープンソース AI をできる限り利用しやすくするために懸命に取り組んでいます。Unsloth と Unsloth Studio の次の展開として、マルチGPU、Apple Silicon/MLX、AMD の公式サポートをリリースします。繰り返しになりますが、これは Unsloth Studio のベータ版ですので、今後数週間で多くの発表と改善があることを期待してください。また、可能な限り最高かつ最もシンプルな体験を提供するため、NVIDIA と密接に連携してマルチGPU対応にも取り組んでいます。

謝辞

ローンチに参加してくださった NVIDIA と Hugging Face に心より感謝します。また、Unsloth Studio の初期ベータテスターの皆さまにも、時間とフィードバックを本当にありがとうございました。さらに、Unsloth Studio を可能にしたインフラを提供してくれた llama.cpp、PyTorch、そしてオープンモデル研究所の皆さまにも感謝いたします。

最終更新

役に立ちましたか?