> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/jp/xin-zhe/changelog.md).

# Unslothのアップデート

最新の変更を使うには、 [Unslothを更新してください](/docs/jp/xin-zhe/studio/install.md#update-unsloth-studio).

{% updates format="full" %}
{% update date="2026-07-20" tags="new-releases,v0.1.50-beta" %}

## AMDサポートが登場！

皆さん、こんにちは！今回のリリースでは、ローカルLLMの学習と推論が [AMD GPUで](/docs/jp/ji-ben/amd.md) Windows、WSL、Linux全体で利用できるようになりました。

<a href="/pages/012a2b21c17a6a2f8b57b2316ffa3ac69a1f8dd0#installing-unsloth-on-amd" class="button primary" data-icon="bolt">クイックスタート</a><a href="/pages/012a2b21c17a6a2f8b57b2316ffa3ac69a1f8dd0#id-2x-faster-training-and-50-more-accurate-tool-calls" class="button secondary" data-icon="star">機能</a><a href="https://github.com/unslothai/unsloth" class="button secondary" data-icon="github">GitHub</a>

本日より、AMDとの協業、カスタムTritonカーネル、数値アルゴリズムにより、AMDのRadeon、Instinct、Vulkan、Ryzen、データセンター向けGPUで500以上のモデルを学習・実行でき、VRAM使用量を70%削減しつつ、精度を落とさずに最大2倍高速化できます。最適化されたROCmビルドはGGUFとSafetensorsの推論もサポートします。

<img src="https://github.com/user-attachments/assets/bb8bc525-9fb8-405d-98f5-6c9c07128085" alt="" width="375">

#### 7月23日更新

1. 追加 **RDNA2、Gorgon Halo、Vulkanサポート** + AMDインストール時にStrix Halo / その他のAMD GPUを検出できない問題を修正
2. RDNA4の改善、HIP / ROCm失敗時の自動修復と検出
3. **統合メモリが2倍高速に** AMD safetensorsの読み込み + 統合メモリデバイス向けの勾配チェックポイント保存が大幅に高速化
4. 追加 **音声 дикテーション / whisper.cpp** 高速なテキスト読み上げの予備サポート
5. インストール時のロールバック環境が5GBのディスク容量を食っていた問題を修正 - 今では自動でクリーンアップします

#### AMDでローカルにLLMを学習

* AMD GPUでモデルを学習、RLを実行、チャットし、ローカルにデプロイできます。
* Windows、WSL、Linux全体で、AMD GPUの検出とインストールの信頼性が向上しました。
* AMD MI300XおよびMI325X GPU向けのROCm互換性を改善しました。
* Unslothへリモートアクセス `unsloth studio --secure` Cloudflare経由の無料HTTPSで

#### お使いのハードウェアでより大きなモデルを実行

* 自動GPU配置を使うか、どのGPUとモデル層を使うかを正確に選択できます。
* MoEのエキスパート層をシステムメモリに移して、より大きなモデルを収めやすくします。
* モデルを複数のGPUに分割するか、Tensor Parallelismを使用できます。
* ハードウェア設定をモデルと量子化ごとに個別に保存します。

#### より高速なチャット再開と、より信頼性の高いダウンロード

* アイドル状態のモデルがVRAMを解放した後、会話全体を再構築せずに長いチャットを再開できます。
* 停止したHugging Face XETダウンロードは、標準HTTPで自動的に再試行されます。
* モデルの読み込み時に、既存のGGUFファイルは再ダウンロードされずに再利用されます。

#### 検索、ツール、エージェントの改善

* Web検索でPDF論文、マニュアル、その他のPDF結果を読めるようになりました。
* 並列ツール呼び出し、推論出力、ツール再試行がより信頼性高く動作します。
* 新しいオプトインのMCPエンドポイントにより、対応するAIクライアントはモデルや学習履歴を確認し、学習の開始・停止、チェックポイントの読み込み、レシピの検証、GGUFのエクスポートができます。
  * これを有効にするには `UNSLOTH_STUDIO_ENABLE_MCP=1` を設定し、必要なベアラートークンを `UNSLOTH_STUDIO_MCP_TOKEN`.

#### 学習とエクスポートの修正

* マルチモーダルモデルでのテキストのみ学習では、パッキング前に長いサンプルが途中で切られなくなりました。
* ファインチューニングされたQwen3.5とQwen3.6 MTPモデルは、GGUFへ正しくエクスポートされるようになりました。
* Windowsの権限エラーにより、最終書き込みステップでGGUFエクスポートが止まる問題を修正しました。

#### 見逃した方へ

前回のStudioリリースでは、Dynamic NVFP4モデル、より深いパーソナライズ、7つの新しい表示言語、より安全なエージェント、Vulkan GPUアクセラレーションが追加されました。

**Dynamic NVFP4:**

Unsloth Dynamic NVFP4は、精度が重要な層をFP8またはBF16に保ちながら、残りをW4A4で実行します。NVIDIA Blackwell GPUでは、これにより最大2.5倍高速な推論が可能になり、さらに調整済みのFP8 KVキャッシュによりコンテキスト長を最大2倍にできます。

読む [Dynamic NVFP4ガイド](https://unsloth.ai/docs/basics/nvfp4) を読み、拡張された [NVFP4コレクション](https://huggingface.co/collections/unsloth/nvfp4)を確認してください。Qwen3.6、Qwen3.5、Inkling、GLM-4.7 Flash、Gemma 4が含まれます。

**Studioを自分好みにカスタマイズ:**

Standard、Classic、Minimalの3つのカラーパレットから選べ、それぞれにライトモードとダークモードがあります。色のカスタマイズ、フォントのインポート、フォントサイズ、コントラスト、モーションの抑制なども調整できます。

Unslothには、音声入力、カスタム辞書設定、読み上げ用のVoice設定タブも含まれています。

**新しい言語:**

Unsloth Studioは、簡体字中国語、日本語、ポルトガル語（ブラジル）に加えて、フランス語、ドイツ語、スペイン語、ヒンディー語、アラビア語、ロシア語、韓国語でも利用可能になりました。ブラウザ言語の自動検出が今後はデフォルトです。

**より安全なエージェント:**

4段階のツール呼び出し権限セレクター-**確認**, **自分のために承認**, **オフ** および **フルアクセス**-エージェントに対するより細かな制御を提供します。エージェントのワークスペース分離と、より安全なインストーラーチェックにより、意図しない変更のリスクも低減します。
{% endupdate %}

{% update date="2026-07-15" tags="new-releases,v0.1.49-beta" %}

## パーソナライズ、NVFP4、言語

皆さん、Unslothにたくさんの新しい更新が来ました。特にカスタマイズです。Unslothは今や自分好みに設定できます。3つのカラーパレットに加え、カスタムカラーとフォント、7つの新しい表示言語、そして音声入力と読み上げ用の新しいVoice設定タブ。エージェントは4段階のツール呼び出し権限セレクター（確認、自分のために承認、オフ、フルアクセス）とワークスペース分離でより安全になり、Intel GPUも新しいVulkanを通じてついにGPUアクセラレーション推論に対応しました `llama.cpp` サポート。

また、 [Inkling](https://unsloth.ai/docs/models/inkling)のネイティブサポートも追加しました。Inklingは9750億パラメータのオープンモデルで、410億のアクティブパラメータと最大100万トークンのコンテキストウィンドウを備えています。Apache 2.0でライセンスされ、テキスト、画像、音声を受け取り、テキストを生成します。

#### Dynamic NVFP4

私たちの [NVFP4コレクション](https://huggingface.co/collections/unsloth/nvfp4) を、Qwen3.6、Qwen3.5、Inkling、GLM-4.7 Flash、Gemma 4の量子化版で拡張しました。

読む [Dynamic NVFP4ガイド](https://unsloth.ai/docs/basics/nvfp4) 詳細はこちら。

Unslothを自分好みに

Unslothはもはやライトモードとダークモードだけに限られません：

* から選べます **Standard**, **Classic**、そして **Minimal** のパレットを、それぞれライト版とダーク版付きで。
* アクセント、背景、前景色をカスタマイズできます。
* UI、見出し、チャット、コード用のフォントをインポートできます。
* フォントサイズ、コントラスト、モーション、カーソルの挙動、フォントスムージングを調整できます。
* 設定を検索し、デバイス間で同期できます。

ライトモードとダークモードはそれぞれ独自のカスタマイズ値を保持します。

#### 7つの新しい言語

Unslothは今や、中国語、日本語、ポルトガル語に加えて、フランス語、ドイツ語、スペイン語、ヒンディー語、アラビア語、ロシア語、韓国語をサポートします。ブラウザ言語の自動検出が今後はデフォルトです。

#### Voice設定

新しいVoiceタブで、音声入力、発音辞書、読み上げの各コントロールを追加しました。音声認識と音声合成のサポートは近日公開予定で、完全な音声会話はまだ開発中です。

#### より安全なエージェントとツール呼び出し

旧来のバイパス切り替えは、今では4段階の権限セレクターになりました：

* **確認：** すべてのツール呼び出しを承認します。
* **自分のために承認：** 読み取り専用のアクションは自動実行し、潜在的に安全でないものでは停止します。
* **オフ：** ツール呼び出しを無効にします。
* **フルアクセス：** すべての呼び出しを許可し、サンドボックスを無効にします。

これらのコントロールは、ターミナル、Python、Web検索、RAG、MCPツールに適用されます。エージェントはさらに、分離されたワークスペース、 `--persist`を使った再開可能なセッション、より安全なリモートインストーラー警告、ライブのツール出力ストリーミング、改善されたWeb抽出を得ます。

#### Vulkanと `llama.cpp`

新しいVulkan `llama.cpp` バックエンドにより、Intel GPUはCPUにフォールバックせずにGPUアクセラレーション推論が可能になります。既存のVRAM管理、自動コンテキストサイズ設定、マルチGPU選択、レイヤーのオフロードをサポートします。

AMDユーザーは次で有効化できます：

```bash
UNSLOTH_FORCE_VULKAN=1
```

更新の信頼性、モデル状態の復元、停止した生成の中断も改善しました。

#### モデルと学習

このリリースには以下も含まれます：

* ネイティブInklingサポートと、マルチGPU B200の改善。
* DeepSeek-V4のeager attentionと、学習可能なFP8 grouped experts。
* チャットテンプレートのマーカーを自動検出することで、completion-only学習を信頼性高く実現。
* 無効化された勾配チェックポイントの正しい処理。
* RoPEスケーリングとコンテキスト拡張の改善。
* 停止した学習実行を強制停止する機能。
* 新しいモデルアーキテクチャと新しいTransformersリリースへの自動ルーティング。
  {% endupdate %}

{% update date="2026-07-07" tags="new-releases,v0.1.48-beta" %}

## DeepSeek-V4 + NVFP4

Unslothは、学習後にNVFP4、FP8、imatrix GGUFをエクスポートできるようになりました。llama-swap APIシステムとして機能し、日本語とブラジルポルトガル語のサポートを追加し、MLX、safetensors、ツール呼び出し、healingサポートなども含みます。Unsloth coreはGRPOを1.3倍高速化し、停止したダウンロードのHTTPフォールバックを追加し、オフラインモードを改善し、MoE学習を3〜5倍高速化し、多くのバグを修正しました。このリリース系列では `unsloth>=2026.7.1`.

[DeepSeek-V4-Flash](/docs/jp/moderu/deepseek-v4.md) は、Thinking切り替えと改善されたチャットテンプレート修正に対応しました。

<div data-with-frame="true"><figure><img src="/files/668875d75498112271cc5626c709a3674caaefe2" alt="" width="375"><figcaption></figcaption></figure></div>

#### より賢いOpenAI互換API提供

より安全なモデル切り替えと、より優れたエージェントツール復旧を備えたローカルAPIエンドポイントを1つ実行できます。

* APIリクエストでは、ダウンロード済みのローカルGGUF間の自動切り替えを選べます。未知のモデル名でも、現在のモデルを安全に使い続けます。
* `/v1/models` は、ローカル `.gguf` パスではなく、整理されたモデルIDとローカルGGUFカタログを返すようになりました。
* アイドル時の自動アンロードにより、非アクティブ後にVRAMを解放でき、ツール呼び出しの修復もリクエストごとに制御できるようになりました。

#### エクスポートの改善

エクスポートはより柔軟になり、不要なダウンロードを避けます。

* ポータブルFP8/INT8、GGUF LoRA、ソース一致エクスポート、imatrix GGUF、圧縮FP8/FP4を含む、複数のエクスポート形式を一度に選択できます。
* 複数チェックポイントのエクスポートでは、ベースモデルの繰り返しダウンロードをさらに減らせます。
* FP8、INT8、GGUF-LoRAのエクスポートは `trust_remote_code`を尊重し、GGUFエクスポートでは不足している量子化設定をより信頼性高く処理します。

#### RAGとファイルチャット

ファイルチャットは実際の文書でより便利になりました。

* RAG添付ファイルは、文書全体のコンテキストを使用できるようになり、埋め込みモデルとHugging Face検索をカスタマイズできます。
* ファイルチャットは、右から左へのテキスト、インド系文字、DOCX表を含む、より多くのPDFとWord文書を正しく読み取ります。
* ローカルRAGチェックは、プロキシ構成の背後でもより信頼性が高くなりました。

#### Unslothの磨き上げと信頼性

日常利用がよりスムーズで安定して感じられるはずです。

* 長時間の学習やチャットの実行が、静かに固まる可能性が低くなりました。
* 比較モード、モデル切り替え、モデルキャンセル、Hub閲覧、Hub Discoverの信頼性が向上しました。
* プロジェクトのエクスポート、チャットのエクスポート、設定、ガイドツアー、ファイルダイアログ、更新画面、推論UIがよりすっきりし、一貫性も向上しました。

#### インストーラー、ハードウェア、プラットフォームの修正

Unslothのインストールと実行が、各プラットフォームでより信頼性高くなりました。

* macOSのインストールでは、事前ビルド済みの `llama.cpp` 事前ビルド済みのものが利用可能なら
* Windows起動、UTF-8処理、ROCm RAG埋め込み、ROCm-on-WSLのGPUサポートが改善されました。
* Blackwell GPUの事前ビルド選択、GGUF適合チェック、vision/mmproj GGUF用のTensor Parallelism、ローカル `llama.cpp` 再利用は、今ではより信頼性が高くなっています。

#### 学習、モデル、カーネル

学習とモデルの読み込みは、より多くの構成でより信頼性が高くなりました。

* GRPOは今やデフォルトでシーケンスパッキングをサポートし、共有プロンプトの繰り返しを避け、DDPのロジットスケーリングを正しく処理します。
* フルファインチューニング、RL精度設定、勾配チェックポイント、DDP RoPEバッファ、MoE LoRA検出を修正しました。
* FP8の量子化/逆量子化、Transformers v5でのLlama 3 RoPEスケーリング、PEFT 0.19のLoRA再読み込み、そして `fast_generate` のエラーメッセージを改善しました。
  {% endupdate %}

{% update date="2026-06-18" tags="new-releases,v0.1.47-beta" %}

## GLM 5.2 + Hub + 3倍長いコンテキスト

[GLM-5.2](/docs/jp/moderu/glm-5.2.md) がUnsloth Studioでサポートされるようになりました！すべての推論レベルに対応。 **3倍長いコンテキスト長** が、MTP対応の新しい自動フィットアルゴリズムで実現可能になり、より長いチャットができるようになりました。バイパス権限モード、フォーク可能なチャット、キュー可能なチャット、モデル探索用の新しいHub、並列モジュール + HTTPS Cloudflareサポートなども追加！安全なHTTPSグローバルアクセスには `unsloth studio --secure` を使用してください！

<div data-with-frame="true"><img src="https://github.com/user-attachments/assets/93c18616-415f-48ea-957d-9e0fa97a45dd" alt="" width="563"></div>

#### より良いコンテキスト長アルゴリズム

に従って [PR 1](https://github.com/unslothai/unsloth/pull/6312) および [PR 2](https://github.com/unslothai/unsloth/pull/6447)、Unsloth Studioのメモリ使用量とコンテキスト長の判定を大幅に改善し、全体として3倍長いコンテキストを実現しました：

| シナリオ                   | KV    | 前       | 後       |
| ---------------------- | ----- | ------- | ------- |
| 1x 32GBパイプライン（約31GB空き） | f16   | 23,040  | 64,000  |
|                        | q8\_0 | 43,520  | 114,944 |
|                        | q4\_0 | 82,432  | 199,680 |
| 2x 32GBパイプライン          | 任意    | 262,144 | 262,144 |
| 2x 24GBテンソル（約23GB空き）   | f16   | 134,049 | 262,144 |
|                        | q8\_0 | 252,329 | 262,144 |

#### チャットキャンバス、フォーク、キュー

* アシスタントのメッセージをその場で編集し、スレッドの任意の地点から再実行できます。
* スレッドをフォークして、元を失わずに会話を分岐できます。
* 何も残さない一時的（シークレット）チャット。
* 生成がまだ動いている間に、新しいプロンプトを待たせることなくキューに入れられます。
* チャットの「アーティファクト」は今や **キャンバス**で、インラインの **HTMLキャンバスカード** は自動レンダリングされ、Codeビューがあり、DiffusionGemmaでは生のコードが折りたたまれずにインライン表示されます。
* チャット検索はすべてのメッセージを対象にし、自分のメッセージを最初に表示します。

#### Hub（再設計）

* トレンドフィード、検索、カスタムモデルパス対応を備えたフルページHub。
* ダウンロード前に読めるよう、分割表示フィードでREADMEをプレビュー。
* ダウンロードはより高速な **Xet** 転送がデフォルトで、転送が止まった場合は自動でHTTPにフォールバックします。
* モデル読み込み前に読み込みオプションを設定するための新しい「選択時に読み込む」トグル。
* DiffusionGemmaと今後のGemma派生モデルにGoogleロゴを表示。

#### モデルと推論

* DeepSeek-OCRやその他の視覚モデルが、エラーなく読み込まれ実行されるようになりました。
* 最新のvLLM（0.22+）での高速推論を修正し、速度向上が再び有効になりました。
* Tensor Parallelismの信頼性が向上しました。高速なMTP経路が失敗しても、クラッシュするのではなく自動で復旧します。
* DiffusionGemmaは今や、ノイズ除去中の画像生成をリアルタイムで表示し、正確な速度統計も示します。

#### セキュリティとCloudflare暗号化Studio

* 新しい `--secure` Cloudflare限定モードで、エンドツーエンド暗号化されたStudioを実現し、サーバー側ツールは `--secure`の下で有効なまま維持されます。 `unsloth studio --secure`!
* 必要なときはBypass Permissionsモードを使って確認をスキップし、ツールのサンドボックスを無効にできます。
* Hugging Faceのウイルススキャンと、リポジトリ内の危険ファイルを自動検出。

#### ログとAPI

* 新しい **APIサーバーモニター** をUnslothに追加。
* API呼び出しが高速化し、レイテンシが低減
* ログを大幅に整理し、スループットとレイテンシを表示するようになり、冗長なログをかなり削減しました。

#### ハードウェアとバックエンド

* Blackwell RTX 50Xおよび60X GPUのサポート改善
* CPUではなくGPUへの静かなダウングレードを修正
* torchaoのバージョンは、インストール済みのtorchから選択されるようになりました。
* インストーラーは壊れたPyTorchやCPU専用のPyTorchインストールを自動修復し、Windows/Linux/Mac/WSL上のNVIDIA + AMD全体で、静かなCPUフォールバックを警告するようになりました。
* 学習開始時にチャットモデルのVRAMを解放しますが、GPUが本当に逼迫している場合に限ります（それ以外では不要な再読み込みはしません）。
* llama-serverが起動時に致命的クラッシュした場合、Unslothは単に失敗するのではなく、復旧手順を順に試すようになりました。

#### 学習と一般修正および並列モジュール

* MLX学習の更新。
* vLLMを使ったGRPO学習の信頼性向上。
* 学習開始の信頼性を向上し、無効なVLMバッチに対するエラーをより明確にしました。
* クラッシュ、再起動、または中断されたシャットダウンの後に、残ったバックエンドプロセスをより信頼性高くクリーンアップするようになりました。
* エクスポート、チャット、学習、レシピはすべて個別化／分離されています！つまり、今では4つすべてを並行して実行できます！学習実行やエクスポートを待ちながら、チャットや推論を行えます！

Unslothを更新するか新しいUnsloth Studioをインストールするには、次を使用してください：

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% endupdate %}

{% update date="2026-06-12" tags="new-releases,v0.1464-beta" %}

## DiffusionGemma + Gemma 4 MTP

最新の [`v0.1.464-beta`](https://github.com/unslothai/unsloth/tree/v0.1.462-beta) または `2026.6.7`. [DiffusionGemma](https://unsloth.ai/docs/models/diffusiongemma), [Gemma 4 MTP](https://unsloth.ai/docs/models/mtp) および [**MiniMax-M3**](https://unsloth.ai/docs/models/minimax-m3) はすべて今サポートされています。

* 実行と学習 [DiffusionGemma](https://unsloth.ai/docs/models/diffusiongemma) 経由で [Unsloth Studio](https://unsloth.ai/docs/new/studio).
* [Gemma 4 MTP](https://unsloth.ai/docs/models/mtp) が登場！ [Gemma 4](https://unsloth.ai/docs/models/gemma-4) はMTPで約2倍高速に実行できます。
* Gemma 4では音声チャットもサポートされました（`wav`, `mp3`, `m4a`, `flac`, `webm`).
* Gemma 4にPreserve Thinkが追加されました。

<figure><img src="/files/c3cb18ff1e86ab57357a3712b0511e41752c66b4" alt="" width="375"><figcaption></figcaption></figure>

#### Hub + ダウンロードマネージャー（実験的）

* 新しい **Hub** ページを追加し、Hugging Faceのモデルとデータセットを閲覧、ダウンロード、管理できるようにしました。
* Unslothは、すでにマシン上にあるモデルとデータセットを検出し、ダウンロード済みアセットと並べて表示できるようになりました。
* ダウンロード済み [GGUFモデル](https://unsloth.ai/docs/basics/inference-and-deployment/saving-to-gguf) は今や直接 **実行 / 新しいチャット** アクションがあります。

#### RAG / ファイルでチャット（実験的）

* 追加 [**ファイルでチャット**](https://unsloth.ai/docs/new/studio/chat) がUnslothに追加され、自分の文書や知識ベースに対して質問できるようになりました。
* ハイブリッド検索、引用、PDFプレビュー、スレッドごとの文書、そして組み込みの `search_knowledge_base` ツールをサポートします。

#### 新しい更新ボタン + ハードウェアサポート

* Unslothは今や、CUDA、ROCm、Windows、Linux、macOS全体で、常に最新の [llama.cppの事前ビルド](https://unsloth.ai/docs/new/changelog) を使用します。
* アプリ内の **llama.cppを更新** ボタンを追加し、Unslothを再インストールせずにローカルバックエンドを更新できるようにしました。
* Windows / WSLのAMDサポート、 [Strix HaloのROCmサポート](https://unsloth.ai/docs/get-started/install/amd), [Blackwell CUDA選択](https://unsloth.ai/docs/blog/fine-tuning-llms-with-blackwell-rtx-50-series-and-unsloth)、およびよりわかりやすいインストーラーメッセージを改善しました。

#### ローカルチャット、ツール、API互換性

* ローカル [ツール呼び出し](https://unsloth.ai/docs/basics/tool-calling-guide-for-local-llms) の信頼性が向上し、ツールカードの並び順が改善され、重複するツールループが減り、GGUF視覚モデルでのツール使用もサポートされました。
* 改善された [OpenAI互換API](https://unsloth.ai/docs/basics/inference-and-deployment/llama-server-and-openai-endpoint) ローカルのUnslothサーバー向けのAnthropic互換API動作も含み、より良いエラー、トークン使用量、停止理由も対応しています。 [Claude Codeとの互換性](https://unsloth.ai/docs/basics/claude-code).

#### トレーニングと修正

* 改善された [MLXサポート](https://unsloth.ai/docs/new/studio/install) より良いモデルラベル、生成速度の統計、そして〜の修正付きで [VLMトレーニング](https://unsloth.ai/docs/basics/vision-fine-tuning).
* いくつか修正しました [トレーニング](https://unsloth.ai/docs/get-started/fine-tuning-llms-guide) および [データセット](https://unsloth.ai/docs/get-started/fine-tuning-llms-guide/datasets-guide) 書き込み不可のHugging Faceキャッシュやカスタムデータセットマッピングを含むエッジケース。
* チャット、メニュー、モデルピッカー、ダークモード、インポート/エクスポート、設定全体にわたる多くのUI磨き上げ修正を追加しました。

Unslothを更新するか新しいUnsloth Studioをインストールするには、次を使用してください：

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% endupdate %}

{% update date="2026-06-03" tags="new-releases,v0.1.44-beta" %}

## Gemma 4 12B、新UI、MCP、Projects

今回の更新は主にGemma 4 12B、MCP、Projects、Canvas、CUDA 13.3、そして新しいチャットUIに焦点を当てています。来週はさらに大きな更新があります。

<div data-with-frame="true"><figure><img src="/files/4023c83298028cd8c24702bee1195b589362b0ff" alt="" width="375"><figcaption></figcaption></figure></div>

#### Gemma 4 12B

Googleがリリース [Gemma 4 12B](https://unsloth.ai/docs/models/gemma-4)、8GB RAMでローカル実行できる新しいモデルです。 [GGUF](https://huggingface.co/unsloth/gemma-4-12b-it-GGUF) / [ガイド](https://unsloth.ai/docs/models/gemma-4)

Gemma 4 12B Unifiedは画像、音声、256Kコンテキストをサポートします。Unsloth Studio経由でこのモデルを実行・学習できます。

#### MCP

* リモート `MCP` サーバーサポート。カスタムヘッダーとOAuthを含みます
* ローカルのコマンドベースの `MCP` サーバーサポート
* `MCP` はチャットコンポーザーから有効化できるようになりました
* 一般的な `MCP` サーバー向けの組み込みプリセット

#### 新しいチャットUI

* Projects、Canvas、 `MCP`、RAGとCompareのコントロールは今や＋メニューにあります
* SearchとCodeのコントロールはコンポーザーからよりアクセスしやすくなりました
* メニュー、オーバーレイ、アイコン、クリック可能なコントロールの一貫性がUnsloth全体で向上しました

#### Projects

* 関連するチャットを専用のプロジェクトワークスペースに整理できます
* 既存のチャットをプロジェクトへ移動
* サイドバーから直接プロジェクトを作成・管理できます

#### 実験的Canvas / Artifacts

* 生成されたHTMLをUnsloth Studio内の専用Canvasパネルで開きます
* ブラウザベースの可視化やCDN読み込みパッケージを含むインタラクティブ出力をサポートします
* レンダリング済みプレビューとソースコードを切り替えられます

#### インストール、実行時環境、ハードウェア

* Windowsのプリビルドインストールでは、もはや初回の `CUDA Toolkit` チェック
* Linux `llama.cpp` のプリビルドは、検出されたランタイムに一致するようになりました `cudart` メジャー
* `ROCm` gfx検出がプリビルド選択に引き継がれます
* `Blackwell`, `B300` および `ARM64` Linuxサポートの更新

Unslothを更新するか新しいUnsloth Studioをインストールするには、次を使用してください：

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% hint style="warning" %}
**使用しないでください `Unsloth Studioの更新` もう使わないでください。パッケージングでは最新の更新が取得されないためです！**
{% endhint %}
{% endupdate %}

{% update date="2026-05-31" tags="new-releases,v0.1.43-beta" %}

## CUDA 13.3、Windows、Mac

**Unslothを更新するか新しいUnsloth Studioをインストールするには、次を使用してください：**

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% hint style="warning" %}
**使用しないでください `Unsloth Studioの更新` もう使わないでください。パッケージングでは最新の更新が取得されないためです！**
{% endhint %}

#### Macの更新

* 再有効化 `llama.cpp` Apple Silicon（M1〜M4）向けのプリビルドバイナリ - Mac OS 14 / 15 / 26（Tahoe）
* Apple SiliconのMac OS 13（Ventura）はソースビルドです
* Mac OS 13.3 / 14 / 15 / 26（Tahoe）向けのIntel（x86\_64）は `llama.cpp` プリビルドバイナリ
* Max 13.0 - 13.2向けのIntelはソースビルドです

#### Windowsの更新

* CUDA 13.3 `llama.cpp` プリビルドバイナリがWindowsで動作するようになりました
* CUDA 13.2、CUDA 13.1以下では、WindowsデバイスはCUDA 12.4へフォールバックします。CUDA 13.1のバイナリは近日対応予定です。

#### CUDA 13.3の更新

* CUDA 13.3のLinux以外のバイナリは動作します。しばらくはCUDA 13.1を使います
* CUDA 13.3はCUDA 13.2の文字化け問題を解決します - <https://github.com/unslothai/unsloth/issues/4849> を参照してください

#### Blackwell GPUの更新

* 当面の間、Blackwellは `llama.cpp` プリビルドバイナリのリリースが遅れます。CUDA 12.4が動作しないためです。これはすぐに解決に取り組んでいます。
  {% endupdate %}

{% update date="2026-05-26" tags="new-releases,v0.1.42-beta" %}

## 大規模刷新前の更新。

皆さん、今週か来週に来る可能性が高い大規模刷新の前に、もう1回だけ更新を行っています。今回の刷新では、多くのこと、特に新しい大きな機能や多くのデザイン変更が変わります。

{% embed url="<https://github.com/user-attachments/assets/70456395-e016-4273-8256-35adb206267e>" %}

* 新機能: [**API呼び出しサポート**](https://unsloth.ai/docs/integrations/connections) 画像生成＋編集、適切なWeb検索、コード実行、自動プロンプトキャッシュ付きで。接続 [OpenAI](https://unsloth.ai/docs/integrations/connections/openai), [Anthropic](https://unsloth.ai/docs/integrations/connections/anthropic-claude) など。
* 非英語言語への適切なサポート **非英語言語** 例: 日本語、中国語、インド語など。

前回のリリースは1日しか公開されなかったため、見逃した方も多いかもしれません。以下を導入しました:

* 外部推論バックエンドに接続: [vLLM](https://unsloth.ai/docs/integrations/connections/vllm), [Ollama](https://unsloth.ai/docs/integrations/connections/ollama), [llama-server](https://unsloth.ai/docs/integrations/connections/connect-llama.cpp-to-unsloth-run-ggufs-with-llama-server)
* **セキュリティ改善**
* **自動MTP推測デコード** MTP GGUF向け。お使いのハードウェアに合わせて最適な設定を取得できます。

#### APIプロバイダー呼び出しと外部接続

* UnslothをあらゆるAPIクラウドプロバイダー（OpenAI、Anthropic、OpenRouterなど）に接続できるようになりました
* **組み込みWeb検索** OpenAI、Anthropic、OpenRouter、Kimi向け
* **組み込みコード実行** OpenAIとAnthropic向け（Anthropicのコンテナは保持され、ターン間で再利用されます）
* OpenAIとAnthropicのモデルではプロンプトキャッシュが有効になり、コストを50〜90%削減できます。
* 画像生成＋編集
* ローカルプロバイダー（llama.cpp / vLLM / Ollama）ではAPIキーが任意になりました
* クラウドプロバイダーを追加するときにモデルを自動読み込み

#### その他のUnsloth Studio更新

* OpenDocumentのチャット添付
* o3推論要約ペイロード
* 非英語言語（例: 日本語、中国語）の送信/プロンプトが正しく動作するようになりました
* IMEコンポーザーの強化、RTL `dir="auto"`、長いログ行の切り捨て修正
* UIでのツール推論トレースのレンダリング
* 完全オフラインサポート: キャッシュ済みGGUFの検出と、推論と学習の両方に対するオフラインDNS自動検出

#### Unsloth Studioのセキュリティ改善

* 認証のレート制限。リバースプロキシに配慮し、回避されないようにしました
* より厳しくしたブロックリスト付きのサンドボックス化されたワーカー（bash、 `hf upload`, `NOFILE`)
* ワーカーが処理中のtmpディレクトリから抜け出せないようにするパス制限
* Unsloth API全体での厳格なスキーマ検証
* CSP / セキュリティヘッダーを強化（正当なfaviconホストのみ許可）
* を削除 `torch.load` のフォールバックを `training_args.bin` したことで、信頼できないpickleがモデル読み込み時に実行されることはなくなりました
* Tauriデスクトップのリリースフローを強化
* フロントエンド認証: singleflightトークン更新、変更時の現在パスワード入力、正常なログアウト、共有422ヘルパー
* キャンセル時のクリーンアップは処理中のtmpディレクトリのみに厳密に限定され、ユーザー状態を削除できないようになりました
  {% endupdate %}

{% update date="2026-05-19" tags="new-releases,v0.1.41-beta" %}

## MTP + Unslothの修正

Unslothにたくさんのバグ修正、UI・UX修正を行いました！最新の更新を入手するには:

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

#### 修正

1. 修正 `Unsloth Studioの更新` うまく動作していない
2. で止まる問題を修正 `reset-password` ページ
3. オフラインモードのサポートをさらに追加
4. Mac、CPU、GPUでMTPが速くならない問題を改善しました。今はかなり良くなっています！
5. 更新後にデスクトップショートカットが動作しない問題を修正
6. 多数のUI/UXバグ修正
   {% endupdate %}

{% update date="2026-05-18" tags="new-releases,model-release,v0.1.405-beta" %}

## Qwen3.6 MTP + API接続

Unslothにたくさんの新しい更新があります `v0.1.41-beta`:

* **約2倍高速なGGUF推論** 自動的に有効化された [MTP](/docs/jp/moderu/qwen3.6.md#mtp-guide)
* [**API呼び出しサポート**](/docs/jp/tong-he/connections.md) 向けに [OpenAI](/docs/jp/tong-he/connections/openai.md), [Anthropic](/docs/jp/tong-he/connections/anthropic-claude.md) など。自動プロンプトキャッシュ、Web検索、コード実行付きで
* 外部推論バックエンドに接続: [vLLM](/docs/jp/tong-he/connections/vllm.md), [Ollama](/docs/jp/tong-he/connections/ollama.md), [llama-server](/docs/jp/tong-he/connections/llamacppwounslothnillama-serverdeggufwo.md)
* 実験的 **MLX推論**
* 非英語言語への適切なサポート **非英語言語**
* **セキュリティ** 改善

<a href="/pages/b1345d93eb2f70a681e5a0bf731e28a576f0f428#qwen3.6-inference-tutorials" class="button primary">Qwen3.6チュートリアルを実行</a><a href="/pages/b1345d93eb2f70a681e5a0bf731e28a576f0f428#mtp-guide" class="button primary">MTPガイド</a>

<div data-with-frame="true"><figure><img src="/files/c82f372d44c1ce3bc1769e076fd015823d8681d1" alt="" width="375"><figcaption></figcaption></figure></div>

#### MTP推測デコードのサポートで、1.4〜2倍高速な推論を実現！

* **自動MTP推測デコード** MTP GGUF向け。付属のllama.cppプリビルドが古すぎる、またはMTPには古すぎる場合に警告します
* MTPサポート用の新しいプリビルドllama.cppバイナリ！

#### APIプロバイダー呼び出しと外部接続

* UnslothをあらゆるAPIクラウドプロバイダー（OpenAI、Anthropic、OpenRouterなど）に接続できるようになりました
* **組み込みWeb検索** OpenAI、Anthropic、OpenRouter、Kimi向け
* **組み込みコード実行** OpenAIとAnthropic向け（Anthropicのコンテナは保持され、ターン間で再利用されます）
* OpenAIとAnthropicのモデルではプロンプトキャッシュが有効になり、コストを50〜90%削減できます。
* ローカルプロバイダー（llama.cpp / vLLM / Ollama）ではAPIキーが任意になりました
* クラウドプロバイダーを追加するときにモデルを自動読み込み

#### MLX推論（実験的）

* MLXの量子化モデルとモデルを、Macマシン上でローカル実行できるようになりました！
* 近日中に思考、ツール、Web検索を追加します！

#### その他のUnsloth Studio更新

* 非英語言語（例: 日本語、中国語）の送信/プロンプトが正しく動作するようになりました
* OpenDocumentのチャット添付
* o3推論要約ペイロード
* IMEコンポーザーの強化、RTL `dir="auto"`、長いログ行の切り捨て修正
* UIでのツール推論トレースのレンダリング
* 完全オフラインサポート: キャッシュ済みGGUFの検出と、推論と学習の両方に対するオフラインDNS自動検出
* UI/UXの磨き上げを大量に実施: ダークテーマの再構築、右サイドバーの再設計、時間帯に応じたslothマスコット、閉じられるコピー可能なトースト、より大きいチャットコンポーザー、コード実行設定の磨き上げ、コンポーザーアクションピルのスタイリング、より細いDiscordボタン

#### トレーニング更新

* Gemmaのattention mask修正
* マルチ画像GRPO
* GRPOのhidden-state返却実験
* 新しい継続事前学習（CPT）トレーニング手法を第一級の選択肢として追加
* Gemma-4 MoE LoRA抽出器を登録して `grouped_mm` の収縮クラッシュを修正
* オプトインの融合 `lm_head` ＋クロスエントロピーforward。UNSLOTH\_RETURN\_LOGITS=1の下では単一matmul経路付き `UNSLOTH_RETURN_LOGITS=1`
* 評価用のバッチサイズを渡す
* 評価/学習パスは今や `HF_DATASETS_OFFLINE` に加えて `HF_HUB_OFFLINE`

#### Unsloth Studioのセキュリティ改善

* 認証のレート制限。リバースプロキシに配慮し、回避されないようにしました
* より厳しくしたブロックリスト付きのサンドボックス化されたワーカー（bash、 `hf upload`, `NOFILE`)
* ワーカーが処理中のtmpディレクトリから抜け出せないようにするパス制限
* Unsloth API全体での厳格なスキーマ検証
* CSP / セキュリティヘッダーを強化（正当なfaviconホストのみ許可）
* を削除 `torch.load` のフォールバックを `training_args.bin` したことで、信頼できないpickleがモデル読み込み時に実行されることはなくなりました
* Tauriデスクトップのリリースフローを強化
* フロントエンド認証: singleflightトークン更新、変更時の現在パスワード入力、正常なログアウト、共有422ヘルパー
* キャンセル時のクリーンアップは処理中のtmpディレクトリのみに厳密に限定され、ユーザー状態を削除できないようになりました
  {% endupdate %}

{% update date="2026-05-05" tags="new-releases,v0.1.39-beta,v0.1.38-beta" %}

## Unsloth APIエンドポイント

#### ***v0.1.39-betaのバグ修正*** **2026年5月5日**

チャット履歴が表示されない問題を修正しました（既存のチャット履歴は失われません）し、添付ファイルが正しく添付されない問題も修正しました。バグは表示のみで、 `2026.5.2` または直接 `curl -fsSL https://unsloth.ai/install.sh | sh`  呼び出して更新してください

Claude CodeやCodexのようなツールでローカルLLMを使えます [Claude Code](https://unsloth.ai/docs/basics/claude-code) および [Codex](https://unsloth.ai/docs/basics/codex) をUnslothのAPIエンドポイントに接続することで、 [Qwen](https://unsloth.ai/docs/models/qwen3.6) および [Gemma](https://unsloth.ai/docs/models/gemma-4) などのモデルをローカルで実行でき、自己修復ツール呼び出し、コード実行、Web検索などの追加機能も利用できます。

UnslothをAPI推論エンドポイントとして使うことは、セットアップが簡単で高速というだけでなく、Unslothが以下を提供するため有益です:

* [自己修復型ツール呼び出し](https://unsloth.ai/docs/new/studio/chat#auto-healing-tool-calling)で、壊れたまたは不正なツール呼び出しを50%削減するのに役立ちます
* [コード実行](https://unsloth.ai/docs/new/studio/chat#code-execution) サポート。BashとPythonの実行に対応し、より正確なコード出力を実現します。
* 高度な [Web検索](https://unsloth.ai/docs/new/studio/chat#advanced-web-search) 。ページにアクセスして実際に読み、詳細情報を収集します。
* [GGUFモデル向けの自動推論設定](https://unsloth.ai/docs/new/studio/chat#auto-parameter-tuning) （temp、top-kなど）

<div data-with-frame="true"><figure><img src="/files/77e863c5bd956050b90ee75739b6a07e63ef9f71" alt="" width="375"><figcaption></figcaption></figure></div>

#### 新しいモデル

NVIDIA [Nemotron 3 Nano Omni](/docs/jp/moderu/nemotron-3-nano-omni.md)、IBM [Granite 4.1](/docs/jp/moderu/ibm-granite-4.1.md) および [Mistral 3.5](/docs/jp/moderu/mistral-3.5.md) Medium。transformersとGGUFでの実装に関するいくつかの問題をMistralが解決するのを支援しました。

#### Unslothの更新

* 停止したUnslothのトレーニング実行をチェックポイントから再開できるようになりました。
* チャットスレッドがより確実に自動保存・永続化されるようになりました。
* マルチプロセス環境でのDPOトレーニングのハングを修正しました。
* MROPE更新によりVLM GRPOサポートが改善しました。
* Unslothの停止ボタンが正しく生成を停止するようになりました。
* ブラウザ更新後にチャットテンプレートが消える問題を修正しました。
  {% endupdate %}

{% update date="2026-04-23" tags="new-releases,v0.1.37-beta" %}

## 全面的新UI再設計

皆さん、チャットとトレーニングを重視するために、Unsloth StudioのUIとUX全体を刷新しました:

* コミュニティのフィードバックに基づき、折りたたみ可能なサイドバーを追加

<div data-with-frame="true"><figure><img src="/files/2c86177fef09b636c736623bc2c2908ac9873309" alt="" width="375"><figcaption></figcaption></figure></div>

* チャットの削除と過去会話の検索ができるようになりました

<div><figure><img src="/files/50ab00da25c0649a210aee73f84835a318640cbc" alt=""><figcaption></figcaption></figure> <figure><img src="/files/be323a9fe1d0e85c66937be7803fb2aeb69beacb" alt=""><figcaption></figcaption></figure></div>

* Qwen3.6のような対応モデル向けの新しい「思考を保持」トグル
* よりクリーンで一貫性のあるデザインと、より簡単なナビゲーション
* プロフィール画像、名前などを変更できる拡張設定ページ

<div data-with-frame="true"><figure><img src="/files/9e8859d30ef9c6e05999590bc4f98d6048c5b4e1" alt="" width="375"><figcaption></figcaption></figure></div>

* Hugging Faceトークンを2回入力する必要はもうありません
* gpt-ossに低・中・高の思考トグルが追加されました。
* Linux CUDA上でも、最新のllama.cppプリビルドを使うようになりました
* 多くのバグ、一貫性、安定性の修正
* Kimi-K2.6を実行できるようになりました！
* 実験的なAPIサポートも追加しました。ガイドや告知などは来週公開予定です。

Qwen3.6は以前からUnsloth Studioでの実行と学習がサポートされていました。今すぐQwen3.6-27Bを学習・実行できます！
{% endupdate %}

{% update date="2026-04-22" tags="model-release,new-releases" %}

## **Qwen3.6-27B + Kimi K2.6**

[**Qwen3.6-27B**](/docs/jp/moderu/qwen3.6.md) は今や実行（18GB RAM）およびUnsloth Studioでのファインチューニングが可能です。Kimi K2.6もUnslothで実行できます（350GB RAM）。

Unsloth Studioに多くの新しい更新が入ったので、アップデートしてください。詳細と記事は数日以内に公開予定です。
{% endupdate %}

{% update date="2026-04-16" tags="model-release,new-releases" %}

## **Qwen3.6**

[**Qwen3.6**](/docs/jp/moderu/qwen3.6.md) は今やUnsloth Studioで実行およびファインチューニングが可能です。このモデルは23GB RAMで動作し、ほぼすべてのベンチマークで最強クラスの中型LLMです。
{% endupdate %}

{% update date="2026-04-11" tags="model-release" %}

## **Gemma 4の更新 + MiniMax-M2.7**

[Gemma 4 GGUF](https://huggingface.co/collections/unsloth/gemma-4) はGoogle公式のチャットテンプレート修正（ツール呼び出しの修正・改善）と最新のllama.cpp修正で更新されました。最新のllama.cppに更新し、量子化モデルを再ダウンロードすれば、 `未使用トークン` の問題はもう出ないはずです。\
\
[MiniMax-M2.7](/docs/jp/moderu/tutorials/minimax-m27.md) が公開されました！128GB RAM / ユニファイドメモリ上で、4bit量子化のGGUFを使ってローカル実行できます。 [**MiniMax-M2.7 GGUF**](https://huggingface.co/unsloth/MiniMax-M2.7-GGUF)
{% endupdate %}

{% update date="2026-04-08" tags="new-releases,v0.1.36-beta" %}

## **Gemma 4の修正**

Gemma 4を更新しました [多くの修正とともに](/docs/jp/moderu/gemma-4/train.md)。これらのバグは普遍的なもので、すべてのトレーニングパッケージと実装に影響し、 **Unslothが原因ではありませんでした**。私たちはバグを特定して修正し、今ではGemma 4の学習がUnslothで正しく動作します。

必要なのは **8GB VRAM** だけで **Gemma-4-E2B** をローカルで学習できます。UnslothはGemma 4を **約1.5倍高速に、かつVRAM使用量を約60%削減して学習します** 。Gemma 4学習の完全ガイドとノートブックは、 [ブログをご覧ください](/docs/jp/moderu/gemma-4/train.md).

#### Gemma 4学習の修正

1. **勾配累積** はもう損失の爆発を引き起こしませんでした。以前は損失が **300〜400**まで急上昇することがありました。期待される損失は **10〜15**.
2. に修正しました **IndexError** に影響する **26B** および **31B** の推論を `transformers`.
3. の **E2B/E4B** での文字化け出力を修正 `use_cache=False`。を参照してください [issue #45242](https://github.com/huggingface/transformers/issues/45242).
4. 修正しました **float16音声の** オーバーフローを `-1e9` の値から修正しました。

もし **13〜15を超える損失が見えるなら、** 例えば **100** または **300** 、勾配累積が誤って処理されている可能性があります。これは両方で修正されています **Unsloth** および **Unsloth Studio**.

#### Gemma 4量子化再アップロード

Gemma 4 GGUFも更新したため、再ダウンロードが必要です。繰り返しますが、これらの量子化問題は **Unslothとは関係がなく、Unslothが原因でもありません**:

1. CUDA: 融合前にバッファ重なりを確認 - `<unused24>` トークン - [PR #21566](https://github.com/ggml-org/llama.cpp/pull/21566)
2. `kv-cache`: 異種iSWA向けの注意回転をサポート - [PR #21513](https://github.com/ggml-org/llama.cpp/pull/21513)
3. `語彙`: Gemma 4向けにBPEデトークナイザーへバイトトークン処理を追加 - [PR #21488](https://github.com/ggml-org/llama.cpp/pull/21488)
4. `変換`: 設定 `"add bos" == True` Gemma 4 用 - [PR #21500](https://github.com/ggml-org/llama.cpp/pull/21500)
5. `共通`: Gemma 4 専用パーサーを追加 - [PR #21418](https://github.com/ggml-org/llama.cpp/pull/21418)
6. `llama-model`: 読み取り `final_logit_softcapping` Gemma 4 用 - [PR #21390](https://github.com/ggml-org/llama.cpp/pull/21390)
7. `llama`: Gemma 4 用のカスタム改行分割を追加 - [PR #21406](https://github.com/ggml-org/llama.cpp/pull/21406)

#### Unsloth Studio の更新

* 追加 **先読みデコード** サポート（ngram-mod、デフォルトで有効）
* Llama.cpp を最新バージョンに更新し、Gemma 4 の修正をすべて適用
* Qwen3.5 と Gemma 4 の学習問題を修正
* Gemma 4 モデルのエクスポートと保存を有効化
* ターミナルと Python ツールのサンドボックスセキュリティを強化
* レシピが Chat で読み込まれたモデルを使えるようにする
* ナビゲーション時（およびタブ切り替え時）に空のチャットスレッドができる問題を修正し、新規チャットの流れを安定化
* 非 LLM レシピの実行を許可し、実行時に Data タブを先頭に移動
* 重複ダウンロードを防ぐため、HF キャッシュ済みリポジトリの大文字小文字を再利用
  {% endupdate %}

{% update date="2026-04-03" tags="new-releases,v0.1.36-beta" %}

## **Google - Gemma 4**

* これで次を実行・学習できます: [Gemma 4](/docs/jp/moderu/gemma-4.md) Unsloth でのモデル。
* Intel Mac でも動作するようになりました
* llama.cpp 用の事前コンパイル済みバイナリ、Gemma-4 の修正 2 件:
  * vocab: Gemma4 トークナイザーを修正（[#21343](https://github.com/ggml-org/llama.cpp/pull/21343))
  * 修正: gemma 4 テンプレート（[#21326](https://github.com/ggml-org/llama.cpp/pull/21326))
* 小さなモデルでのツール呼び出しがより安定し、途中で切れなくなりました
* Windows、Linux、Mac、WSL 向けの事前コンパイル済みバイナリ - CPU と GPU
* 非ビジョンモデル向けに Speculative Decoding を追加（Gemma-4 は残念ながらビジョンモデルで、Qwen3.5 も同様）
* コンテキスト長が正しく適用されるようになりました。
* Web 検索で要約だけでなく実際の Web コンテンツを取得するようになりました
* HF API 呼び出しを 90% 削減 - レート制限を受けにくく
  {% endupdate %}

{% update date="2026-03-31" tags="new-releases,improvements" %}

## **ツール呼び出しの精度 +50%、さらにサポート強化**

* すべてのモデルでのツール呼び出しが現在 **+30% 〜 +80% 正確になりました。**
* Web 検索で要約だけでなく実際の Web コンテンツを取得するようになりました
* 許可されるツール呼び出し回数が 10 回から 25 回に増加
* ツール呼び出しの終了処理が大幅に改善され、ループ / 繰り返しが減ります
* さらに **ツール呼び出しの修復** ツール呼び出しが XML を漏らすのも防ぐための重複排除ロジック
* テスト済み: `unsloth/Qwen3.5-4B-GGUF` (`UD-Q4_K_XL`）, Web 検索 + コード実行 + 思考を有効化。

| 指標            | 以前    | 後         |
| ------------- | ----- | --------- |
| 応答内の XML 漏れ   | 10/10 | 0/10      |
| 使用した URL フェッチ | 0     | 10 回中 4 回 |
| 正しい曲名での実行     | 0/10  | 2/10      |
| 平均ツール呼び出し回数   | 5.5   | 3.8       |
| 平均応答時間        | 12.3秒 | 9.8秒      |

#### 新機能

* 追加 **カスタムフォルダ** どのフォルダでも任意の GGUF を使えるようになります - 今のところは Chat の詳細設定と Custom Folders からアクセスできます
* **更新ボタン** が表示されるようになりました
* インストールスクリプトのスタイルをすべて更新しました！
* 予備 **推論と学習のための自動マルチ GPU サポート** - 1 GPU に収まらない大きなモデルに便利です - Unsloth auto が GPU リソースを割り当てます
* Intel Mac はそのまま使えるはずです

さらに滑らかで高速になった Unsloth

* **大規模モデルのダウンロードでタイムアウトする問題を修正** - もうタイムアウトは発生しません。
* **Hugging Face のレート制限を修正 - HF API 呼び出しを 90% 削減**
* Windows での bun を修正し、インストールを高速化
  {% endupdate %}

{% update date="2026-03-27" tags="new-releases,fixes,improvements" %}

## **重要な新情報**

前回のリリースからまだ 2 日しか経っていませんが、より重要な更新があります:

* **推論が 20〜30% 高速化しました。** 以前は、ツール呼び出しと repeat penalty により推論速度が通常より遅くなることがありました。推論 tokens/s は現在、次と同等に動作するはずです `llama-server` / `llama.cpp`.
* **古いモデルや既存モデルを自動検出するようになりました** からダウンロードされた **LM Studio、Hugging Face、** および同様のソース。
* **推論 token/s 速度が正しく計算されるようになりました。** 以前は tokens/s に起動時間が含まれており、表示速度が実際より遅く見えていました。現在は「真の」推論速度を反映するはずです。
* **CPU 使用率が急上昇しなくなりました。** 以前は、インライン querier の ID がレンダリングのたびに変わり、その結果 `useLiveQuery` が継続的に再購読していました。
* **Unsloth Studio に終了用の x ボタンが追加され、正しく終了できるようになりました。** 以前は、デスクトップアイコンから開いた後に閉じても正しく終了しませんでした。現在は、ショートカットから起動するとターミナルも開き、そのターミナルを閉じると Unsloth Studio が完全に終了します。以前のセッションからまだ開いている場合は、コンピューターを再起動するか、次を実行してください `lsof -i :8888` 次に `kill -9 <PID>`.
* **さらに改善されたツール呼び出しと Web 検索** エラーを減らして。
* ドキュメントを更新し、次に関する新情報を多数追加しました: [モデルの削除、アンインストール](/docs/jp/xin-zhe/studio/install.md#uninstall) など。
* **Windows と Linux 全体で、より見やすく賢いインストール / セットアップのログ出力。** 出力は一貫した書式で読みやすくなり、よりスムーズな体験のためデフォルトで静かになり、より豊かな `--verbose` 詳細な技術情報が必要なときは診断情報を表示できます。
* 学習履歴を確認できるようになりました！
  {% endupdate %}

{% update date="2026-03-25" tags="new-releases,fixes,improvements" %}

## Unsloth Studio 後の初回リリース

皆さん、これは Unsloth Studio を公開してから最初のリリースです。新機能と修正がたくさんあります:

* **Unsloth Studio を更新できるようになりました！** 同じインストールコマンドで更新してください。
* **Windows** CPU でも GPU でもシームレスに動作します。再インストールしてください！
* **アプリのショートカット**。インストール後は、Windows、MacOS、Linux で Start / Launch とデスクトップのショートカットアイコンから起動できます。
* **事前コンパイル済み `llama.cpp` バイナリ** および `mamba_ssm` - インストールが 6 倍高速化！バイナリのサイズも 300MB 未満です。
* **インストールサイズを 50% 削減** （7GB 以上の節約）、インストール 2 倍高速化と解決の高速化。pypi サイズを 50% 削減。
* **ツール呼び出しが改善されました。** llama.cpp の解析が改善され、チャットに生のツールマークアップが表示されず、推論が高速化し、新しい Tool Outputs パネルとタイマーが追加されました。
* MacOS と CPU でも [Data Recipes](/docs/jp/xin-zhe/studio/data-recipe.md) マルチファイルアップロードを有効化しました。
* **Linux 向け AMD サポートは予備対応** 専用マシンのみ - 自動検出します。
* **設定サイドバーを再設計。** 設定は次のようにグループ化されました **モデル、サンプリング、ツール、設定**
* **コンテキスト長** を調整できるようになりました。これは必要ありません。なぜなら llama.cpp が必要な正確なコンテキストを次の方法で賢く使うためです: `--fit on`
* **マルチファイルアップロード。** Data レシピで、PDF、DOCX、TXT、MD の複数ドラッグ＆ドロップアップロードをサポートし、バックエンド抽出、保存済みアップロード、改善されたプレビューに対応しました。
* **Colab** 無料の T4 GPU での Unsloth Studio が修正されました！ [こちらで試してください](https://colab.research.google.com/github/unslothai/unsloth/blob/main/studio/Unsloth_Studio_Colab.ipynb)。事前コンパイル済みバイナリにより、20 倍高速です！
* **チャットの可観測性が向上しました。** Unsloth では次が表示されるようになりました `llama-server` 実行時間と使用状況、コンテキストウィンドウ使用バー、より豊富なソースのホバーカード。
* **全体的に UX が向上** - クリック可能なリンク、LaTeX 解析の改善、デフォルトカード向けのツール / コード / Web ツールチップなど多数！
* **LiteLLM -** Unsloth Studio と Unsloth は **影響を受けていません** 近年の LiteLLM の侵害の影響を受けました。Nemo Data Designer は LiteLLM を次までしか使用していませんでした: `1.80`、影響を受けた `1.82.7` または `1.82.8`、その後完全に削除しました。
* 1 行の新しいインストールコマンドがあります。次を実行するだけです:&#x20;

  <pre class="language-bash" data-overflow="wrap" data-expandable="true"><code class="lang-bash">curl -fsSL https://unsloth.ai/install.sh | sh
  </code></pre>

#### **修正点:**

* **Windows / セットアップの改善。** Windows のサイレント終了、Anaconda/conda-forge の起動クラッシュ、壊れた非 NVIDIA の Windows インストール、初期 CUDA / 古い venv のセットアップ確認漏れを修正しました。
* **システムプロンプトを修正しました。** GGUF 以外のテキストとビジョン推論で再び動作します。
* **システムプロンプトとプリセットを永続化。** カスタムシステムプロンプトとチャットプリセットが、再読み込みやページ変更後も保持されるようになりました。
* **GGUF エクスポートを拡張。** LoRA/PEFT だけでなく、完全な fine-tune も GGUF にエクスポートできるようになりました。ベースモデルの解決がより信頼性の高いものになり、未対応のエクスポートオプションは UI で無効化されています。
* **チャットのスクロール / レイアウトの修正。** 生成中のスクロール位置の問題、思考パネルのレイアウトずれ、推論パネルを折りたたんだ際のビューポートジャンプを修正しました。
* **より賢いポート競合検出。** Unsloth がループバック競合を検出し、可能な場合はブロックしているプロセスを特定し、フォールバックポートのメッセージをより明確に表示します。
  {% endupdate %}

{% update date="2026-03-17" tags="fixes,improvements" %}

## 新しいツール呼び出し + Windows の安定性

* Claude Artifacts が動作し、HTML をチャット内でスネークゲームのように実行できます
* ツール呼び出しの精度が +30% 向上、特に小さなモデルで改善 + ツール呼び出し用タイマー
* ツール + Web 検索の出力を保存可能 + 自動修復ツールをオン / オフ切り替え
* 多数のバグ修正 - Windows の CPU が動作、Mac がよりシームレスに、インストールがより高速かつ軽量に
  {% endupdate %}
  {% endupdates %}


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://unsloth.ai/docs/jp/xin-zhe/changelog.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.