> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/jp/xin-zhe/changelog.md).

# Unslothの更新

最新の変更を使うには、 [Unslothを更新してください](/docs/jp/xin-zhe/studio/install.md#update-unsloth-studio).

{% updates format="full" %}
{% update date="2026-06-12" tags="new-releases,v0.1464-beta" %}

## DiffusionGemma + Gemma 4 MTP

最新のものをインストールしてください [`v0.1.464-beta`](https://github.com/unslothai/unsloth/tree/v0.1.462-beta) または `2026.6.7`. [DiffusionGemma](https://unsloth.ai/docs/models/diffusiongemma), [Gemma 4 MTP](https://unsloth.ai/docs/models/mtp) と [**MiniMax-M3**](https://unsloth.ai/docs/models/minimax-m3) はすべてサポートされました。

* 実行と学習 [DiffusionGemma](https://unsloth.ai/docs/models/diffusiongemma) 経由で [Unsloth Studio](https://unsloth.ai/docs/new/studio).
* [Gemma 4 MTP](https://unsloth.ai/docs/models/mtp) 登場しました！実行 [Gemma 4](https://unsloth.ai/docs/models/gemma-4) MTPにより約2倍高速です。
* Gemma 4（`wav`, `mp3`, `m4a`, `flac`, `webm`).
* Gemma 4にPreserve Thinkが追加されました。

<figure><img src="/files/c3cb18ff1e86ab57357a3712b0511e41752c66b4" alt="" width="375"><figcaption></figcaption></figure>

#### Hub + ダウンロードマネージャー（実験的）

* 新しい **Hub** Hugging Faceのモデルとデータセットを閲覧、ダウンロード、管理するためのページ。
* Unslothは、すでにマシン上にあるモデルとデータセットを検出し、ダウンロード済みアセットと並べて表示できるようになりました。
* ダウンロード済み [GGUFモデル](https://unsloth.ai/docs/basics/inference-and-deployment/saving-to-gguf) が直接 **実行 / 新規チャット** アクションがあります。

#### RAG / ファイルとチャット（実験的）

* 追加しました [**ファイルとチャット**](https://unsloth.ai/docs/new/studio/chat) をStudioに追加し、自分のドキュメントやナレッジベースに対して質問できるようになりました。
* ハイブリッド検索、引用、PDFプレビュー、スレッドごとのドキュメント、そして組み込みの `search_knowledge_base` ツール。

#### 新しい更新ボタン + ハードウェアサポート

* Unslothは常に最新の [llama.cppの事前ビルドを使用するようになりました](https://unsloth.ai/docs/new/changelog) CUDA、ROCm、Windows、Linux、macOS全体で。
* アプリ内に **llama.cppを更新** ボタンを追加し、Studioを再インストールせずにローカルバックエンドを更新できるようにしました。
* Windows / WSLのAMDサポートを改善し、 [Strix HaloのROCmサポート](https://unsloth.ai/docs/get-started/install/amd), [BlackwellのCUDA選択](https://unsloth.ai/docs/blog/fine-tuning-llms-with-blackwell-rtx-50-series-and-unsloth)、およびインストーラーメッセージをより分かりやすくしました。

#### ローカルチャット、ツール、API互換性

* ローカル [ツール呼び出し](https://unsloth.ai/docs/basics/tool-calling-guide-for-local-llms) はより信頼性が高くなり、ツールカードの順序が改善され、重複するツールループが減り、GGUF視覚モデルでのツール使用もサポートされます。
* 改善された [OpenAI互換API](https://unsloth.ai/docs/basics/inference-and-deployment/llama-server-and-openai-endpoint) およびAnthropic互換APIの挙動がローカルStudioサーバーで改善され、エラー、トークン使用量、停止理由、そして [Claude Code互換性](https://unsloth.ai/docs/basics/claude-code).

#### 学習と修正

* 改善された [MLXサポート](https://unsloth.ai/docs/new/studio/install) で、モデルラベル、生成速度統計が改善され、以下の修正を行いました： [VLM学習](https://unsloth.ai/docs/basics/vision-fine-tuning).
* いくつかの [学習](https://unsloth.ai/docs/get-started/fine-tuning-llms-guide) と [データセット](https://unsloth.ai/docs/get-started/fine-tuning-llms-guide/datasets-guide) のエッジケースを修正しました。書き込み不可のHugging Faceキャッシュやカスタムデータセットマッピングを含みます。
* チャット、メニュー、モデル選択、ダークモード、インポート/エクスポート、設定全体で多数のUI改善修正を追加しました。

Unslothを更新するか、新しいUnsloth Studioをインストールするには、次を使用する必要があります：

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% endupdate %}

{% update date="2026-06-03" tags="new-releases,v0.1.44-beta" %}

## Gemma 4 12B、新UI、MCP、プロジェクト

今回のアップデートは主にGemma 4 12B、MCP、プロジェクト、Canvas、CUDA 13.3、新しいチャットUIに焦点を当てています。来週はさらに大きな更新があります。

<div data-with-frame="true"><figure><img src="/files/4023c83298028cd8c24702bee1195b589362b0ff" alt="" width="375"><figcaption></figcaption></figure></div>

#### Gemma 4 12B

Googleがリリース [Gemma 4 12B](https://unsloth.ai/docs/models/gemma-4)、8GB RAMでローカル実行できる新しいモデルです。 [GGUF](https://huggingface.co/unsloth/gemma-4-12b-it-GGUF) / [ガイド](https://unsloth.ai/docs/models/gemma-4)

Gemma 4 12B Unifiedは画像、音声、256Kコンテキストをサポートします。Unsloth Studio経由でモデルを実行・学習できます。

#### MCP

* リモート `MCP` サーバーサポート。カスタムヘッダーとOAuthを含みます
* ローカルのコマンドベースの `MCP` サーバーサポート
* `MCP` はチャットコンポーザーから有効にできるようになりました
* 一般的な `MCP` サーバー

#### 新しいチャットUI

* プロジェクト、Canvas、 `MCP`、RAGと比較コントロールがプラスメニューに移動しました
* 検索とコードのコントロールはコンポーザーからアクセスしやすくなりました
* メニュー、オーバーレイ、アイコン、クリック可能なコントロールがStudio全体でより一貫しました

#### プロジェクト

* 関連するチャットを専用のプロジェクトワークスペースに整理できます
* 既存のチャットをプロジェクトに移動
* サイドバーから直接プロジェクトを作成・管理

#### 実験的なCanvas / Artifacts

* 生成されたHTMLをUnsloth Studio内の専用Canvasパネルで開きます
* ブラウザベースの可視化やCDN読み込みパッケージを含むインタラクティブ出力をサポートします
* レンダリングプレビューとソースコードを切り替えられます

#### インストール、ランタイム、ハードウェア

* Windowsの事前ビルドインストールでは、もはや初期の `CUDA Toolkit` 確認
* Linux `llama.cpp` の事前ビルドは検出されたランタイムと一致するようになりました `cudart` メジャー
* `ROCm` gfx検出が事前ビルド選択に渡されるようになりました
* `Blackwell`, `B300` と `ARM64` Linuxサポートの更新

Unslothを更新するか、新しいUnsloth Studioをインストールするには、次を使用する必要があります：

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% hint style="warning" %}
**使用しないでください `unsloth studioの更新` パッケージングでは最新の更新が取得されないため、もう使わないでください！**
{% endhint %}
{% endupdate %}

{% update date="2026-05-31" tags="new-releases,v0.1.43-beta" %}

## CUDA 13.3、Windows、Mac

**Unslothを更新するか、新しいUnsloth Studioをインストールするには、次を使用する必要があります：**

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% hint style="warning" %}
**使用しないでください `unsloth studioの更新` パッケージングでは最新の更新が取得されないため、もう使わないでください！**
{% endhint %}

#### Macの更新

* 再有効化 `llama.cpp` Apple Silicon（M1-M4）向けの事前ビルドバイナリ - Mac OS 14 / 15 / 26（Tahoe）
* Apple SiliconのMac OS 13（Ventura）はソースビルドです
* Mac OS 13.3 / 14 / 15 / 26（Tahoe）向けIntel（x86\_64）は `llama.cpp` 事前ビルドバイナリを使用します
* Intel向けのMac OS 13.0 - 13.2はソースビルドです

#### Windowsの更新

* CUDA 13.3 `llama.cpp` 事前ビルドバイナリがWindowsで動作するようになりました
* CUDA 13.2、CUDA 13.1以下では、WindowsデバイスはCUDA 12.4フォールバックを使用します。CUDA 13.1のバイナリは近日中に対応します。

#### CUDA 13.3の更新

* CUDA 13.3のLinux以外のバイナリは動作します。今のところは引き続きCUDA 13.1を使用します
* CUDA 13.3はCUDA 13.2の文字化け問題を解決します - <https://github.com/unslothai/unsloth/issues/4849> を参照してください

#### Blackwell GPUの更新

* 当面、Blackwellでは次の事前リリースが遅れます： `llama.cpp` CUDA 12.4が動作しないため事前ビルドバイナリは遅れます。まもなく解決に取り組みます。
  {% endupdate %}

{% update date="2026-05-26" tags="new-releases,v0.1.42-beta" %}

## 大規模刷新前の更新。

みなさん、大規模な刷新の前にもう1回ほど更新を行います。刷新は今週または来週に来る可能性が高いです。刷新では、多くのこと、特に新しい主要機能と多くのデザイン変更が行われます。

{% embed url="<https://github.com/user-attachments/assets/70456395-e016-4273-8256-35adb206267e>" %}

* 新機能： [**API呼び出しサポート**](https://unsloth.ai/docs/integrations/connections) 画像生成＋編集、適切なウェブ検索、コード実行、自動プロンプトキャッシュも追加されました。接続 [OpenAI](https://unsloth.ai/docs/integrations/connections/openai), [Anthropic](https://unsloth.ai/docs/integrations/connections/anthropic-claude) など。
* 適切なサポート **非英語言語** 例：日本語、中国語、インド語など。

前回のリリースは1日しか公開されなかったので、見逃した方も多いかもしれません。私たちは次を導入しました：

* 外部推論バックエンドに接続： [vLLM](https://unsloth.ai/docs/integrations/connections/vllm), [Ollama](https://unsloth.ai/docs/integrations/connections/ollama), [llama-server](https://unsloth.ai/docs/integrations/connections/connect-llama.cpp-to-unsloth-run-ggufs-with-llama-server)
* **セキュリティの改善**
* **MTPの自動推測デコード** MTP GGUF向け。お使いのハードウェアに最適化された設定を取得できます。

#### APIプロバイダー呼び出しと外部接続

* Unslothを任意のAPIクラウドプロバイダー（OpenAI、Anthropic、OpenRouterなど）に接続できるようになりました
* **組み込みのウェブ検索** OpenAI、Anthropic、OpenRouter、Kimi向け
* **組み込みのコード実行** OpenAIとAnthropic向け（Anthropicのコンテナは保持され、ターンをまたいで再利用されます）
* OpenAIとAnthropicモデルでプロンプトキャッシュが有効になり、コストを50〜90%削減できます。
* 画像生成＋編集
* ローカルプロバイダー（llama.cpp / vLLM / Ollama）ではAPIキーが任意になりました
* クラウドプロバイダーを追加するとモデルを自動読み込み

#### その他のUnsloth Studio更新

* OpenDocumentチャット添付
* o3推論サマリーペイロード
* 非英語言語（例：日本語、中国語）の送信/プロンプトが正しく動作するようになりました
* IMEコンポーザーの強化、RTL `dir="auto"`、長いログ行の切り詰め修正
* UIでのツール推論トレースのレンダリング
* 完全オフラインサポート：キャッシュ済みGGUFの検出と、推論・学習の両方に対するオフラインDNS自動検出

#### Unsloth Studioのセキュリティ改善

* 認証のレート制限。リバースプロキシを考慮し、回避されないようにしました
* 制限付きのブロックリストを強化したサンドボックス化ワーカー（bash、 `hf upload`, `NOFILE`)
* パスの封じ込めにより、ワーカーが処理中のtmpディレクトリから脱出できないようにしました
* Studio API全体で厳格なスキーマ検証
* CSP / セキュリティヘッダーを強化（正当なfaviconホストのみ許可）
* を削除しました `torch.load` のフォールバックを `training_args.bin` そのため、信頼できないpickleがモデル読み込み時に実行されることはありません
* Tauriデスクトップのリリースフローを強化
* フロントエンド認証：単一フライトのトークン更新、変更時の現在のパスワード入力、正常なログアウト、共通の422ヘルパー
* キャンセル時のクリーンアップは、処理中のtmpディレクトリに厳密に限定され、ユーザー状態を削除できないようになりました
  {% endupdate %}

{% update date="2026-05-19" tags="new-releases,v0.1.41-beta" %}

## MTP + Unslothの修正

Studioのバグ修正、UI/UX修正を多数行いました！最新の更新を入手するには次を実行してください：

**macOS、Linux、WSL：**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows：**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

#### 修正

1. 修正 `unsloth studioの更新` うまく動作していない
2. で止まる問題を修正 `reset-password` ページ
3. オフラインモードのサポートをさらに追加
4. Mac、CPU、GPUでMTPが速くならない問題を改善しました。今はずっと良くなっています！
5. 更新後にデスクトップショートカットが動作しない問題を修正
6. UI/UXのバグ修正を大量に実施
   {% endupdate %}

{% update date="2026-05-18" tags="new-releases,model-release,v0.1.405-beta" %}

## Qwen3.6 MTP + API接続

Unslothに多くの新しい更新があります `v0.1.41-beta`:

* **約2倍高速なGGUF推論** 自動的に有効化される [MTP](/docs/jp/moderu/qwen3.6.md#mtp-guide)
* [**API呼び出しサポート**](broken://pages/d43d7b4603ab2319ce1b2b81a2f24e5b00764c03) 用の [OpenAI](broken://pages/5dcbc8ca73a58bd5bceb0e7e59c5f84cbd85565a), [Anthropic](broken://pages/2380e84b24ba5ea85d37859f564beae2716c01d6) などで、自動プロンプトキャッシュ、ウェブ検索、コード実行付き
* 外部推論バックエンドに接続： [vLLM](broken://pages/d1887f4930db6c9db2db627a29a413bae108ff26), [Ollama](broken://pages/af44981bc3ebd0cfbb3fc37a243771dafec0564e), [llama-server](broken://pages/32e474149bff449315dd9a7a4175b82ba4368138)
* 実験的 **MLX推論**
* 適切なサポート **非英語言語**
* **セキュリティ** 改善

<a href="/pages/b1345d93eb2f70a681e5a0bf731e28a576f0f428#qwen3.6-inference-tutorials" class="button primary">Qwen3.6チュートリアルを実行</a><a href="/pages/b1345d93eb2f70a681e5a0bf731e28a576f0f428#mtp-guide" class="button primary">MTPガイド</a>

<div data-with-frame="true"><figure><img src="/files/c82f372d44c1ce3bc1769e076fd015823d8681d1" alt="" width="375"><figcaption></figcaption></figure></div>

#### MTPの推測デコードサポートにより、1.4〜2倍高速な推論！

* **MTPの自動推測デコード** MTP GGUF向け。付属のllama.cpp事前ビルドが古い、またはMTPには古すぎる場合に警告します
* MTPサポートのための新しいllama.cpp事前ビルドバイナリ！

#### APIプロバイダー呼び出しと外部接続

* Unslothを任意のAPIクラウドプロバイダー（OpenAI、Anthropic、OpenRouterなど）に接続できるようになりました
* **組み込みのウェブ検索** OpenAI、Anthropic、OpenRouter、Kimi向け
* **組み込みのコード実行** OpenAIとAnthropic向け（Anthropicのコンテナは保持され、ターンをまたいで再利用されます）
* OpenAIとAnthropicモデルでプロンプトキャッシュが有効になり、コストを50〜90%削減できます。
* ローカルプロバイダー（llama.cpp / vLLM / Ollama）ではAPIキーが任意になりました
* クラウドプロバイダーを追加するとモデルを自動読み込み

#### MLX推論（実験的）

* MLXの量子化モデルとモデルをMacマシン上でローカル実行できるようになりました！
* 近日中に思考、ツール、ウェブ検索を追加します！

#### その他のUnsloth Studio更新

* 非英語言語（例：日本語、中国語）の送信/プロンプトが正しく動作するようになりました
* OpenDocumentチャット添付
* o3推論サマリーペイロード
* IMEコンポーザーの強化、RTL `dir="auto"`、長いログ行の切り詰め修正
* UIでのツール推論トレースのレンダリング
* 完全オフラインサポート：キャッシュ済みGGUFの検出と、推論・学習の両方に対するオフラインDNS自動検出
* UI/UXを多数改善：ダークテーマのリファクタリング、右サイドバーの再設計、時間帯ごとのナマケモノマスコット、閉じられてコピー可能なトースト、より大きいチャットコンポーザー、コード実行設定の改善、コンポーザーのアクションピルのスタイリング、より細いDiscordボタン

#### 学習の更新

* Gemmaのattention mask修正
* 複数画像GRPO
* GRPOのhidden state返却実験
* 新しい継続事前学習（CPT）学習手法を正式な選択肢として追加
* 修正のためにGemma-4 MoE LoRA抽出器を登録 `grouped_mm` 縮約クラッシュ
* 任意参加の融合 `lm_head` ＋クロスエントロピーforward。single-matmulパスは `UNSLOTH_RETURN_LOGITS=1`
* 評価用のバッチサイズを渡す
* 評価/学習パスは次を尊重するようになりました `HF_DATASETS_OFFLINE` とともに `HF_HUB_OFFLINE`

#### Unsloth Studioのセキュリティ改善

* 認証のレート制限。リバースプロキシを考慮し、回避されないようにしました
* 制限付きのブロックリストを強化したサンドボックス化ワーカー（bash、 `hf upload`, `NOFILE`)
* パスの封じ込めにより、ワーカーが処理中のtmpディレクトリから脱出できないようにしました
* Studio API全体で厳格なスキーマ検証
* CSP / セキュリティヘッダーを強化（正当なfaviconホストのみ許可）
* を削除しました `torch.load` のフォールバックを `training_args.bin` そのため、信頼できないpickleがモデル読み込み時に実行されることはありません
* Tauriデスクトップのリリースフローを強化
* フロントエンド認証：単一フライトのトークン更新、変更時の現在のパスワード入力、正常なログアウト、共通の422ヘルパー
* キャンセル時のクリーンアップは、処理中のtmpディレクトリに厳密に限定され、ユーザー状態を削除できないようになりました
  {% endupdate %}

{% update date="2026-05-05" tags="new-releases,v0.1.39-beta,v0.1.38-beta" %}

## Unsloth APIエンドポイント

#### ***v0.1.39-betaのバグ修正*** **2026年5月5日**

チャット履歴が表示されない問題（既存のチャット履歴は失われません）と、添付ファイルが正しく添付されない問題を修正しました。バグは表示のみでした - 次を使用してください `2026.5.2` または直接呼び出してください `curl -fsSL https://unsloth.ai/install.sh | sh`  更新するには

次のようなツールでローカルLLMを使用できます： [Claude Code](https://unsloth.ai/docs/basics/claude-code) と [Codex](https://unsloth.ai/docs/basics/codex) UnslothのAPIエンドポイントに接続することで。これにより、次のようなモデルを実行できます： [Qwen](https://unsloth.ai/docs/models/qwen3.6) と [Gemma](https://unsloth.ai/docs/models/gemma-4) をローカルで、自己修復型ツール呼び出し、コード実行、ウェブ検索などの追加機能付きで。

UnslothをAPI推論エンドポイントとして使うことが有益なのは、セットアップが簡単で高速だからだけでなく、Unslothが次を提供するからでもあります：

* [自己修復型ツール呼び出し](https://unsloth.ai/docs/new/studio/chat#auto-healing-tool-calling)これにより、壊れたまたは不正なツール呼び出しを50%削減できます
* [コード実行](https://unsloth.ai/docs/new/studio/chat#code-execution) サポート。BashとPythonの実行を可能にし、より正確なコード出力を実現します。
* 高度な [ウェブ検索](https://unsloth.ai/docs/new/studio/chat#advanced-web-search) で、ページを訪問して実際に読み込み、詳細情報を収集します。
* [自動推論設定](https://unsloth.ai/docs/new/studio/chat#auto-parameter-tuning) GGUFモデル向け（temp、top-kなど）

<div data-with-frame="true"><figure><img src="/files/77e863c5bd956050b90ee75739b6a07e63ef9f71" alt="" width="375"><figcaption></figcaption></figure></div>

#### 新しいモデル

実行できる新しいモデルもいくつかあります。NVIDIAの [Nemotron 3 Nano Omni](/docs/jp/moderu/nemotron-3-nano-omni.md)、IBM [Granite 4.1](/docs/jp/moderu/ibm-granite-4.1.md) と [Mistral 3.5](/docs/jp/moderu/mistral-3.5.md) Mediumがあります。transformersとGGUFでの実装に関するいくつかの問題解決をMistralに協力しました。

#### Unslothの更新

* 停止したStudioの学習実行はチェックポイントから再開できるようになりました。
* チャットスレッドは自動保存され、より確実に保持されるようになりました。
* マルチプロセス環境でのDPO学習のハングを修正しました。
* MROPEの更新により、VLM GRPOサポートが改善されました。
* Studioの停止ボタンが生成を正しく停止するようになりました。
* ブラウザ更新後にチャットテンプレートが消える問題を修正しました。
  {% endupdate %}

{% update date="2026-04-23" tags="new-releases,v0.1.37-beta" %}

## まったく新しいUIデザイン

みなさん、チャットと学習を重視するために、Unsloth StudioのUIとUX体験全体を刷新しました：

* コミュニティのフィードバックに基づいて折りたたみ可能なサイドバーを追加しました

<div data-with-frame="true"><figure><img src="/files/2c86177fef09b636c736623bc2c2908ac9873309" alt="" width="375"><figcaption></figcaption></figure></div>

* チャットを削除したり、過去の会話を検索したりできるようになりました

<div><figure><img src="/files/50ab00da25c0649a210aee73f84835a318640cbc" alt=""><figcaption></figcaption></figure> <figure><img src="/files/be323a9fe1d0e85c66937be7803fb2aeb69beacb" alt=""><figcaption></figcaption></figure></div>

* Qwen3.6のように対応しているモデル向けの新しいPreserve Thinkingトグル
* よりクリーンで一貫性のあるデザインになり、ナビゲーションも簡単になりました
* プロフィール画像、名前などを変更できるオプションを追加した拡張設定ページ

<div data-with-frame="true"><figure><img src="/files/9e8859d30ef9c6e05999590bc4f98d6048c5b4e1" alt="" width="375"><figcaption></figcaption></figure></div>

* Hugging Faceトークンを2回入力する必要はもうありません
* gpt-ossにlow、medium、highのthinkingトグルが追加されました。
* LinuxのCUDA環境でも、最新のllama.cpp事前ビルドを使用するようになりました
* 多数のバグ、一貫性、安定性の修正
* Kimi-K2.6を実行できるようになりました！
* 実験的なAPIサポートも追加しました。ガイドや告知などは来週公開します。

Qwen3.6は以前からUnsloth Studioでの実行と学習に対応していました。今すぐQwen3.6-27Bを学習・実行できます！
{% endupdate %}

{% update date="2026-04-22" tags="model-release,new-releases" %}

## **Qwen3.6-27B + Kimi K2.6**

[**Qwen3.6-27B**](/docs/jp/moderu/qwen3.6.md) はUnsloth Studioで実行（18GB RAM）およびファインチューニングできるようになりました。Kimi K2.6もUnslothで実行できます（350GB RAM）。

Unsloth Studioに多くの新しい更新が入ったので、更新してください。詳細と解説は数日以内に公開します。
{% endupdate %}

{% update date="2026-04-16" tags="model-release,new-releases" %}

## **Qwen3.6**

[**Qwen3.6**](/docs/jp/moderu/qwen3.6.md) はUnsloth Studioで実行・ファインチューニングできるようになりました。このモデルは23GB RAMで動作し、ほぼすべてのベンチマークで最強の中規模LLMです。
{% endupdate %}

{% update date="2026-04-11" tags="model-release" %}

## **Gemma 4 アップデート + MiniMax-M2.7**

[Gemma 4 GGUF](https://huggingface.co/collections/unsloth/gemma-4) は現在、Google の公式チャットテンプレート修正（ツール呼び出しの修正・改善）と、最新の llama.cpp の修正を反映して更新されています。最新の llama.cpp に更新し、量子化モデルを再ダウンロードすれば、 `未使用トークン` の問題はもう表示されないはずです。\
\
[MiniMax-M2.7](/docs/jp/moderu/tutorials/minimax-m27.md) が公開されました！ 128GB RAM / ユニファイドメモリ環境なら、当社の GGUF を使って 4-bit 量子化でローカル実行できます。 [**MiniMax-M2.7 GGUF**](https://huggingface.co/unsloth/MiniMax-M2.7-GGUF)
{% endupdate %}

{% update date="2026-04-08" tags="new-releases,v0.1.36-beta" %}

## **Gemma 4 の修正**

Gemma 4 を更新しました [多数の修正とともに](/docs/jp/moderu/gemma-4/train.md)。これらのバグは共通のもので、すべての学習パッケージと実装に影響し、 **Unsloth に起因するものではありませんでした**。私たちはバグを特定して修正し、Gemma 4 の学習は Unsloth で正しく動作するようになりました。

必要なのは **8GB VRAM** だけで **Gemma-4-E2B** をローカルで学習できます。Unsloth は Gemma 4 を **約1.5倍高速に、VRAM 使用量を約60%削減して** FA2 構成より実行します。Gemma 4 学習の完全ガイドとノートブックは、 [当社のブログをご覧ください](/docs/jp/moderu/gemma-4/train.md).

#### Gemma 4 学習の修正

1. **勾配蓄積** で損失の暴走が起きなくなりました。以前は損失が **300～400**まで急上昇することがありました。想定される損失は約 **10～15**.
2. です。 **IndexError** に影響していた問題を修正しました **26B** と **31B** の推論を `transformers`.
3. での **E2B/E4B** の意味不明な出力を修正しました。 `use_cache=False` のときに発生していた [ issue #45242](https://github.com/huggingface/transformers/issues/45242).
4. を修正しました **float16 音声の** オーバーフロー `-1e9` 値からの

もし損失が **13～15** を上回る場合、 **100** または **300** - 勾配蓄積が誤って処理されている可能性があります。これは **Unsloth** と **Unsloth Studio**.

#### Gemma 4 量子化モデルの再アップロード

また、Gemma 4 GGUF も更新したため、再ダウンロードが必要です。繰り返しますが、これらの量子化の問題は **Unsloth とは関係なく、または Unsloth によって引き起こされたものではありません**:

1. CUDA: 併合前にバッファの重なりをチェック - 以下の重大な修正 `<unused24>` トークン - [PR #21566](https://github.com/ggml-org/llama.cpp/pull/21566)
2. `kv-cache`: 異種 iSWA のための attention rotation をサポート - [PR #21513](https://github.com/ggml-org/llama.cpp/pull/21513)
3. `語彙`: Gemma 4 向けに BPE デトークナイザへ byte token 処理を追加 - [PR #21488](https://github.com/ggml-org/llama.cpp/pull/21488)
4. `変換`: `「add bos」== True` を Gemma 4 に対して設定 - [PR #21500](https://github.com/ggml-org/llama.cpp/pull/21500)
5. `共通`: Gemma 4 専用パーサを追加 - [PR #21418](https://github.com/ggml-org/llama.cpp/pull/21418)
6. `llama-model`を読み取る `final_logit_softcapping` を Gemma 4 に対して設定 - [PR #21390](https://github.com/ggml-org/llama.cpp/pull/21390)
7. `llama`: Gemma 4 用のカスタム改行分割を追加 - [PR #21406](https://github.com/ggml-org/llama.cpp/pull/21406)

#### Unsloth Studio の更新

* 追加 **投機的デコード** サポート（ngram-mod、デフォルトで有効）
* Llama.cpp は、Gemma 4 の修正をすべて含む最新バージョンに更新されました
* Qwen3.5 と Gemma 4 の学習問題を修正
* Gemma 4 モデルのエクスポートと保存を有効化
* ターミナルと Python ツールのサンドボックスセキュリティを強化
* レシピが Chat で読み込まれたモデルを使えるようにする
* ナビゲーション時（およびタブ切り替え時）の空のチャットスレッドを修正し、新しいチャットフローを安定化
* 非 LLM レシピの実行を許可し、実行時に Data タブを先頭へ移動
* 重複ダウンロードを防ぐために、HF キャッシュ済みリポジトリの大文字小文字を再利用
  {% endupdate %}

{% update date="2026-04-03" tags="new-releases,v0.1.36-beta" %}

## **Google - Gemma 4**

* を今すぐ Unsloth で実行・学習できます。 [Gemma 4](/docs/jp/moderu/gemma-4.md) モデル。
* Intel Mac でも使えるようになりました
* Gemma-4 の 2 つの修正を含む llama.cpp の事前コンパイル済みバイナリ:
  * vocab: Gemma4 トークナイザを修正 ([#21343](https://github.com/ggml-org/llama.cpp/pull/21343))
  * fix: gemma 4 テンプレート ([#21326](https://github.com/ggml-org/llama.cpp/pull/21326))
* 小さいモデルのツール呼び出しがより安定し、途中で切れなくなりました
* Windows、Linux、Mac、WSL デバイス向けの事前コンパイル済みバイナリ - CPU と GPU
* 非 vision モデル向けに投機的デコードを追加（Gemma-4 は残念ながら vision、Qwen3.5 も）
* コンテキスト長が正しく適用されるようになりました。
* Web 検索が要約だけでなく実際に Web コンテンツを取得するようになりました
* HF API 呼び出しを90%削減 - レート制限が緩和
  {% endupdate %}

{% update date="2026-03-31" tags="new-releases,improvements" %}

## **ツール呼び出し精度が50%向上 + さらなるサポート**

* すべてのモデルのツール呼び出しは現在 **+30% から +80% より高精度になりました。**
* Web 検索が要約だけでなく実際に Web コンテンツを取得するようになりました
* 許可されるツール呼び出し回数を10回から25回に増加
* ツール呼び出しの終了処理が大幅に改善され、ループ / 繰り返しが減少します
* さらに **ツール呼び出しの修復** と重複排除ロジックを追加し、ツール呼び出しが XML を漏らすのも防止
* でテスト済み `unsloth/Qwen3.5-4B-GGUF` (`UD-Q4_K_XL`）、Web 検索 + コード実行 + 思考を有効化。

| 指標           | 前     | 後         |
| ------------ | ----- | --------- |
| 応答中の XML 漏れ  | 10/10 | 0/10      |
| 使用された URL 取得 | 0     | 4/10 回の実行 |
| 正しい曲名での実行    | 0/10  | 2/10      |
| 平均ツール呼び出し数   | 5.5   | 3.8       |
| 平均応答時間       | 12.3秒 | 9.8秒      |

#### 新機能

* 追加しました **カスタムフォルダ** 任意のフォルダ内の任意の GGUF を使えるようになります - 当面は Chat の詳細設定と Custom Folders からアクセスできます
* **更新ボタン** が表示されるようになりました
* インストールスクリプトのスタイルをすべて更新しました！
* 暫定 **推論と学習のための自動マルチ GPU サポート** - 1 GPU に収まらない大規模モデルに便利 - Studio auto が GPU リソースを割り当てます
* Intel Mac はそのままで動作するはずです

### ずっと滑らかで高速になった Studio

* **大規模モデルのダウンロードタイムアウトを修正** - もうタイムアウトは見られません。
* **Hugging Face のレート制限を修正 - HF API 呼び出しを90%削減**
* Windows での bun を修正し、インストールを高速化
  {% endupdate %}

{% update date="2026-03-27" tags="new-releases,fixes,improvements" %}

## **重要な新しい更新**

前回のリリースからまだ2日しか経っていませんが、さらに重要な更新があります：

* **推論が20～30%高速化されました。** 以前は、ツール呼び出しと repeat penalty により推論速度が通常より低下することがありました。推論 tokens/s は現在、 `llama-server` / `llama.cpp`.
* **古い、または既存のモデルを自動検出するようになりました** からダウンロードされた **LM Studio、Hugging Face、** および類似のソース。
* **推論の token/s 速度が正しく計算されるようになりました。** 以前は、tokens/s に起動時間が含まれていたため、表示速度が実際より遅く見えていました。現在は「真の」推論速度を反映するはずです。
* **CPU 使用率が急上昇しなくなりました。** 以前は、インラインクエリの識別子がレンダリングのたびに変わり、 `useLiveQuery` が継続的に再購読されていました。
* **Unsloth Studio にシャットダウン用の x ボタンが追加され、正しく終了するようになりました。** 以前は、デスクトップアイコンから開いた後に閉じても正しく終了しませんでした。現在は、ショートカットから起動するとターミナルも開き、そのターミナルを閉じると Unsloth Studio が完全に終了します。前回のセッションからまだ開いたままなら、コンピュータを再起動するか、 `lsof -i :8888` を実行してから `kill -9 <PID>`.
* **さらに良くなったツール呼び出しと Web 検索** で、エラーを減少。
* ドキュメントを更新し、次の内容に関する新しい情報を多数追加しました [モデルの削除、アンインストール](/docs/jp/xin-zhe/studio/install.md#uninstall) など。
* **Windows と Linux 全体で、よりクリーンで賢いインストールおよびセットアップログを実現。** 出力は統一された書式で読みやすくなり、デフォルトでは静かになってより快適に使え、さらに豊富な `--verbose` 診断情報を、完全な技術詳細が必要なときに利用できます。
* 学習履歴を表示できるようになりました！
  {% endupdate %}

{% update date="2026-03-25" tags="new-releases,fixes,improvements" %}

## Unsloth Studio 公開後の初リリース

みなさん、Unsloth Studio を公開して以来の初リリースです。新機能と修正がたくさんあります:

* **Unsloth Studio を今すぐ更新できます！** 同じインストールコマンドで更新してください。
* **Windows** CPU でも GPU でもシームレスに動作するようになりました。再インストールしてください！
* **アプリのショートカット**。インストール後は、Windows、MacOS、Linux で Start / Launch と Desktop のショートカットアイコンから起動できます。
* **事前コンパイル済み `llama.cpp` バイナリ** と `mamba_ssm` - インストールが6倍高速に！ バイナリサイズも300MB未満です。
* **インストールサイズを50%削減** （-7GB 以上の節約）、インストールが2倍高速化し、解決も高速化。pypi サイズも50%小さく。
* **ツール呼び出しが改善されました。** より良い llama.cpp パース、チャットに生のツールマークアップが出ないようにし、推論を高速化し、新しい Tool Outputs パネル、タイマーを追加。
* MacOS と CPU で現在 [データレシピ](/docs/jp/xin-zhe/studio/data-recipe.md) が有効になり、複数ファイルのアップロードに対応しました。
* **Linux 向け AMD サポートは暫定** のみのマシンで有効 - 自動検出します。
* **設定サイドバーを再設計。** 設定は現在次のようにグループ化されています **モデル、サンプリング、ツール、プリファレンス**
* **コンテキスト長** を調整可能になりました。llama.cpp は必要な正確なコンテキストを `--fit on`
* **マルチファイルアップロードでスマートに使うため、これは不要です。** Data レシピは現在、PDF、DOCX、TXT、MD の複数ドラッグ＆ドロップアップロードをサポートし、バックエンド抽出、保存済みアップロード、改善されたプレビューにも対応しています。
* **Colab** での無料 T4 GPU 上の Unsloth Studio の問題は、現在修正されています！ [こちらで試す](https://colab.research.google.com/github/unslothai/unsloth/blob/main/studio/Unsloth_Studio_Colab.ipynb)。事前コンパイル済みバイナリのおかげで、20倍高速にもなっています！
* **チャットの可観測性が向上。** Studio は現在 `llama-server` タイミングと使用状況、コンテキストウィンドウ使用量バー、より豊富なソースホバーカードを表示します。
* **全体的により良い UX** - クリック可能なリンク、より良い LaTeX パース、既定カード向けの tool / code / web ツールチップなど、さらに多く！
* **LiteLLM -** Unsloth Studio と Unsloth は **影響を受けていません** 最近の LiteLLM 侵害によって。Nemo Data Designer は LiteLLM を `1.80`までのみ使用しており、影響を受けた `1.82.7` または `1.82.8`ものではなく、その後完全に削除しました。
* 新しい1行インストールコマンドがあります。次を実行してください：&#x20;

  <pre class="language-bash" data-overflow="wrap" data-expandable="true"><code class="lang-bash">curl -fsSL https://unsloth.ai/install.sh | sh
  </code></pre>

#### **修正：**

* **Windows/セットアップの改善。** Windows の無音終了、Anaconda/conda-forge の起動クラッシュ、壊れた非 NVIDIA Windows インストール、CUDA 初期化不足/stale-venv セットアップチェックの欠落を修正しました。
* **システムプロンプトを修正しました。** 非 GGUF のテキストおよび vision 推論で再び動作します。
* **永続的なシステムプロンプトとプリセット。** カスタムのシステムプロンプトとチャットプリセットは、リロードやページ変更をまたいで保持されるようになりました。
* **GGUF エクスポートを拡張。** LoRA/PEFT だけでなく、完全なファインチューニングも GGUF にエクスポートできるようになりました。ベースモデルの解決がより信頼性を増し、未対応のエクスポートオプションは UI で無効化されています。
* **チャットのスクロール/レイアウト修正。** 生成中のスクロール位置の問題、思考パネルのレイアウトずれ、推論パネルを折りたたんだときのビューポートのジャンプを修正しました。
* **より賢いポート競合検出。** Studio は現在ループバック競合を検出し、可能な場合はブロックしているプロセスを特定でき、より分かりやすいフォールバックポートのメッセージを表示します。
  {% endupdate %}

{% update date="2026-03-17" tags="fixes,improvements" %}

## 新しいツール呼び出し + Windows の安定性

* Claude Artifacts が動作するため、チャット内で HTML をヘビゲームのように実行できます
* 小さいモデル向けに特にツール呼び出しの精度が30%向上 + ツール呼び出し用タイマー
* Tool + Web Search の出力を保存可能 + 自動修復ツールのオン/オフを切り替え
* 多数のバグ修正 - Windows CPU が動作、Mac はよりシームレスに、インストールはより高速かつ小型に
  {% endupdate %}
  {% endupdates %}


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/jp/xin-zhe/changelog.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
