> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/jp/xin-zhe/studio/chat.md).

# Unsloth Studioでモデルを実行する方法

[Unsloth Studio](/docs/jp/xin-zhe/studio.md) これを使うと、AIモデルをコンピュータ上で100%オフライン実行できます。Hugging Faceやローカルファイルから、GGUFやsafetensorsなどのモデル形式を実行できます。

* **すべてのMacOS、CPU、Windows、Linux、WSL環境で動作します！GPUは不要です**
* [**自己修復型ツール呼び出し**](#auto-healing-tool-calling)**,** 高度な [**Web検索**](#advanced-web-search), [**コード実行**](#code-execution)
* UnslothをOpenAI互換の推論として使用する [**APIエンドポイント**](/docs/jp/ji-ben/api.md) または [プロバイダー](broken://pages/d43d7b4603ab2319ce1b2b81a2f24e5b00764c03)
* 検索 + ダウンロード + 実行 + [比較](#model-arena) GGUF、LoRAアダプター、safetensorsなど、あらゆるモデル。
* [**推論パラメータの自動**](#auto-parameter-tuning) 調整（temp、top-pなど）とチャットテンプレートの編集
* 画像、音声、PDF、コード、DOCXなど、さまざまなファイル形式をアップロードしてチャットできます。

<div data-with-frame="true"><figure><img src="/files/aaa485b9d8df9f23ca7f9a74dd165134622cc5e3" alt="" width="563"><figcaption></figcaption></figure></div>

### Unsloth Studio Chatの使用

{% hint style="success" %}
Unsloth Studio Chatは自動的に **マルチGPU構成** での推論に対応します。
{% endhint %}

{% columns %}
{% column %}

#### コード実行

Unsloth Studioでは、LLMがJavaScriptだけでなくBashとPythonも実行できます。また、Claude Artifactsのようなプログラムをサンドボックス化するため、モデルはコードをテストし、ファイルを生成し、実際の計算で回答を検証できます。

これにより、モデルの回答はより信頼性が高く、正確になります。
{% endcolumn %}

{% column %}

<div data-with-frame="true"><figure><img src="/files/d643c6f319ac0b555c11cc9bb355888c0154d9b7" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

{% columns %}
{% column %}

#### 自動修復ツール呼び出し

Unsloth Studioは [ツール呼び出し](#id-50-tool-calling-accuracy)を可能にするだけでなく、壊れた不正なツール呼び出しを50%自動修正します。

つまり、常に推論出力を得られます **壊れたツール呼び出し** なしで。&#x20;

例: Qwen3.5-4Bは20以上のWebサイトを検索してソースを引用し、思考のトレース内でWeb検索を行いました。
{% endcolumn %}

{% column %}

<div data-with-frame="true"><figure><img src="/files/44d9105dd956eac31f9586bcf01055a289b0ef3e" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

{% columns %}
{% column %}

#### 高度なWeb検索

UnslothのWeb検索は、サイト要約をざっと見るだけではなく、実際にページを直接訪問して関連情報やデータを収集します。これにより、より正確で、より深い情報と文脈を提供できます。
{% endcolumn %}

{% column %}

<div data-with-frame="true"><figure><img src="/files/aaa485b9d8df9f23ca7f9a74dd165134622cc5e3" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

{% columns %}
{% column %}

#### UnslothをAPIエンドポイントとして使用する

今では、次のようなツールを通じてローカルLLMを使用できます [Claude Code](/docs/jp/ji-ben/claude-code.md) と [Codex](/docs/jp/ji-ben/codex.md) をUnslothの [APIエンドポイント](#use-unsloth-as-an-api-endpoint)に接続することで。これにより、self-healing tool-calling、websearchなどの機能を含むUnslothの推論を使って、これらのツール内でQwenやGemmaモデルを直接実行できるようになります。
{% endcolumn %}

{% column %}

<figure><img src="/files/77e863c5bd956050b90ee75739b6a07e63ef9f71" alt=""><figcaption></figcaption></figure>
{% endcolumn %}
{% endcolumns %}

{% columns %}
{% column %}

#### 推論設定の自動化

次のような推論パラメータ **temperature**, **top-p**, **top-k**, [**MTP**](/docs/jp/moderu/qwen3.6.md#mtp-guide) はQwen3.5のような新しいモデル向けに自動で事前設定されるため、設定を気にせず最適な出力を得られます。パラメータを手動で調整したり、システムプロンプトを編集したりすることもできます。

llama.cppのスマート自動コンテキストにより、必要なコンテキストのみを使用し、余分なものを読み込まないため、コンテキスト長の調整はもはや不要です。
{% endcolumn %}

{% column %}

<div data-with-frame="true"><figure><img src="/files/9b0b9892e8b662cbc435f13f00a5ad38f8db8457" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

{% columns %}
{% column %}

#### プロバイダーを接続

[Unslothは](broken://pages/d43d7b4603ab2319ce1b2b81a2f24e5b00764c03) OpenAI、Anthropic、Ollama、llama.cpp、vLLMなどに接続します。

APIキーやモデルサーバーURLを追加してから、ローカルモデルやクラウドモデルと同じチャットUIで外部モデルを使用できます。 [プロンプトキャッシュ](broken://pages/d43d7b4603ab2319ce1b2b81a2f24e5b00764c03#prompt-caching)、ツール呼び出し、思考、そしてOpenAIのようなプロバイダーネイティブ機能を使って実行できます [Web検索](#web-search-and-thinking) と [コード実行](#code-execution).
{% endcolumn %}

{% column %}

<div data-with-frame="true"><figure><img src="/files/9b0b9892e8b662cbc435f13f00a5ad38f8db8457" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

{% columns %}
{% column %}

#### モデルを検索して実行

Hugging Face経由で任意のモデルを検索・ダウンロードするか、ローカルファイルを使用できます。

Studioは幅広い種類のモデルに対応しており、以下が含まれます **GGUF**、視覚言語モデル、テキスト読み上げモデル。次のような最新モデルも実行できます [Qwen3.5](/docs/jp/moderu/qwen3.5.md) やNVIDIA [Nemotron 3](/docs/jp/moderu/nemotron-3.md).

画像、音声、PDF、コード、DOCXなど、さまざまなファイル形式をアップロードしてチャットできます。
{% endcolumn %}

{% column %}

<div data-with-frame="true"><figure><img src="/files/9468944971814e81c22a3a467b5eb2468cd1c8ed" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

{% columns %}
{% column %}

#### チャット作業スペース

プロンプトを入力し、ドキュメント、画像（webp、png）、コードファイル、txt、音声を追加コンテキストとして添付し、モデルの応答をリアルタイムで確認できます。

オン/オフを切り替え: 思考 + Web検索。
{% endcolumn %}

{% column %}

<div data-with-frame="true"><figure><img src="/files/3a0e72692466694a3fa842f51e8edec280a5c5cd" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

### **+50% ツール呼び出し精度**

Unslothは、ツール呼び出しを改善するいくつかの独自機能を提供します。例えば:

* Unslothのすべてのモデルでのツール呼び出しは **30%から80%高精度**.
* Web検索は、要約だけでなく実際のWebコンテンツを取得します。
* 許可されるツール呼び出しの最大回数は **25回超です。**
* ツール呼び出しはより確実に終了し、ループや繰り返し呼び出しが減ります。
* ツール呼び出しの修復と重複排除ロジックの改善により、XMLが出力に漏れるのを防ぎます。

テスト結果を見る `unsloth/Qwen3.5-4B-GGUF (UD-Q4_K_XL)` Web検索、コード実行、思考を有効にした状態で:

| 指標            | 通常のツール呼び出し | Unslothのツール呼び出し |
| ------------- | ---------- | --------------- |
| 応答内のXML漏れ     | 10/10      | 0/10            |
| 使用されたURLフェッチ  | 0          | 10回中4回          |
| 正しい曲名になった実行回数 | 0/10       | 2/10            |
| 平均ツール呼び出し回数   | 5.5        | 3.8             |
| 平均応答時間        | 12.3秒      | 9.8秒            |

### モデルアリーナ

Studio Chatでは、同じプロンプトを使って任意の2つのモデルを並べて比較できます。例: ベースモデルとLoRaアダプターを比較。推論はまず1つ目のモデルを読み込み、その後2つ目を読み込みます（並列推論は現在対応中です）。

<div data-with-frame="true"><figure><img src="/files/6338694a5689a1272c830162a86559778536fc1b" alt="" width="563"><figcaption></figcaption></figure></div>

{% columns %}
{% column %}
学習後は、同じプロンプトでベースモデルとファインチューニング済みモデルを並べて比較し、何が変わったか、結果が改善したかを確認できます。

このワークフローにより、ファインチューニングでモデルの応答がどう変わったか、また用途に対して結果が改善したかを簡単に確認できます。
{% endcolumn %}

{% column %}

<div align="center" data-with-frame="true"><figure><img src="/files/a110f0d8a2c99deb04e2270595d401597bb9407b" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

{% hint style="success" %}
Unsloth Studio Chatは自動的に **マルチGPU構成** での推論に対応します。
{% endhint %}

### 古い / 既存のGGUFモデルの使用

{% columns %}
{% column %}
**4月1日更新:** 既存のフォルダを選択して、Unslothが検出できるようになりました。

**3月27日更新:** Unsloth Studioは現在 **古い / 既存のモデルを自動検出** Hugging FaceやLM Studioなどからダウンロードされたものを
{% endcolumn %}

{% column %}

<div data-with-frame="true"><figure><img src="/files/08e445b8964d5f915626a551f5f8782386c7aa92" alt=""><figcaption></figcaption></figure></div>
{% endcolumn %}
{% endcolumns %}

**手動手順:** Unsloth Studioは、Hugging Face Hubのキャッシュにダウンロードされたモデルを検出します `(C:\Users{your_username}.cache\huggingface\hub)`. LM Studio経由でダウンロードしたGGUFモデルがある場合、それらは `C:\Users\{your_username}.cache\lm-studio\models` ***または*** `C:\Users{your_username}\lm-studio\models` に保存され、デフォルトではllama.cppから見えません。Unsloth Studioで読み込むには、これらの.ggufファイルをHugging Face Hubのキャッシュディレクトリ（またはllama.cppからアクセス可能な別のパス）に移動またはコピーする必要があります。

Studioでモデルやアダプターをファインチューニングした後、GGUFにエクスポートして、Studio Chat内で **llama.cpp** を使ってローカル推論を直接実行できます。Unsloth Studioはllama.cppとHugging Faceによって支えられています。

### コンテキストとしてファイルを追加

Studio Chatは会話内でマルチモーダル入力を直接サポートします。ドキュメント、画像、音声をプロンプトの追加コンテキストとして添付できます。

<div data-with-frame="true"><figure><img src="/files/ae72b1c5627b0aa3d6099a1642a593a4c3a6c6ea" alt="" width="563"><figcaption></figcaption></figure></div>

これにより、PDF、スクリーンショット、参考資料などの実世界の入力をモデルがどう処理するかを簡単にテストできます。ファイルはローカルで処理され、モデルのコンテキストとして含まれます。

### **モデルファイルの削除**

モデル検索のゴミ箱アイコンから、またはデフォルトのHugging Faceキャッシュディレクトリから該当するキャッシュ済みモデルフォルダを削除することで、古いモデルファイルを削除できます。デフォルトでは、Hugging Faceは `~/.cache/huggingface/hub/` をmacOS/Linux/WSLで使用し、 `C:\Users\<username>\.cache\huggingface\hub\` をWindowsで使用します。

* **macOS、Linux、WSL:** `~/.cache/huggingface/hub/`
* **Windows:** `%USERPROFILE%\.cache\huggingface\hub\`

もし `HF_HUB_CACHE` または `HF_HOME` が設定されている場合は、その場所を使用してください。LinuxとWSLでは `XDG_CACHE_HOME` もデフォルトのキャッシュルートを変更できます。

### **UnslothがGPUを検出しない、またはGPUを使用しない**

DockerでモデルがGPUを使っていない場合は、次を試してください:

最新イメージを手動で取得:

```bash
 docker pull unsloth/unsloth:latest
```

* GPUアクセスを有効にしてコンテナを起動:
  * `docker run`: `--gpus all`
  * Docker Compose: `capabilities: [gpu]`
* Linuxでは、NVIDIA Container Toolkitがインストールされていることを確認してください。
* Windowsでは:
  * 確認してください `nvcc --version` が次の場所に表示されるCUDAバージョンと一致することを `nvidia-smi`
  * こちらを参照: <https://docs.docker.com/desktop/features/gpu/>


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/jp/xin-zhe/studio/chat.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
