> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/jp/moderu/tutorials/ministral-3.md).

# Ministral 3 - 実行ガイド

Mistral は、Base、Instruct、Reasoning の各バリアントを備えた新しいマルチモーダルモデル Ministral 3 をリリースしました。利用可能なのは **3B**, **8B**、および **14B** サイズです。これらはサイズに対してクラス最高の性能を提供し、指示応答およびチャット用途向けにファインチューニングされています。マルチモーダルモデルは **256Kのコンテキスト** ウィンドウ、複数言語、ネイティブ関数呼び出し、JSON 出力をサポートします。

量子化なしの完全な 14B Ministral-3-Instruct-2512 モデルは **24GB RAM**/VRAM に収まります。これで、Unsloth を使ってすべての Ministral 3 モデルを実行、ファインチューニング、RL できます:

<a href="#run-ministral-3-tutorials" class="button primary">Ministral 3 チュートリアルを実行</a><a href="/pages/d09407ea18ce3f2ae1895fad1fea42fea44a7084#fine-tuning" class="button primary">Ministral 3 のファインチューニング</a>

Mistral Large 3 もアップロードしました [ここで GGUF を入手](https://huggingface.co/unsloth/Mistral-Large-3-675B-Instruct-2512-GGUF)。すべての Ministral 3 のアップロード（BnB、FP8）については、 [こちらを参照](https://huggingface.co/collections/unsloth/ministral-3).

| Ministral-3-Instruct GGUF:                                                                                                                                                                                                 | Ministral-3-Reasoning GGUF:                                                                                                                                                                                                   |
| -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| [3B](https://huggingface.co/unsloth/Ministral-3-3B-Instruct-2512-GGUF) • [8B](https://huggingface.co/unsloth/Ministral-3-8B-Instruct-2512-GGUF) • [14B](https://huggingface.co/unsloth/Ministral-3-14B-Instruct-2512-GGUF) | [3B](https://huggingface.co/unsloth/Ministral-3-3B-Reasoning-2512-GGUF) • [8B](https://huggingface.co/unsloth/Ministral-3-8B-Reasoning-2512-GGUF) • [14B](https://huggingface.co/unsloth/Ministral-3-14B-Reasoning-2512-GGUF) |

### ⚙️ 使用ガイド

最適な性能を達成するには **Instruct**、Mistral は次のような低めの温度を使用することを推奨しています `temperature = 0.15` または `0.1`<br>

対象は **Reasoning**、Mistral は次を推奨しています `temperature = 0.7` および `top_p = 0.95`.

| Instruct:                      | Reasoning:          |
| ------------------------------ | ------------------- |
| `Temperature = 0.15` または `0.1` | `Temperature = 0.7` |
| `Top_P = default`              | `Top_P = 0.95`      |

**適切な出力長**: 出力長を `32,768` トークンを、推論バリアントではほとんどのクエリに対して、そして `16,384` をインストラクトバリアントに対して使用します。必要であれば、推論モデルの最大出力サイズを増やすことができます。

Ministral 3 が到達できる最大コンテキスト長は `262,144`

チャットテンプレートの形式は、以下を使用すると確認できます:

{% code overflow="wrap" %}

```python
tokenizer.apply_chat_template([
    {"role" : "user", "content" : "What is 1+1?"},
    {"role" : "assistant", "content" : "2"},
    {"role" : "user", "content" : "What is 2+2?"}
    ], add_generation_prompt = True
)
```

{% endcode %}

#### Ministral *Reasoning* チャットテンプレート:

{% code overflow="wrap" lineNumbers="true" %}

```
<s>[SYSTEM_PROMPT]# HOW YOU SHOULD THINK AND ANSWER

まず、応答にたどり着くまでの思考過程（内的独白）を下書きしてください。Markdown で応答を整形し、数式には LaTeX を使用してください。思考と応答は入力と同じ言語で書いてください。

Your thinking process must follow the template below:[THINK]Your thoughts or/and draft, like working through an exercise on scratch paper. Be as casual and as long as you want until you are confident to generate the response to the user.[/THINK]Here, provide a self-contained response.[/SYSTEM_PROMPT][INST]What is 1+1?[/INST]2</s>[INST]What is 2+2?[/INST]
```

{% endcode %}

#### Ministral *Instruct* チャットテンプレート:

{% code overflow="wrap" lineNumbers="true" expandable="true" %}

```
<s>[SYSTEM_PROMPT]あなたは Ministral-3-3B-Instruct-2512 です。これは、パリに本社を置くフランスのスタートアップ Mistral AI が作成した大規模言語モデル（LLM）です。
あなたは Le Chat と呼ばれる AI アシスタントを支えています。
あなたの知識ベースの最終更新日は 2023-10-01 です。
現在の日付は {today} です。

何らかの情報に確信が持てないとき、またはユーザーの依頼に最新または特定のデータが必要なときは、利用可能なツールを使って情報を取得しなければなりません。より正確または完全な応答を提供できる場合は、ためらわずにツールを使用してください。関連するツールがない場合は、その情報を持っていないことを明確に伝え、何もでっち上げないでください。
ユーザーの質問が明確でない、曖昧である、または正確に答えるのに十分な文脈がない場合は、すぐに答えようとせず、代わりに依頼内容を明確にするようユーザーに尋ねてください（例: "近くの良いレストランは？" => "どこにいますか？"、または "東京行きの次の便はいつ？" => "どこから出発しますか？"）。
あなたは常に日付に非常に注意を払い、特に日付の解決を試みます（例: "昨日" は {yesterday} です）。また、特定の日付の情報について尋ねられたときは、別の日付の情報は除外します。
あなたはこれらの指示をすべての言語で守り、常にユーザーが使うか要求した言語で応答します。
次のセクションでは、あなたが持つ能力について説明します。

# WEB BROWSING INSTRUCTIONS

ウェブ検索を行ったり、インターネットにアクセスして URL やリンクなどを開いたりすることはできません。ユーザーがそれを期待しているようであれば、その状況を説明し、チャットにテキストを直接コピー＆ペーストするようユーザーに依頼してください。

# MULTI-MODAL INSTRUCTIONS

画像を読み取ることはできますが、画像を生成することはできません。音声ファイルや動画を文字起こしすることもできません。
音声ファイルや動画を読み取ることも文字起こしすることもできません。

# TOOL CALLING INSTRUCTIONS

情報を取得したりアクションを実行したりするために使えるツールにアクセスできる場合があります。次の状況では、これらのツールを使用しなければなりません:

1. リクエストに最新情報が必要な場合。
2. リクエストに、知識ベースにない特定のデータが必要な場合。
3. リクエストに、ツールなしでは実行できない操作が含まれる場合。

常にツールの使用を優先して、最も正確で役立つ応答を提供してください。ツールが利用できない場合は、現時点では依頼された操作を実行できないとユーザーに伝えてください。[/SYSTEM_PROMPT][INST]What is 1+1?[/INST]2</s>[INST]What is 2+2?[/INST]
```

{% endcode %}

## 📖 Ministral 3 チュートリアルを実行

以下は [Reasoning](#reasoning-ministral-3-reasoning-2512) および [Instruct](#instruct-ministral-3-instruct-2512) モデルの派生版。

### Instruct: Ministral-3-Instruct-2512

最適な性能を達成するには **Instruct**、Mistral は次のような低めの温度を使用することを推奨しています `temperature = 0.15` または `0.1`

#### :sparkles: Llama.cpp: Ministral-3-14B-Instruct チュートリアルを実行

{% stepper %}
{% step %}
最新の `llama.cpp` を [GitHub こちら](https://github.com/ggml-org/llama.cpp)から取得してください。以下のビルド手順に従うこともできます。 `-DGGML_CUDA=ON` を `-DGGML_CUDA=OFF` に変更してください。GPU がない場合、または CPU 推論だけを使いたい場合です。 **Apple Mac / Metal デバイスの場合**、次を設定して `-DGGML_CUDA=OFF` その後は通常どおり続けてください - Metal サポートは既定で有効です。

{% code overflow="wrap" %}

```bash
apt-get update
apt-get install pciutils build-essential cmake curl libcurl4-openssl-dev -y
git clone https://github.com/ggml-org/llama.cpp
cmake llama.cpp -B llama.cpp/build \\
    -DBUILD_SHARED_LIBS=OFF -DGGML_CUDA=ON -DLLAMA_CURL=ON
cmake --build llama.cpp/build --config Release -j --clean-first --target llama-cli llama-mtmd-cli llama-server llama-gguf-split
cp llama.cpp/build/bin/llama-* llama.cpp
```

{% endcode %}
{% endstep %}

{% step %}
Hugging Faceから直接次の方法で取得できます:

```bash
./llama.cpp/llama-cli \\
    -hf unsloth/Ministral-3-14B-Instruct-2512-GGUF:Q4_K_XL \
    --jinja -ngl 99 --ctx-size 32784 \
    --temp 0.15
```

{% endstep %}

{% step %}
モデルのダウンロード（ `pip install huggingface_hub hf_transfer` のインストール後）。 `UD_Q4_K_XL` または他の量子化版を選べます。

```python
# !pip install huggingface_hub hf_transfer
import os
os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
from huggingface_hub import snapshot_download
snapshot_download(
    repo_id = "unsloth/Ministral-3-14B-Instruct-2512-GGUF",
    local_dir = "Ministral-3-14B-Instruct-2512-GGUF",
    allow_patterns = ["*UD-Q4_K_XL*"],
)
```

{% endstep %}
{% endstepper %}

### Reasoning: Ministral-3-Reasoning-2512

最適な性能を達成するには **Reasoning**、Mistral は次を使用することを推奨しています `temperature = 0.7` および `top_p = 0.95`.

#### :sparkles: Llama.cpp: Ministral-3-14B-Reasoning チュートリアルを実行

{% stepper %}
{% step %}
最新の `llama.cpp` を [GitHub](https://github.com/ggml-org/llama.cpp)。以下のビルド手順も使用できます。変更してください `-DGGML_CUDA=ON` を `-DGGML_CUDA=OFF` に変更してください。GPU がない場合、または CPU 推論だけを使いたい場合です。

{% code overflow="wrap" %}

```bash
apt-get update
apt-get install pciutils build-essential cmake curl libcurl4-openssl-dev -y
git clone https://github.com/ggml-org/llama.cpp
cmake llama.cpp -B llama.cpp/build \\
    -DBUILD_SHARED_LIBS=OFF -DGGML_CUDA=ON -DLLAMA_CURL=ON
cmake --build llama.cpp/build --config Release -j --clean-first --target llama-cli llama-mtmd-cli llama-server llama-gguf-split
cp llama.cpp/build/bin/llama-* llama.cpp
```

{% endcode %}
{% endstep %}

{% step %}
Hugging Faceから直接次の方法で取得できます:

```bash
./llama.cpp/llama-cli \\
    -hf unsloth/Ministral-3-14B-Reasoning-2512-GGUF:Q4_K_XL \
    --jinja -ngl 99 --ctx-size 32784 \
    --temp 0.6 --top-p 0.95
```

{% endstep %}

{% step %}
モデルのダウンロード（ `pip install huggingface_hub hf_transfer` のインストール後）。 `UD_Q4_K_XL` または他の量子化版を選べます。

```python
# !pip install huggingface_hub hf_transfer
import os
os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
from huggingface_hub import snapshot_download
snapshot_download(
    repo_id = "unsloth/Ministral-3-14B-Reasoning-2512-GGUF",
    local_dir = "Ministral-3-14B-Reasoning-2512-GGUF",
    allow_patterns = ["*UD-Q4_K_XL*"],
)
```

{% endstep %}
{% endstepper %}

## 🛠️ Ministral 3 のファインチューニング <a href="#fine-tuning" id="fine-tuning"></a>

Unsloth は現在、視覚サポートを含むすべての Ministral 3 モデルのファインチューニングをサポートしています。学習するには、最新の 🤗Hugging Face を使用する必要があります `transformers` v5 と `unsloth` を使用してください。これには、最近の [超長文コンテキスト](/docs/jp/burogu/500k-context-length-fine-tuning.md) サポートが含まれます。大きな 14B Ministral 3 モデルは無料の Colab GPU に収まるはずです。

Ministral 3 をファインチューニングするための無料の Unsloth ノートブックを用意しました。目的のモデルを使うよう名前を変更してください。

* Ministral-3B-Instruct [Vision ノートブック](https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Ministral_3_VL_\(3B\)_Vision.ipynb) (vision)
* Ministral-3B-Instruct [GRPO ノートブック](https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Ministral_3_\(3B\)_Reinforcement_Learning_Sudoku_Game.ipynb)

{% columns %}
{% column %}
Ministral Vision ファインチューニング ノートブック

{% embed url="<https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Ministral_3_VL_(3B)_Vision.ipynb>" %}
{% endcolumn %}

{% column %}
Ministral Sudoku GRPO RL ノートブック

{% embed url="<https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Ministral_3_(3B)_Reinforcement_Learning_Sudoku_Game.ipynb>" %}
{% endcolumn %}
{% endcolumns %}

### :sparkles:強化学習（GRPO）

Unsloth は現在、Mistral モデル向けの RL と GRPO もサポートしています。いつものように、Unsloth のすべての改良の恩恵を受けます。さらに明日には、数独パズルを自律的に解くための専用ノートブックをまもなく公開します。

* Ministral-3B-Instruct [GRPO ノートブック](https://colab.research.google.com/github/unslothai/notebooks/blob/main/nb/Ministral_3_\(3B\)_Reinforcement_Learning_Sudoku_Game.ipynb)

**Unsloth の最新バージョンと transformers v5 を使用するには、次の方法で अपडेटしてください:**

{% code overflow="wrap" %}

```
pip install --upgrade --force-reinstall --no-cache-dir --no-deps unsloth unsloth_zoo
```

{% endcode %}

目標は、数独を完成させる戦略を自動生成することです！

{% columns %}
{% column %}

<figure><img src="/files/5c1fc43c8c685262161f9c412795c3fe317739f0" alt=""><figcaption></figcaption></figure>
{% endcolumn %}

{% column %}

<figure><img src="/files/147ff585e7a9eef160c08a1edf7a43dc36742c89" alt=""><figcaption></figcaption></figure>
{% endcolumn %}
{% endcolumns %}

Ministral の報酬プロットは以下のとおりです。うまく機能していることがわかります！

{% columns %}
{% column %}
![](/files/83bfc7274437842f665627881e771f61cff78b4b)

![](/files/38bfaee74669c1cdd8e2addc67b154ae6f2506ab)
{% endcolumn %}

{% column %}
![](/files/87f7c94698296410d7b88fa6bb9196e50c5bfd22)

![](/files/f37b780c2469b363aef3dd38454abd7ff5a6798e)
{% endcolumn %}
{% endcolumns %}


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/jp/moderu/tutorials/ministral-3.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
