🐱Ministral 3 - 如何运行指南

Mistral Ministral 3 模型指南,可在你的设备上本地运行或微调

Mistral 发布了 Ministral 3,这是他们全新的多模态模型,分为 Base、Instruct 和 Reasoning 变体,可在 3B, 8B,以及 14B 种规模下使用。它们在各自规模上提供同类最佳性能,并针对指令和聊天使用场景进行了微调。该多模态模型支持 256K 上下文 窗口、多语言、原生函数调用和 JSON 输出。

完整的未量化 14B Ministral-3-Instruct-2512 模型可放入 24GB RAM/VRAM 中。现在你可以使用 Unsloth 在所有 Ministral 3 模型上运行、微调和进行 RL:

运行 Ministral 3 教程微调 Ministral 3

我们还上传了 Mistral Large 3 这里的 GGUF。对于所有 Ministral 3 上传版本(BnB、FP8), 请看这里.

Ministral-3-Instruct GGUF:
Ministral-3-Reasoning GGUF:

3B8B14B

3B8B14B

⚙️ 使用指南

为了在 Instruct上获得最佳性能,Mistral 建议使用较低的温度,例如 temperature = 0.150.1

对于 Reasoning,Mistral 建议 temperature = 0.7top_p = 0.95.

Instruct:
Reasoning:

Temperature = 0.150.1

Temperature = 0.7

Top_P = 默认值

Top_P = 0.95

足够的输出长度:对于大多数查询,thinking 变体使用 32,768 tokens,用于推理变体的大多数查询,以及 16,384 用于指令变体。必要时,你可以为推理模型增加最大输出大小。

Ministral 3 可达到的最大上下文长度是 262,144

聊天模板格式可通过使用下面内容找到:

tokenizer.apply_chat_template([
    {"role" : "user", "content" : "What is 1+1?"},
    {"role" : "assistant", "content" : "2"},
    {"role" : "user", "content" : "What is 2+2?"}
    ], add_generation_prompt = True
)

Ministral Reasoning 聊天模板:

Ministral Instruct 聊天模板:

📖 运行 Ministral 3 教程

以下是针对该模型 ReasoningInstruct 模型变体。

Instruct:Ministral-3-Instruct-2512

为了在 Instruct上获得最佳性能,Mistral 建议使用较低的温度,例如 temperature = 0.150.1

Llama.cpp:运行 Ministral-3-14B-Instruct 教程

1

获取最新的 llama.cppGitHub 这里。你也可以按照下面的构建说明操作。将 -DGGML_CUDA=ON 改为 -DGGML_CUDA=OFF 如果你没有 GPU,或者只想进行 CPU 推理。 对于 Apple Mac / Metal 设备,设置 -DGGML_CUDA=OFF 然后照常继续——Metal 支持默认开启。

2

你可以通过以下方式直接从 Hugging Face 拉取:

3

通过以下方式下载模型(在安装 pip install huggingface_hub hf_transfer 之后)。你可以选择 UD_Q4_K_XL 或其他量化版本。

Reasoning:Ministral-3-Reasoning-2512

为了在 Reasoning,Mistral 建议使用 temperature = 0.7top_p = 0.95.

Llama.cpp:运行 Ministral-3-14B-Reasoning 教程

1

获取最新的 llama.cppGitHub。你也可以使用下面的构建说明。更改 -DGGML_CUDA=ON 改为 -DGGML_CUDA=OFF 如果你没有 GPU,或者只想进行 CPU 推理。

2

你可以通过以下方式直接从 Hugging Face 拉取:

3

通过以下方式下载模型(在安装 pip install huggingface_hub hf_transfer 之后)。你可以选择 UD_Q4_K_XL 或其他量化版本。

🛠️ 微调 Ministral 3

Unsloth 现在支持所有 Ministral 3 模型的微调,包括视觉支持。要进行训练,你必须使用最新的 🤗Hugging Face transformers v5 以及 unsloth ,其中包括我们最近的 超长上下文 支持。大型 14B Ministral 3 模型应该可以放入免费的 Colab GPU。

我们制作了免费的 Unsloth 笔记本来微调 Ministral 3。请更改名称以使用所需的模型。

Ministral Vision 微调笔记本

Ministral 数独 GRPO RL 笔记本

强化学习(GRPO)

Unsloth 现在也支持 Mistral 模型的 RL 和 GRPO。和往常一样,它们受益于 Unsloth 的所有增强功能,而且明天我们将很快发布一个专门用于自主解决数独谜题的笔记本。

要使用最新版的 Unsloth 和 transformers v5,请通过以下方式更新:

目标是自动生成完成数独的策略!

对于 Ministral 的奖励图,我们得到如下结果。可以看到效果很好!

最后更新于

这有帮助吗?