❓微调应该使用哪个模型？

Llama、Qwen、Mistral、Phi 还是？

在准备微调时，你首先要面临的决定之一是选择合适的模型。以下是一份分步指南，帮助你做出选择：

选择与您的使用案例一致的模型

评估您的存储、计算能力和数据集

选择模型和参数

在 Base 模型和 Instruct 模型之间选择

更多细节如下：

在准备微调时，你首先要面临的决定之一是使用 instruct 模型还是 base 模型。

Instruct 模型在预训练时已内置指令，使其无需任何微调即可使用。这些模型（包括 GGUF 等常见格式）针对直接使用进行了优化，能够开箱即用地对提示做出有效响应。Instruct 模型可与 ChatML 或 ShareGPT 等会话聊天模板配合使用。

另一方面，Base 模型是未经过指令微调的原始预训练版本。它们专为通过微调进行自定义而设计，允许你将其调整为特定需求。Base 模型兼容像 Alpaca 或 Vicuna这样的指令式模板，但通常开箱即用时不支持会话聊天模板。

决定通常取决于你的数据的数量、质量和类型：

1000+ 行数据: 如果你有一个超过 1000 行的大型数据集，通常最好对 Base 模型进行微调。
300–1000 行高质量数据: 对于中等规模的高质量数据集，对 Base 或 Instruct 模型进行微调都是可行的选择。
少于 300 行: 对于较小的数据集，通常选择 Instruct 模型更为合适。对 Instruct 模型进行微调可以使其与特定需求对齐，同时保留其内置的指令能力。这可确保它在不需要额外输入的情况下遵循一般指令，除非你打算显著改变其功能。
有关你的数据集应有多大信息，见此处

你可以通过将模型名称与 Hugging Face 上的模型名称匹配来更改为你喜欢的任何模型，例如 'unsloth/llama-3.1-8b-unsloth-bnb-4bit'。

我们建议从 Instruct 模型开始，因为它们允许使用会话聊天模板（ChatML、ShareGPT 等）直接进行微调，并且与 Base 模型 （使用 Alpaca、Vicuna 等）相比需要更少的数据。了解更多关于 instruct 与 base 模型之间差异的信息请见此处.

以以下后缀结尾的模型名称 unsloth-bnb-4bit 表示它们是 Unsloth 动态 4 位 量化。这些模型比标准的 BitsAndBytes 4 位模型消耗稍多的显存，但提供显著更高的准确性。
如果模型名称仅以 bnb-4bit结尾，而没有包含 "unsloth"，则表示它指的是标准的 BitsAndBytes 4 位量化。
没有后缀的模型处于其原始的 16 位或 8 位格式。虽然它们是来自官方模型创建者的原始模型，但我们有时会包含重要修复——例如聊天模板或分词器修复。因此建议在可用时使用我们的版本。

我们建议在可能的情况下对两种模型进行实验。微调每个模型并评估输出，以查看哪个更符合你的目标。

最后更新于2个月前

这有帮助吗？