🦥Unsloth Studio 介绍
使用 Unsloth Studio 在本地运行和训练 AI 模型。
今天,我们发布 Unsloth Studio (Beta):一个开源、无需编程的网页界面,用于在一个统一的 本地 界面中训练、运行和导出开源模型。
在本地运行 GGUF 和 safetensor 模型于 Mac、Windows、Linux。
以少 70% 的 VRAM 将 500+ 个模型训练速度提升 2 倍(且不损失准确率)
运行并训练文本、视觉、TTS 音频、嵌入模型
要了解最新更新,请查看我们的 新更新日志页面! ✨


⭐ 功能


作为 API 端点的 Unsloth
你现在可以通过以下工具使用本地 LLM: Claude Code 和 Codex ,只需将其连接到 Unsloth 的 API 端点。这意味着你可以直接在这些工具中运行 Qwen 和 Gemma 模型,并使用 Unsloth 的推理能力,其中包括自我修复工具调用、网页搜索等功能。

无需编程的训练
上传 PDF、CSV、JSON 文档或 YAML 配置,即可在 NVIDIA 上立即开始训练。Unsloth 的内核可优化 LoRA、FP8、FFT、PT,覆盖 500+ 个文本、视觉、TTS/音频和嵌入模型。
微调最新的 LLM,例如 Qwen3.5 和 NVIDIA Nemotron 3. 多 GPU 会自动工作,新版本也即将到来。



导出 / 保存模型
导出任何模型,包括你微调后的模型,导出为 safetensors 或 GGUF,以便与 llama.cpp、vLLM、Ollama、LM Studio 等一起使用。
保存你的训练历史记录,因此你可以回顾运行、再次导出并进行实验。

模型竞技场
与 2 个不同的 模型聊天并比较 ,例如基础模型和微调模型,看看它们的输出有何不同。
只需先加载你的第一个 GGUF/模型,然后加载第二个,就搞定了!推理会先为一个模型加载,然后再为第二个模型加载。

隐私优先 + 安全
Unsloth Studio 可 100% 离线并在本地计算机上使用。其基于令牌的身份验证,包括加密密码和 JWT 访问/刷新流程,可保护你的数据安全。
你可以使用之前从 HF 等处下载的现有/旧模型或 GGUF。请阅读 此处说明.

请注意,这里是 BETA 版本的 Unsloth Studio。未来几天和几周内将会有许多改进、修复和新功能。
⚡ 快速入门
Unsloth Studio 可在 Windows、Linux、WSL 和 MacOS 上运行(目前仅限聊天)。
训练: 可运行于 NVIDIA:RTX 30、40、50、Blackwell、DGX Spark/Station 等 + Intel GPU
Mac: 类似 CPU——聊天和 数据配方 目前仅可用于。 MLX 训练即将非常快推出。
AMD: 聊天可用。使用 Unsloth Core进行训练。Studio 支持即将推出。
即将推出: 对以下平台的训练支持 Apple MLX 和 AMD。
多 GPU: 已经可用,重大升级正在路上。
使用下面相同的安装命令进行更新:
MacOS、Linux、WSL:
Windows PowerShell:
启动 Unsloth
Docker:
使用我们的官方 Docker 镜像: unsloth/unsloth ,目前可在 Windows、WSL 和 Linux 上运行。MacOS 支持即将推出。
由于预编译的 llama.cpp 二进制文件,首次安装现在应快 6 倍,且体积减少 50%。
有关安装和卸载的更多详情,请访问 Unsloth Studio 安装 部分。
Installation Google Colab 笔记本
我们创建了一个 免费的 Google Colab 笔记本 ,这样你就可以在 Colab 的 T4 GPU 上探索 Unsloth 的所有功能。你可以训练并运行参数量最高达 22B 的大多数模型,并切换到更大的 GPU 以运行更大的模型。只需点击“Run all”,安装完成后界面就会弹出。
安装完成后,滚动到 启动 Unsloth Studio 并点击 打开 Unsloth Studio ,位于左侧显示的白色框中:
继续向下滚动即可看到实际界面。

有时 Studio 链接可能会返回错误。这是因为你可能禁用了 cookies,或者正在使用广告拦截器或 Mozilla。你仍然可以通过向下滚动到按钮下方来访问界面。
工作流程
以下是 Unsloth Studio 的常见工作流程,帮助你快速上手:
从 安装说明.
启动 Studio
从本地文件或受支持的集成中加载模型。
从 PDF、CSV 或 JSONL 文件导入训练数据,或从零开始构建数据集。 数据配方.
在
使用推荐预设开始训练,或自行自定义配置。
保存或导出 到你已经使用的本地技术栈中。
你可以阅读我们对 Unsloth Studio 各部分的单独深度解析:
视频教程
视频中展示的 Unsloth Studio 版本较旧,不能反映当前版本。
以下是 NVIDIA 制作的视频教程,帮助你开始使用 Studio:
如何安装 Unsloth Studio 视频教程
常见问题
Unsloth 会收集或存储数据吗? Unsloth 不会收集使用遥测数据。Unsloth 只会收集兼容性所需的最少硬件信息,例如 GPU 类型和设备(如 Mac)。Unsloth Studio 100% 离线并在本地运行。
我如何使用之前从 Hugging Face 下载的旧/现有模型? 是的,你可以使用之前从 Hugging Face 等处下载的现有/旧模型或 GGUF。现在它们应该会被 Unsloth 自动检测,否则请阅读我们的 此处说明.
为什么 Unsloth 中的推理有时更慢? Unsloth 与其他本地推理应用一样,基于 llama.cpp,因此速度应该大致相同。有时 Unsloth 变慢可能是因为你开启了网页搜索、代码执行或自我修复工具调用。所有这些功能都可能使推理变慢。如果在关闭所有功能后速度差异仍然较慢,请提交 GitHub issue!
Unsloth Studio 支持与 OpenAI 兼容的 API 吗? 是的,请查看我们的 API 端点指南.
Unsloth 现在是否采用 AGPL-3.0 许可? Unsloth 使用 Apache 2.0 和 AGPL-3.0 的双重许可模式。核心 Unsloth 包仍在 Apache 2.0许可下,而某些可选组件,例如 Unsloth Studio UI 则采用 AGPL-3.0.
许可。这种结构有助于支持 Unsloth 的持续开发,同时保持项目开源,并使更广泛的生态系统持续成长。
Studio 只支持 LLM 吗?
不。Studio 支持一系列受支持的 transformers 兼容模型家族,包括文本、多模态模型、 文本转语音、音频、 嵌入以及 BERT 风格模型。
我可以使用自己的训练配置吗? 可以。导入 YAML 配置后,Studio 会预填相关设置。
我该如何调整上下文长度? 使用 llama.cpp 的智能自动上下文后,已经不再需要调整上下文长度,因为它只会使用你需要的上下文,而不会额外加载任何内容。不过,我们很快仍会添加此功能,以防你想使用它。
使用此界面需要训练模型吗? 不需要,你可以直接下载任何 GGUF 或模型,而无需对任何模型进行微调。
Unsloth 的未来
我们正努力让开源 AI 尽可能易于获取。接下来针对 Unsloth 和 Unsloth Studio,我们将发布对以下内容的官方支持:多 GPU、Apple Silicon/MLX 和 AMD。提醒一下,这仍是 Unsloth Studio 的 BETA 版本,因此请期待未来几周内会有大量公告和改进。我们也正与 NVIDIA 密切合作推进多 GPU 支持,以提供尽可能最佳且最简单的体验。
致谢
非常感谢 NVIDIA 和 Hugging Face 成为我们发布的一部分。也感谢所有 Unsloth Studio 的早期 beta 测试者,我们非常感激你们投入的时间和反馈。我们还要感谢 llama.cpp、PyTorch 以及 open model labs 提供了使 Unsloth Studio 成为可能的基础设施。
最后更新于
这有帮助吗?

