rssRSS 源

sparklesUnsloth 更新

Unsloth 最新发布、改进和修复的更新日志。

要使用最新更改,请通过以下方式更新 Unsloth: unsloth studio update.

Unsloth Studio 发布后的首个版本

大家好,这是我们自推出 Unsloth Studio 以来的首个版本。有很多新功能和修复:

  • 你现在可以更新 Unsloth Studio 了! 请通过以下方式更新: unsloth studio update

  • Windows CPU 或 GPU 现在都能无缝运行。请重新安装!

  • 应用快捷方式。安装后,您现在可以通过开始/启动菜单和桌面上的快捷方式图标在 Windows、MacOS 和 Linux 上启动。

  • 预编译的 llama.cpp 二进制文件 以及 mamba_ssm 用于微调——安装速度快 6 倍!二进制文件大小也小于 300MB。

  • 安装大小减少 50% (节省 7GB 或更多),安装速度快 2 倍,解析更快。pypi 包大小减少 50%。

  • 工具调用已改进。 更好的 llama.cpp 解析,聊天中不再显示原始工具标记,更快的推理,一个新的工具输出面板,以及计时器。

  • Colab 在 Unsloth Studio 中使用免费的 T4 GPU 现在已修复! 在这里试试arrow-up-right。由于使用了预编译二进制文件,它也快了 20 倍!

  • MacOS 和 CPU 现在具有 数据配方 功能,并支持多文件上传。

  • 你现在可以正确使用来自 Hugging Face 或 LM Studio 的旧 GGUF 了

  • Linux 仅限机器的 AMD 支持初步可用 ——可自动检测。

  • 设置侧边栏重新设计。 设置现在按以下类别分组: 模型、采样、工具和偏好设置

  • 上下文长度 现在可调整。请注意,这其实并非必需,因为 llama.cpp 会通过以下方式智能使用你需要的准确上下文: 在上面使用 --fit

  • 持久化系统提示词和预设。 自定义系统提示词和聊天预设现在会在重新加载和页面切换后继续保留。

  • 多文件上传。 数据配方现在支持对 PDF、DOCX、TXT 和 MD 进行多文件拖放上传,支持后端提取、保存上传内容,并改进了预览。

  • 更好的聊天可观察性。 Studio 现在显示 llama-server 的计时和使用情况、上下文窗口使用条,以及更丰富的来源悬停卡片。

  • 整体更好的用户体验 ——可点击链接、更好的 LaTeX 解析、默认卡片的工具/代码/网页工具提示等等!

  • LiteLLM - Unsloth Studio 和 Unsloth 受到近期 LiteLLM 泄露事件影响。Nemo Data Designer 仅在以下版本之前使用 LiteLLM 1.80,而不是受影响的 1.82.71.82.8,并且此后已将其完全移除。

  • 我们现在有了一个新的单行安装命令,只需运行:

修复:

  • Windows/安装改进。 修复了 Windows 静默退出、Anaconda/conda-forge 启动崩溃、非 NVIDIA Windows 安装损坏,以及缺少早期 CUDA/旧 venv 设置检查的问题。

  • 系统提示词已修复。 它们现在可以再次用于非 GGUF 文本和视觉推理。

  • GGUF 导出扩展。 现在完整微调,而不仅仅是 LoRA/PEFT,也可以导出为 GGUF。基础模型解析更可靠,UI 中不支持的导出选项已被禁用。

  • 聊天滚动/布局修复。 修复了生成过程中滚动位置的问题、思考面板布局偏移,以及折叠推理面板时的视口跳动。

  • 更智能的端口冲突检测。 Studio 现在可以检测回环冲突,在可能时识别阻塞进程,并提供更清晰的备用端口消息。

新的工具调用 + Windows 稳定性

  • Claude Artifacts 可用,因此 HTML 可以像聊天中的贪吃蛇游戏一样执行

  • 工具调用准确率提高 30%,尤其是对小模型;以及工具调用计时器

  • 工具 + 网页搜索输出可保存 + 可切换自动修复工具开/关

  • 许多 bug 修复——Windows CPU 可用,Mac 更无缝,安装更快且更小

最后更新于

这有帮助吗?