使用 Hugging Face Jobs 部署 LLM

使用 Hugging Face jobs 和 skills,通过一个 SKILL 使用 Codex / Claude Code 微调 LFM。

本指南介绍如何使用 UnslothLiquid LFM2.5 通过 Open Code、Claude Code、Codex 等编码代理进行快速 LLM 微调的 Unsloth Claude Code。与标准方法相比,Unsloth 提供约 2 倍更快的训练速度和约 60% 更少的 VRAM 占用。

你将需要

  • 一个 Hugging Face 账号(HF Jobs 需要)

  • 一个具有写入权限的 Hugging Face 令牌

  • 一个编码代理(Open Code、Claude Code、Codex)

  • 阅读我们的 Claude Code 配置指南。

安装技能

Claude Code

Claude Code 通过其 插件系统.

  1. 添加市场:

/plugin marketplace add huggingface/skills
  1. Discover 标签页中浏览可用技能:

/plugin
  1. 安装模型训练器技能:

/plugin install hugging-face-model-trainer@huggingface-skills

更多详情请参阅 Claude Code 插件文档 以及 Skills 文档.

Codex

Codex 通过 AGENTS.md 文件和 .agents/skills/ 目录发现技能。

使用以下命令安装单个技能: $skill-installer

更多详情请参阅 Codex Skills 文档 以及 AGENTS.md 指南.

快速开始

安装好技能后,让你的编码代理训练一个模型。我们使用的是 Liquid LFM2.5

代理将根据 技能中的示例生成训练脚本,将训练提交到 HF Jobs,并通过 Trackio 提供一个监控链接。

使用 Hugging Face Jobs

训练任务将在 Hugging Face Jobs 上运行——完全托管的云端 GPU。如果你熟悉 Google Colab 点数,Hugging Face Jobs 也提供类似的点数系统。它采用按量付费结构,或者你也可以提前获取点数。该代理:

  1. 生成带有内联依赖项的 UV 脚本

  2. 通过 hf CLI 将其提交到 HF Jobs

  3. 报告任务 ID 和监控 URL

  4. 训练好的模型会推送到你的 Hugging Face Hub 仓库

示例训练脚本

该技能会生成类似这样的脚本:

使用 Hugging Face Jobs 训练的费用如下:

模型大小
推荐 GPU
约略成本/小时

<1B 参数

t4-small

~$0.40

1-3B 参数

t4-medium

~$0.60

3-7B 参数

a10g-small

~$1.00

7-13B 参数

a10g-large

~$3.00

如需查看 Hugging Face space 定价的完整概览,请查看指南 这里.

与编码代理协作的技巧

  • 明确要使用的模型和数据集,并包含 Hub ID(例如, Qwen/Qwen2.5-0.5B, trl-lib/Capybara)。代理会搜索并验证这些组合。

  • 如果你希望使用 Unsloth,请明确提及。否则,代理会根据模型和预算决定框架。

  • 在启动大型任务前先请求成本估算

  • 要求 Trackio 监控以获取实时损失曲线

  • 在提交后,让代理检查日志以查看任务状态

资源

最后更新于

这有帮助吗?