Bereitstellung von LLMs mit Hugging Face Jobs

Verwendung von Hugging Face Jobs und Skills, um LFM mit Codex / Claude Code mit einem SKILL feinabzustimmen.

Diese Anleitung behandelt, wie man Unsloth und Liquid LFM2.5 für schnelles Feintuning von LLMs über Coding-Agenten wie Claude Code. Unsloth bietet etwa 2x schnellere Trainingszeiten und etwa 60 % weniger VRAM-Nutzung im Vergleich zu Standardmethoden.

Sie benötigen

  • Ein Hugging Face Konto (erforderlich für HF Jobs)

  • Ein Hugging Face-Token mit Schreibberechtigungen

  • Einen Coding-Agenten (Open Code, Claude Code, Codex)

  • Lesen Sie unser Claude Code Handbuch zur Einrichtung.

Installation der Skill

Claude Code

Claude Code entdeckt Skills über sein Plugin-System.

  1. Fügen Sie den Marktplatz hinzu:

/plugin marketplace add huggingface/skills
  1. Durchsuchen Sie verfügbare Skills im Entdecken Tab:

/plugin
  1. Installieren Sie die Model Trainer-Skill:

/plugin install hugging-face-model-trainer@huggingface-skills

Für weitere Details siehe das Claude Code Plugins-Dokumentation und die Skills-Dokumentation.

Codex

Codex entdeckt Skills durch AGENTS.md Dateien und .agents/skills/ Verzeichnisse.

Installieren Sie einzelne Skills mit $skill-installer

Für weitere Details siehe das Codex Skills-Dokumentation und die AGENTS.md Anleitung.

Schnellstart

Sobald die Skill installiert ist, bitten Sie Ihren Coding-Agenten, ein Modell zu trainieren. Wir verwenden Liquid LFM2.5

Der Agent wird ein Trainingsskript basierend auf einem Beispiel in der Skillgenerieren, das Training an HF Jobs übermitteln und einen Überwachungslink über Trackio bereitstellen.

Verwendung von Hugging Face Jobs

Trainings-Jobs laufen auf Hugging Face Jobs — vollständig verwalteten Cloud-GPUs. Wenn Sie mit Google Colab-Guthaben vertraut sind, bietet Hugging Face Jobs ein ähnliches Guthabensystem. Es handelt sich um ein Pay-As-You-Go-Modell, oder Sie können Guthaben im Voraus erhalten. Der Agent:

  1. Erzeugt ein UV-Skript mit eingebetteten Abhängigkeiten

  2. Übermittelt es an HF Jobs über das hf CLI

  3. Meldet die Job-ID und die Überwachungs-URL

  4. Das trainierte Modell wird in Ihr Hugging Face Hub-Repository hochgeladen

Beispiel-Trainingsskript

Die Skill erzeugt Skripte wie dieses:

Die Kosten für das Training mit Hugging Face Jobs sind unten aufgeführt:

Modellgröße
Empfohlene GPU
Ungefähre Kosten/Stunde

<1B Parameter

t4-small

~$0.40

1-3B Parameter

t4-medium

~$0.60

3-7B Parameter

a10g-small

~$1.00

7-13B Parameter

a10g-large

~$3.00

Für einen vollständigen Überblick über die Preisgestaltung von Hugging Face Spaces siehe die Anleitung hier.

Tipps für die Arbeit mit Coding-Agenten

  • Seien Sie spezifisch bezüglich des zu verwendenden Modells und Datensatzes und fügen Sie Hub-IDs hinzu (z. B. Qwen/Qwen2.5-0.5B, trl-lib/Capybara). Agenten werden diese Kombinationen suchen und validieren.

  • Nennen Sie Unsloth ausdrücklich, wenn Sie dessen Verwendung wünschen. Andernfalls entscheidet der Agent das Framework basierend auf Modell und Budget.

  • Bitten Sie um Kostenschätzungen, bevor Sie große Jobs starten

  • Fordern Sie Trackio-Überwachung für Echtzeit-Verlustkurven an

  • Prüfen Sie den Jobstatus, indem Sie den Agenten nach der Einreichung die Logs untersuchen lassen

Ressourcen

Zuletzt aktualisiert

War das hilfreich?