infoFinetuning von LLMs auf Intel-GPUs mit Unsloth

Lerne, wie man große Sprachmodelle auf Intel-GPUs trainiert und finetunt.

Sie können jetzt LLMs auf Ihrem lokalen Intel-Gerät mit Unsloth feinabstimmen! Lesen Sie unsere Anleitung, wie Sie genau beginnen können, Ihr eigenes Modell zu trainieren.

Bevor Sie beginnen, stellen Sie sicher, dass Sie:

  • Intel GPU: Data Center GPU Max Series, Arc Series oder Intel Ultra AIPC

  • Betriebssystem: Linux (empfohlen: Ubuntu 22.04+) oder Windows 11 (empfohlen)

  • Nur Windows: Installieren Sie das Intel oneAPI Base Toolkit 2025.2.1 (wählen Sie Version 2025.2.1)

  • Intel Grafiktreiber: Neuester empfohlener Treiber für Windows/Linux

  • Python: 3.10+

Unsloth mit Intel-Unterstützung erstellen

1

Erstellen Sie eine neue conda-Umgebung (optional)

conda create -n unsloth-xpu python==3.10
conda activate unsloth-xpu
2

Unsloth installieren

git clone https://github.com/unslothai/unsloth.git
cd unsloth
pip install .[intel-gpu-torch290]
circle-info

Nur Linux: Installieren vLLM (Optional) Sie können vLLM auch für Inference und RL. Bitte folgen Sie vLLM's Anleitungarrow-up-right.

3

Überprüfen Sie Ihre Umgebungen

import torch
print(f"PyTorch-Version: {torch.__version__}")
print(f"XPU verfügbar: {torch.xpu.is_available()}")
print(f"Anzahl XPU-Geräte: {torch.xpu.device_count()}")
print(f"XPU-Gerätename: {torch.xpu.get_device_name(0)}")
4

Starten Sie die Feinabstimmung.

Sie können direkt unser Unsloth Notebooks oder unsere dedizierten Feinabstimmungs- oder Verstärkungslern- Anleitungen ansehen.

Nur Windows - Laufzeitkonfigurationen

Aktivieren Sie in der Eingabeaufforderung mit Administratorrechten die Unterstützung langer Pfade in der Windows-Registry:

powershell -Command "Set-ItemProperty -Path "HKLM:\\SYSTEM\\CurrentControlSet\\Control\\FileSystem" -Name "LongPathsEnabled" -Value 1

Dieser Befehl muss nur einmal auf einer einzelnen Maschine gesetzt werden. Er muss nicht vor jedem Lauf konfiguriert werden. Dann:

  1. Laden Sie level-zero-win-sdk-1.20.2.zip von herunter GitHubarrow-up-right

  2. Entpacken Sie die level-zero-win-sdk-1.20.2.zip

  3. In der Eingabeaufforderung, unter der conda-Umgebung unsloth-xpu:

Beispiel 1: QLoRA-Feinabstimmung mit SFT

Dieses Beispiel zeigt, wie man ein Qwen3-32B-Modell mit 4-bit QLoRA auf einer Intel GPU feinabstimmt. QLoRA reduziert den Speicherbedarf erheblich, sodass große Modelle auf Consumer-Hardware feinabgestimmt werden können.

Beispiel 2: Verstärkendes Lernen GRPO

GRPO ist eine Verstärkungslern- Technik zur Anpassung von Sprachmodellen an menschliche Präferenzen. Dieses Beispiel zeigt, wie man ein Modell trainiert, um einem bestimmten XML-Ausgabeformat mit mehreren Belohnungsfunktionen zu folgen.

Was ist GRPO?

GRPO verbessert das traditionelle RLHF durch:

  • Verwendung gruppenbasierter Normalisierung für stabileres Training

  • Unterstützung mehrerer Belohnungsfunktionen für multi-objektive Optimierung

  • Speichereffizienter als PPO zu sein

Fehlerbehebung

Out-of-Memory (OOM)-Fehler

Wenn Ihnen der Speicher ausgeht, versuchen Sie diese Lösungen:

  1. Batchgröße reduzieren: Verringern per_device_train_batch_size.

  2. Verwenden Sie ein kleineres Modell: Beginnen Sie mit einem kleineren Modell, um den Speicherbedarf zu reduzieren.

  3. Sequenzlänge reduzieren: Verringern max_seq_length.

  4. LoRA-Rang reduzieren: Verwenden Sie r=8 statt r=16 oder r=32.

  5. Für GRPO, reduzieren Sie die Anzahl der Generierungen: Verringern num_generations.

(Nur Windows) Intel Ultra AIPC iGPU Shared Memory

Für Intel Ultra AIPC mit aktuellen GPU-Treibern unter Windows ist der gemeinsame GPU-Speicher für die integrierte GPU typischerweise standardmäßig auf 57% des Systemspeichers eingestellt. Für größere Modelle (z. B. Qwen3-32B), oder wenn Sie eine längere maximale Sequenzlänge, größere Batchgröße, LoRA-Adapter mit größerem LoRA-Rang usw. während der Feinabstimmung verwenden, können Sie den verfügbaren VRAM erhöhen, indem Sie den Prozentsatz des dem iGPU zugewiesenen Systemspeichers erhöhen.

Sie können dies anpassen, indem Sie die Registry ändern:

  • Pfad: Computer\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\GraphicsDrivers\MemoryManager

  • Zu ändernder Schlüssel: SystemPartitionCommitLimitPercentage (auf einen größeren Prozentsatz setzen)

Zuletzt aktualisiert

War das hilfreich?