info在 Intel GPU 上使用 Unsloth 微调 LLMs

了解如何在 Intel GPU 上训练和微调大型语言模型。

现在您可以使用 Unsloth 在本地 Intel 设备上微调大型语言模型(LLM)!阅读我们的指南,了解如何开始训练您自己的自定义模型。

在开始之前,请确保您具备:

  • Intel GPU: 数据中心 GPU Max 系列、Arc 系列或 Intel Ultra AIPC

  • 操作系统: Linux(建议使用 Ubuntu 22.04+)或 Windows 11(推荐)

  • 仅限 Windows: 安装 Intel oneAPI Base Toolkit 2025.2.1(选择版本 2025.2.1)

  • Intel 显卡驱动: Windows/Linux 的最新推荐驱动

  • Python: 3.10+

使用对 Intel 的支持构建 Unsloth

1

创建新的 conda 环境(可选)

conda create -n unsloth-xpu python==3.10
conda activate unsloth-xpu
2

安装 Unsloth

git clone https://github.com/unslothai/unsloth.git
cd unsloth
pip install .[intel-gpu-torch290]
circle-info

仅限 Linux:安装 vLLM (可选) 您也可以为 推理强化学习安装。请遵循 vLLM 的指南arrow-up-right.

3

验证您的环境

import torch
print(f"PyTorch version: {torch.__version__}")
print(f"XPU available: {torch.xpu.is_available()}")
print(f"XPU device count: {torch.xpu.device_count()}")
print(f"XPU device name: {torch.xpu.get_device_name(0)}")
4

开始微调。

您可以直接使用我们的 Unsloth 笔记本 或查看我们的专门 微调强化学习 指南。

仅限 Windows - 运行时配置

以管理员权限在命令提示符中,在 Windows 注册表中启用长路径支持:

powershell -Command "Set-ItemProperty -Path "HKLM:\\SYSTEM\\CurrentControlSet\\Control\\FileSystem" -Name "LongPathsEnabled" -Value 1

此命令只需在单台机器上设置一次。无需在每次运行前配置。然后:

  1. 从以下位置下载 level-zero-win-sdk-1.20.2.zip GitHubarrow-up-right

  2. 解压 level-zero-win-sdk-1.20.2.zip

  3. 在命令提示符中,在 conda 环境 unsloth-xpu 下:

示例 1:使用 SFT 的 QLoRA 微调

此示例演示如何在 Intel GPU 上使用 4 位 QLoRA 对 Qwen3-32B 模型进行微调。QLoRA 大幅降低内存需求,使在消费级硬件上微调大型模型成为可能。

示例 2:强化学习 GRPO

GRPO 是一种 强化学习 用于将语言模型与人类偏好对齐的技术。此示例展示如何使用多个奖励函数训练模型以遵循特定的 XML 输出格式。

什么是 GRPO?

GRPO 在传统 RLHF 基础上改进:

  • 使用基于组的归一化以实现更稳定的训练

  • 支持多个奖励函数以进行多目标优化

  • 比 PPO 更节省内存

故障排除

内存不足(OOM)错误

如果发生内存不足,请尝试以下解决方案:

  1. 减少批量大小: 降低 per_device_train_batch_size.

  2. 使用更小的模型: 从更小的模型入手以减少内存需求。

  3. 减少序列长度: 降低 max_seq_length.

  4. 降低 LoRA 秩: 使用 r=8 代替 r=16r=32.

  5. 对于 GRPO,减少生成数量: 降低 num_generations.

(仅限 Windows)Intel Ultra AIPC iGPU 共享内存

对于在 Windows 上使用近期 GPU 驱动的 Intel Ultra AIPC,集成 GPU 的共享显存通常默认为系统内存的 57% 。对于较大的模型(例如, Qwen3-32B)或在使用更长的最大序列长度、更大的批量、具有更大 LoRA 秩的 LoRA 适配器等情况下,在微调期间可以通过提高分配给 iGPU 的系统内存百分比来增加可用显存。

您可以通过修改注册表来调整:

  • 路径: Computer\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\GraphicsDrivers\MemoryManager

  • 要更改的键: SystemPartitionCommitLimitPercentage (设置为更大的百分比)

最后更新于

这有帮助吗?