Hackathon d'apprentissage par renforcement IA AMD avec Unsloth

​​Apprenez des techniques pratiques d'apprentissage par renforcement pour les modèles d'IA avec Unsloth grâce à Daniel Han, le créateur d'Unsloth.

Vous pouvez consulter le dépôt GitHub d'Unsloth ici : https://github.com/unslothai/unsloth

Voici le lien vers nos notebooks de fine-tuning AMD :

https://github.com/unslothai/notebooks/blob/main/nb/gpt_oss_(20B)_Reinforcement_Learning_2048_Game_BF16.ipynb

Si vous souhaitez mettre à jour Unsloth / Unsloth Zoo :

Pour bitsandbytes :

Si vous voyez :

N'utilisez PAS UV_SKIP_WHEEL_FILENAME_CHECK, utilisez plutôt UNIQUEMENT pip install "unsloth[amd] @ git+https://github.com/unslothai/unsloth" (PAS uv) car uv détruit bitsandbytes. Peut-être ajouter une vérification dans les PR si possible pour détecter cela.

Pour les instructions d'installation AMD, vous pouvez consulter notre guide ici :

AMD

Mis à jour

Ce contenu vous a-t-il été utile ?