🦥Documentation Unsloth
Unsloth est un framework open source pour exécuter et entraîner des modèles.
Unsloth vous permet d’exécuter et d’entraîner des modèles d’IA sur votre propre matériel local.
Notre documentation vous guidera pour exécuter et entraîner votre propre modèle en local.
Point de terminaison API Unsloth
Effectuez des inférences avec Unsloth via notre nouvelle API.
NVIDIA Nemotron 3 Omni
Exécutez localement le plus puissant omni 30B.

Présentation d’Unsloth Studio
Nouvelle interface ouverte sans code pour entraîner et exécuter des LLMs.
Kimi K2.6
Exécutez le nouveau modèle ouvert SOTA.
🦥 Pourquoi Unsloth ?
Unsloth simplifie l’entraînement local, l’inférence, les données et le déploiement
⭐ Fonctionnalités
Unsloth vous permet d’exécuter et d’entraîner des modèles pour le texte, l’audio, embedding, vision et bien plus encore. Unsloth offre de nombreuses fonctionnalités clés pour l’inférence et l’entraînement :
Inférence
Recherchez + téléchargez + exécutez n’importe quel modèle comme des GGUF, des adaptateurs LoRA, des safetensors.
Appels d’outils auto-réparateurs / recherche web et appels d’API compatibles OpenAI.
Paramètres d’inférence automatiques ajustez et modifiez les modèles de conversation.
Exporter ou enregistrer votre modèle en GGUF, safetensor 16 bits, etc.
Comparer les sorties avec deux modèles différents côte à côte.
Entraînement
Entraînez et RL plus de 500 modèles ~2x plus rapidement avec ~70 % de VRAM en moins (sans perte de précision)
Prend en charge le fine-tuning complet, le pré-entraînement, l’entraînement en 4 bits, 16 bits et FP8.
Créer automatiquement des jeux de données à partir de fichiers PDF, CSV, DOCX. Modifiez les données dans un workflow visuel à nœuds.
Observabilité : surveillez l’entraînement en direct, suivez la perte, l’utilisation du GPU, personnalisez les graphiques
Le plus efficace apprentissage par renforcement bibliothèque, utilisant 80 % de VRAM en moins pour GRPO, FP8 etc.
Multi-GPU fonctionne, mais une bien meilleure version arrive bientôt !
Démarrage rapide
Unsloth prend en charge MacOS, Linux, Windows, NVIDIA, Intel et les configurations CPU. Voir : Exigences d'Unsloth. Utilisez les mêmes commandes pour mettre à jour :
MacOS, Linux, WSL :
Windows PowerShell :
Docker
Utilisez notre image Docker: unsloth/unsloth officielle, qui fonctionne actuellement pour Windows, WSL et Linux. La prise en charge de MacOS arrive bientôt.
Lancer Unsloth
Qu’est-ce que le fine-tuning et le RL ? Pourquoi ?
Le fine-tuning d’un LLM personnalise son comportement, enrichit ses connaissances du domaine et optimise ses performances pour des tâches spécifiques. En ajustant finement un modèle pré-entraîné (par ex. Llama-3.1-8B) sur un jeu de données, vous pouvez :
Mettre à jour les connaissances: Introduire de nouvelles informations spécifiques au domaine.
Personnaliser le comportement: Ajuster le ton, la personnalité ou le style de réponse du modèle.
Optimiser pour des tâches: Améliorer la précision et la pertinence pour des cas d’usage spécifiques.
L’apprentissage par renforcement (RL) est le domaine où un « agent » apprend à prendre des décisions en interagissant avec un environnement et en recevant des retours sous la forme de récompenses ou de pénalités.
Action : Ce que le modèle génère (par ex. une phrase).
Récompense : Un signal indiquant à quel point l’action du modèle était bonne ou mauvaise (par ex. la réponse a-t-elle suivi les instructions ? était-elle utile ?).
Environnement : Le scénario ou la tâche sur laquelle le modèle travaille (par ex. répondre à la question d’un utilisateur).
Exemples de cas d’usage du fine-tuning ou du RL:
Permet aux LLMs de prédire si un titre a un impact positif ou négatif sur une entreprise.
Peut utiliser les interactions historiques des clients pour des réponses plus précises et personnalisées.
Ajustez finement un LLM sur des textes juridiques pour l’analyse de contrats, la recherche en jurisprudence et la conformité.
Vous pouvez considérer un modèle ajusté comme un agent spécialisé conçu pour effectuer des tâches spécifiques plus efficacement et plus performamment. Le fine-tuning peut reproduire toutes les capacités de RAG, mais pas l’inverse.

Mis à jour
Ce contenu vous a-t-il été utile ?



