> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/fr/nouveau/changelog.md).

# Mises à jour d’Unsloth

Pour utiliser les dernières modifications, [mettez à jour Unsloth](/docs/fr/nouveau/studio/install.md#update-unsloth-studio).

{% updates format="full" %}
{% update date="2026-06-12" tags="new-releases,v0.1464-beta" %}

## DiffusionGemma + Gemma 4 MTP

Assurez-vous d’installer la dernière [`v0.1.464-beta`](https://github.com/unslothai/unsloth/tree/v0.1.462-beta) ou `2026.6.7`. [DiffusionGemma](https://unsloth.ai/docs/models/diffusiongemma), [Gemma 4 MTP](https://unsloth.ai/docs/models/mtp) et [**MiniMax-M3**](https://unsloth.ai/docs/models/minimax-m3) sont désormais tous pris en charge.

* Exécuter et entraîner [DiffusionGemma](https://unsloth.ai/docs/models/diffusiongemma) via [Unsloth Studio](https://unsloth.ai/docs/new/studio).
* [Gemma 4 MTP](https://unsloth.ai/docs/models/mtp) est là ! Exécutez [Gemma 4](https://unsloth.ai/docs/models/gemma-4) \~2x plus rapide avec MTP.
* Le chat audio est désormais pris en charge pour Gemma 4 (`wav`, `mp3`, `m4a`, `flac`, `webm`).
* Preserve Think a été ajouté à Gemma 4.

<figure><img src="/files/608ef824be87e674df7b205a47c03ae2281fb5dc" alt="" width="375"><figcaption></figcaption></figure>

#### Hub + Gestionnaire de téléchargements (expérimental)

* Ajout d’une nouvelle **page Hub** pour parcourir, télécharger et gérer des modèles et jeux de données Hugging Face.
* Unsloth peut désormais détecter les modèles et jeux de données déjà présents sur votre machine et les afficher à côté des ressources téléchargées.
* Téléchargés [modèles GGUF](https://unsloth.ai/docs/basics/inference-and-deployment/saving-to-gguf) ont désormais des actions directes **Exécuter / Nouveau chat** .

#### RAG / Chat avec des fichiers (expérimental)

* Ajout de [**Chat avec des fichiers**](https://unsloth.ai/docs/new/studio/chat) dans Studio, vous permettant de poser des questions sur vos propres documents et bases de connaissances.
* Prend en charge la recherche hybride, les citations, les aperçus PDF, les documents par fil et un outil intégré `search_knowledge_base` .

#### Nouveau bouton de mise à jour + prise en charge du matériel

* Unsloth utilise désormais constamment des [précompilés llama.cpp](https://unsloth.ai/docs/new/changelog) à jour sur CUDA, ROCm, Windows, Linux et macOS.
* Ajout d’un **bouton Mettre à jour llama.cpp** dans l’application afin que les utilisateurs puissent mettre à jour le backend local sans réinstaller Studio.
* Prise en charge améliorée de Windows / WSL AMD, [prise en charge ROCm de Strix Halo](https://unsloth.ai/docs/get-started/install/amd), [sélection CUDA Blackwell](https://unsloth.ai/docs/blog/fine-tuning-llms-with-blackwell-rtx-50-series-and-unsloth)et messages d’installation plus clairs.

#### Chat local, outils et compatibilité API

* Local [appel d’outils](https://unsloth.ai/docs/basics/tool-calling-guide-for-local-llms) est plus fiable, avec un meilleur ordre des cartes d’outils, moins de boucles d’outils dupliquées et la prise en charge de l’utilisation d’outils avec les modèles de vision GGUF.
* Amélioration de [l’API compatible OpenAI](https://unsloth.ai/docs/basics/inference-and-deployment/llama-server-and-openai-endpoint) et du comportement de l’API compatible Anthropic pour les serveurs Studio locaux, y compris de meilleures erreurs, l’utilisation des jetons, les raisons d’arrêt et [la compatibilité avec Claude Code](https://unsloth.ai/docs/basics/claude-code).

#### Entraînement et correctifs

* Amélioration de [Prise en charge MLX](https://unsloth.ai/docs/new/studio/install) avec de meilleures étiquettes de modèle, des statistiques de vitesse de génération et des correctifs pour [l’entraînement VLM](https://unsloth.ai/docs/basics/vision-fine-tuning).
* Correction de plusieurs cas limites [d’entraînement](https://unsloth.ai/docs/get-started/fine-tuning-llms-guide) et [de jeu de données](https://unsloth.ai/docs/get-started/fine-tuning-llms-guide/datasets-guide) incluant des caches Hugging Face non inscriptibles et des correspondances de jeux de données personnalisées.
* De nombreux correctifs d’amélioration de l’interface ont été ajoutés dans le chat, les menus, le sélecteur de modèle, le mode sombre, l’importation/exportation et les paramètres.

Pour mettre à jour Unsloth ou installer un nouvel Unsloth Studio, vous devez utiliser :

**macOS, Linux, WSL :**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows :**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% endupdate %}

{% update date="2026-06-03" tags="new-releases,v0.1.44-beta" %}

## Gemma 4 12B, nouvelle interface, MCP, projets

Cette mise à jour se concentre principalement sur Gemma 4 12B, MCP, Projets, Canvas, CUDA 13.3 et la nouvelle interface de chat. La semaine prochaine, nous aurons une mise à jour encore plus importante.

<div data-with-frame="true"><figure><img src="/files/e39215578eb5aa4f1238786b6475c3aec5e52345" alt="" width="375"><figcaption></figcaption></figure></div>

#### Gemma 4 12B

Google publie [Gemma 4 12B](https://unsloth.ai/docs/models/gemma-4), un nouveau modèle qui s’exécute localement sur 8 Go de RAM. [GGUF](https://huggingface.co/unsloth/gemma-4-12b-it-GGUF) / [Guide](https://unsloth.ai/docs/models/gemma-4)

Gemma 4 12B Unified prend en charge l’image, l’audio et un contexte de 256K. Exécutez et entraînez le modèle via Unsloth Studio.

#### MCP

* Prise en charge `MCP` du serveur distant, y compris les en-têtes personnalisés et OAuth
* du serveur local basé sur des commandes `MCP` prise en charge du serveur
* `MCP` peut désormais être activée depuis le compositeur de chat
* Préréglages intégrés pour les `MCP` serveurs

#### Nouvelle interface de chat

* Projets, Canvas, `MCP`, les contrôles RAG et Comparer sont désormais dans le menu plus
* Les contrôles Recherche et Code sont plus faciles d’accès depuis le compositeur
* Les menus, superpositions, icônes et contrôles cliquables sont plus cohérents dans Studio

#### Projets

* Organisez les discussions associées dans des espaces de projet dédiés
* Déplacez les chats existants dans des projets
* Créez et gérez des projets directement depuis la barre latérale

#### Canvas / artefacts expérimentaux

* Ouvre le HTML généré dans un panneau canvas dédié dans Unsloth Studio
* Prend en charge les sorties interactives, y compris les visualisations basées sur le navigateur et les packages chargés via CDN
* Vous permet de basculer entre l’aperçu rendu et le code स्रोत

#### Installation, exécution et matériel

* Les installations précompilées Windows ne nécessitent plus la vérification initiale du `CUDA Toolkit` check
* Linux `llama.cpp` les précompilés correspondent désormais à l’environnement d’exécution détecté `cudart` principal
* `ROCm` la détection gfx est répercutée dans la sélection des précompilés
* `Blackwell`, `B300` et `ARM64` mises à jour de la prise en charge Linux

Pour mettre à jour Unsloth ou installer un nouvel Unsloth Studio, vous devez utiliser :

**macOS, Linux, WSL :**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows :**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% hint style="warning" %}
**NE PAS UTILISER `mise à jour d’unsloth studio` d’ailleurs, car le packaging n’obtiendra pas les dernières mises à jour !**
{% endhint %}
{% endupdate %}

{% update date="2026-05-31" tags="new-releases,v0.1.43-beta" %}

## CUDA 13.3, Windows, Mac

**Pour mettre à jour Unsloth ou installer un nouvel Unsloth Studio, vous devez utiliser :**

**macOS, Linux, WSL :**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows :**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% hint style="warning" %}
**NE PAS UTILISER `mise à jour d’unsloth studio` d’ailleurs, car le packaging n’obtiendra pas les dernières mises à jour !**
{% endhint %}

#### Mises à jour Mac

* Réactivés `llama.cpp` les binaires précompilés pour Apple Silicon (M1-M4) - Mac OS 14 / 15 / 26 (Tahoe)
* Apple Silicon Mac OS 13 (Ventura) nécessite une compilation à partir du code स्रोत
* Intel (x86\_64) pour Mac OS 13.3 / 14 / 15 / 26 (Tahoe) utilise `llama.cpp` des binaires précompilés
* Intel pour Max 13.0 - 13.2 nécessite une compilation à partir du code source

#### Mises à jour Windows

* CUDA 13.3 `llama.cpp` les binaires précompilés fonctionnent désormais pour Windows
* Pour CUDA 13.2, CUDA 13.1 et versions inférieures, les appareils Windows utilisent le repli CUDA 12.4 — nous travaillerons bientôt sur des binaires CUDA 13.1.

#### Mise à jour CUDA 13.3

* Les binaires non Linux de CUDA 13.3 fonctionnent. Nous utiliserons encore CUDA 13.1 pour le moment
* CUDA 13.3 résout le problème de charabia de CUDA 13.2 - voir <https://github.com/unslothai/unsloth/issues/4849>

#### Mise à jour des GPU Blackwell

* Pour le moment, Blackwell aura des sorties retardées de `llama.cpp` binaires précompilés puisque CUDA 12.4 ne fonctionne pas — nous travaillons à résoudre cela bientôt.
  {% endupdate %}

{% update date="2026-05-26" tags="new-releases,v0.1.42-beta" %}

## Une mise à jour avant la refonte.

Salut tout le monde, nous faisons encore une dernière petite mise à jour avant une refonte majeure qui devrait arriver cette semaine ou la semaine prochaine. Notre refonte va changer beaucoup de choses, surtout avec de nouvelles fonctionnalités majeures et beaucoup de changements de design.

{% embed url="<https://github.com/user-attachments/assets/70456395-e016-4273-8256-35adb206267e>" %}

* NOUVEAU : [**Prise en charge des appels d’API**](https://unsloth.ai/docs/integrations/connections) désormais avec génération + édition d’images, recherche web correcte, exécution de code, mise en cache automatique des prompts. Connectez [OpenAI](https://unsloth.ai/docs/integrations/connections/openai), [Anthropic](https://unsloth.ai/docs/integrations/connections/anthropic-claude) et plus encore.
* Prise en charge appropriée des **langues non anglaises** par ex. japonais, chinois, indien, etc.

Beaucoup d’entre vous ont peut-être manqué notre précédente version, qui n’a duré qu’une journée. Nous avons introduit :

* Connexion à des backends d’inférence externes : [vLLM](https://unsloth.ai/docs/integrations/connections/vllm), [Ollama](https://unsloth.ai/docs/integrations/connections/ollama), [llama-server](https://unsloth.ai/docs/integrations/connections/connect-llama.cpp-to-unsloth-run-ggufs-with-llama-server)
* **Améliorations de sécurité**
* **Décodage spéculatif MTP automatique** pour les MTP GGUF ; obtenez les meilleurs réglages personnalisés pour votre matériel.

#### Appels aux fournisseurs d’API et connexions externes

* Vous pouvez désormais connecter Unsloth à n’importe quel fournisseur cloud API (OpenAI, Anthropic, OpenRouter, etc.)
* **Recherche web intégrée** pour OpenAI, Anthropic, OpenRouter et Kimi
* **Exécution de code intégrée** pour OpenAI et Anthropic (les conteneurs Anthropic persistent et sont réutilisés entre les tours)
* La mise en cache des prompts est activée pour les modèles OpenAI et Anthropic, ce qui permet d’économiser 50 à 90 % des coûts.
* Génération + édition d’images
* La clé API est désormais optionnelle pour les fournisseurs locaux (llama.cpp / vLLM / Ollama)
* Chargement automatique des modèles lors de l’ajout d’un fournisseur cloud

#### Autres mises à jour d’Unsloth Studio

* Pièces jointes de chat OpenDocument
* charge utile du résumé de raisonnement o3
* L’envoi/la formulation de langues non anglaises (par ex. japonais, chinois) fonctionne désormais correctement
* Durcissement du compositeur IME, RTL `dir="auto"`correctif de troncature des longues lignes de journal
* Rendu de la trace de raisonnement des outils dans l’interface
* Prise en charge entièrement hors ligne : découverte GGUF en cache et détection automatique DNS hors ligne pour l’inférence et l’entraînement

#### Améliorations de sécurité d’Unsloth Studio

* Limitation du débit de l’authentification, tenant compte du proxy afin que les proxys inverses ne la contournent pas
* Worker isolé avec une liste de blocage renforcée (bash, `upload hf`, `NOFILE`)
* Contenance des chemins pour que les workers ne puissent pas sortir de leurs répertoires tmp en cours d’utilisation
* Validation stricte du schéma sur l’API Studio
* Renforcement des en-têtes CSP / sécurité (seuls les hôtes de favicon légitimes sont autorisés)
* Suppression du `torch.load` repli sur `training_args.bin` afin que des pickles non fiables ne puissent jamais être exécutés au chargement du modèle
* Flux de publication desktop Tauri renforcé
* Authentification frontend : rafraîchissement de jeton singleflight, saisie du mot de passe actuel lors des modifications, déconnexion fonctionnelle, assistant 422 partagé
* Le nettoyage d’annulation est désormais strictement limité aux répertoires tmp en cours d’utilisation afin qu’il ne puisse jamais supprimer l’état de l’utilisateur
  {% endupdate %}

{% update date="2026-05-19" tags="new-releases,v0.1.41-beta" %}

## Corrections MTP + Unsloth

Beaucoup de corrections de bugs, corrections UI/UX pour Studio ! Pour obtenir les dernières mises à jour, faites :

**macOS, Linux, WSL :**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows :**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

#### Corrections

1. Corriger `mise à jour d’unsloth studio` ne fonctionne pas bien
2. Corriger le blocage sur `reset-password` page
3. Plus de prise en charge du mode hors ligne
4. Améliorer le fait que MTP ne soit pas plus rapide sur Mac, CPU et GPU — maintenant c’est bien mieux !
5. Correction du raccourci bureau qui ne fonctionnait pas après la mise à jour
6. Beaucoup, beaucoup de corrections de bugs UI/UX
   {% endupdate %}

{% update date="2026-05-18" tags="new-releases,model-release,v0.1.405-beta" %}

## Qwen3.6 MTP + connexions API

Nous avons de nombreuses nouvelles mises à jour pour Unsloth `v0.1.41-beta`:

* **inférence GGUF \~2x plus rapide** avec activation automatique de [MTP](/docs/fr/modeles/qwen3.6.md#mtp-guide)
* [**Prise en charge des appels d’API**](broken://pages/9185e636c3380b1a3138a9ee58e22a13296ea0d5) pour [OpenAI](broken://pages/f4b7d2d326e0c044baac2f345641fb926c9d0a4b), [Anthropic](broken://pages/76c6f5f175cd7ff9209f8ffbb15f708de4011135) etc. avec mise en cache automatique des prompts, recherche web, exécution de code
* Connexion à des backends d’inférence externes : [vLLM](broken://pages/fef7bb4e8cb31e2b1d0d4813eaaa7bcb5c6d453e), [Ollama](broken://pages/43f9a081bd52f5f2e009e1d4fd9a91657da94c24), [llama-server](broken://pages/bc26b93899f43a7cd9a03d1b915591c7fe7f9545)
* Expérimental **inférence MLX**
* Prise en charge appropriée des **langues non anglaises**
* **Sécurité** améliorations

<a href="/pages/4a2b83ac4bf0233da80a1e3b6ab9fb218108742c#qwen3.6-inference-tutorials" class="button primary">Lancer les tutoriels Qwen3.6</a><a href="/pages/4a2b83ac4bf0233da80a1e3b6ab9fb218108742c#mtp-guide" class="button primary">Guide MTP</a>

<div data-with-frame="true"><figure><img src="/files/75019f5e946025018cbbe6a126c414cb70114bdd" alt="" width="375"><figcaption></figcaption></figure></div>

#### Prise en charge du décodage spéculatif MTP : inférence 1,4 à 2x plus rapide !

* **Décodage spéculatif MTP automatique** pour les MTP GGUF ; avertit lorsque le précompilé llama.cpp fourni est obsolète ou trop ancien pour MTP
* Nouveaux binaires précompilés llama.cpp pour la prise en charge de MTP !

#### Appels aux fournisseurs d’API et connexions externes

* Vous pouvez désormais connecter Unsloth à n’importe quel fournisseur cloud API (OpenAI, Anthropic, OpenRouter, etc.)
* **Recherche web intégrée** pour OpenAI, Anthropic, OpenRouter et Kimi
* **Exécution de code intégrée** pour OpenAI et Anthropic (les conteneurs Anthropic persistent et sont réutilisés entre les tours)
* La mise en cache des prompts est activée pour les modèles OpenAI et Anthropic, ce qui permet d’économiser 50 à 90 % des coûts.
* La clé API est désormais optionnelle pour les fournisseurs locaux (llama.cpp / vLLM / Ollama)
* Chargement automatique des modèles lors de l’ajout d’un fournisseur cloud

#### Inférence MLX (expérimental)

* Les quantifications et modèles MLX peuvent désormais s’exécuter localement sur vos machines Mac !
* Nous ajouterons bientôt le raisonnement, les outils et la recherche web !

#### Autres mises à jour d’Unsloth Studio

* L’envoi/la formulation de langues non anglaises (par ex. japonais, chinois) fonctionne désormais correctement
* Pièces jointes de chat OpenDocument
* charge utile du résumé de raisonnement o3
* Durcissement du compositeur IME, RTL `dir="auto"`correctif de troncature des longues lignes de journal
* Rendu de la trace de raisonnement des outils dans l’interface
* Prise en charge entièrement hors ligne : découverte GGUF en cache et détection automatique DNS hors ligne pour l’inférence et l’entraînement
* Beaucoup de peaufinage UI/UX : refonte du thème sombre, redesign de la barre latérale droite, mascotte paresseux selon l’heure de la journée, notifications copiables et refermables, compositeur de chat plus grand, amélioration de la configuration d’exécution de code, style des pastilles d’action du compositeur, bouton Discord plus étroit

#### Mises à jour de l’entraînement

* Correctifs du masque d’attention Gemma
* GRPO multi-image
* expériences de retour d’état caché GRPO
* Nouvelle méthode d’entraînement Continued Pretraining (CPT) proposée comme option de premier plan
* Extracteur Gemma-4 MoE LoRA enregistré pour corriger `grouped_mm` plantage de contraction
* Fusionnée en option `lm_head` + propagation avant entropie croisée, avec un chemin à une seule multiplication matricielle sous `UNSLOTH_RETURN_LOGITS=1`
* Passer la taille du lot pour l’évaluation
* Les chemins d’évaluation/d’entraînement respectent désormais `HF_DATASETS_OFFLINE` avec `HF_HUB_OFFLINE`

#### Améliorations de sécurité d’Unsloth Studio

* Limitation du débit de l’authentification, tenant compte du proxy afin que les proxys inverses ne la contournent pas
* Worker isolé avec une liste de blocage renforcée (bash, `upload hf`, `NOFILE`)
* Contenance des chemins pour que les workers ne puissent pas sortir de leurs répertoires tmp en cours d’utilisation
* Validation stricte du schéma sur l’API Studio
* Renforcement des en-têtes CSP / sécurité (seuls les hôtes de favicon légitimes sont autorisés)
* Suppression du `torch.load` repli sur `training_args.bin` afin que des pickles non fiables ne puissent jamais être exécutés au chargement du modèle
* Flux de publication desktop Tauri renforcé
* Authentification frontend : rafraîchissement de jeton singleflight, saisie du mot de passe actuel lors des modifications, déconnexion fonctionnelle, assistant 422 partagé
* Le nettoyage d’annulation est désormais strictement limité aux répertoires tmp en cours d’utilisation afin qu’il ne puisse jamais supprimer l’état de l’utilisateur
  {% endupdate %}

{% update date="2026-05-05" tags="new-releases,v0.1.39-beta,v0.1.38-beta" %}

## point de terminaison API Unsloth

#### ***correctif de bug v0.1.39-beta*** **5 mai 2026**

Corrige l’absence d’affichage de l’historique du chat (l’historique existant n’est pas perdu) et des pièces jointes qui ne s’ajoutaient pas correctement. Le bug ne concernait que le rendu — utilisez `2026.5.2` ou appelez directement `curl -fsSL https://unsloth.ai/install.sh | sh`  pour mettre à jour

Vous pouvez utiliser des LLM locaux avec des outils comme [Claude Code](https://unsloth.ai/docs/basics/claude-code) et [Codex](https://unsloth.ai/docs/basics/codex) en les connectant au point de terminaison API d’Unsloth. Cela vous permet d’exécuter localement des modèles comme [Qwen](https://unsloth.ai/docs/models/qwen3.6) et [Gemma](https://unsloth.ai/docs/models/gemma-4) avec des fonctionnalités supplémentaires telles que l’appel d’outils auto-réparateur, l’exécution de code et la recherche web.

Utiliser Unsloth comme point de terminaison d’inférence API est avantageux non seulement parce qu’il est facile à configurer et rapide, mais aussi parce qu’Unsloth fournit :

* [Appel d’outils auto-réparateur](https://unsloth.ai/docs/new/studio/chat#auto-healing-tool-calling), ce qui aide à réduire de 50 % les appels d’outils cassés ou mal formés
* [Exécution de code](https://unsloth.ai/docs/new/studio/chat#code-execution) prise en charge, permettant l’exécution de Bash et de Python pour des sorties de code plus précises.
* Avancé [Recherche web](https://unsloth.ai/docs/new/studio/chat#advanced-web-search) qui visite et lit réellement les pages web pour recueillir des informations approfondies.
* [Paramètres d’inférence automatiques](https://unsloth.ai/docs/new/studio/chat#auto-parameter-tuning) pour les modèles GGUF (temp, top-k, etc.)

<div data-with-frame="true"><figure><img src="/files/1a2d152a014c5c542c774dac8c97d657a9f4124f" alt="" width="375"><figcaption></figcaption></figure></div>

#### Nouveaux modèles

Nous avons également quelques nouveaux modèles à exécuter, notamment NVIDIA [Nemotron 3 Nano Omni](/docs/fr/modeles/nemotron-3-nano-omni.md), IBM [Granite 4.1](/docs/fr/modeles/ibm-granite-4.1.md) et [Mistral 3.5](/docs/fr/modeles/mistral-3.5.md) Medium. Nous avons aidé Mistral à résoudre certains problèmes d’implémentation dans transformers et les GGUF.

#### Mises à jour d’Unsloth

* Les exécutions d’entraînement Studio arrêtées peuvent désormais reprendre à partir de points de contrôle.
* Les fils de chat se sauvegardent désormais automatiquement et persistent de manière plus fiable.
* Les blocages de l’entraînement DPO dans les configurations multiprocessus ont été corrigés.
* La prise en charge GRPO VLM a été améliorée avec les mises à jour MROPE.
* Le bouton d’arrêt de Studio arrête désormais correctement la génération.
* Correction de la disparition du modèle de chat après le rafraîchissement du navigateur.
  {% endupdate %}

{% update date="2026-04-23" tags="new-releases,v0.1.37-beta" %}

## Toute nouvelle refonte de l’interface

Salut tout le monde, nous avons refondu toute l’interface et l’expérience UX d’Unsloth Studio pour mettre l’accent sur le chat et l’entraînement :

* Ajout d’une barre latérale repliable basée sur les retours de la communauté

<div data-with-frame="true"><figure><img src="/files/31c38c07670d49aecd1964d6f1124e2d504c41ae" alt="" width="375"><figcaption></figcaption></figure></div>

* Vous pouvez désormais supprimer des chats et rechercher dans les conversations passées

<div><figure><img src="/files/d13eab37745a36ab2562ab8d5d4e5afd42b30afd" alt=""><figcaption></figcaption></figure> <figure><img src="/files/90974e54b4cebb79cf9737ae3a9a6830d4e4bcf5" alt=""><figcaption></figcaption></figure></div>

* Nouveau bascule Preserve Thinking pour les modèles qui le prennent en charge, comme Qwen3.6
* Design plus propre et plus cohérent, avec une navigation plus facile
* Page Paramètres enrichie avec des options pour changer votre photo de profil, votre nom, et plus encore

<div data-with-frame="true"><figure><img src="/files/5f2a85c3a62bc7867c8fd3c4335ee75b3f94f769" alt="" width="375"><figcaption></figcaption></figure></div>

* Plus besoin de saisir deux fois votre jeton Hugging Face
* gpt-oss dispose désormais de bascules de réflexion faible, moyenne et élevée.
* Utilise désormais le dernier précompilé llama.cpp, même sur Linux CUDA
* Nombreux correctifs de bugs, de cohérence et de stabilité
* Kimi-K2.6 peut désormais être exécuté !
* Nous avons également ajouté une prise en charge API expérimentale. Des guides, annonces, etc. arriveront la semaine prochaine.

Qwen3.6 était aussi déjà pris en charge dans Unsloth Studio pour l’exécution et l’entraînement. Vous pouvez entraîner et exécuter Qwen3.6-27B dès maintenant !
{% endupdate %}

{% update date="2026-04-22" tags="model-release,new-releases" %}

## **Qwen3.6-27B + Kimi K2.6**

[**Qwen3.6-27B**](/docs/fr/modeles/qwen3.6.md) peut désormais être exécuté (18 Go de RAM) et affiné dans Unsloth Studio. Kimi K2.6 peut également être exécuté dans Unsloth (350 Go de RAM).

Unsloth Studio a reçu de nombreuses nouvelles mises à jour, alors veuillez mettre à jour. Les détails et l’article explicatif arriveront dans les prochains jours.
{% endupdate %}

{% update date="2026-04-16" tags="model-release,new-releases" %}

## **Qwen3.6**

[**Qwen3.6**](/docs/fr/modeles/qwen3.6.md) peut désormais être exécuté et affiné dans Unsloth Studio. Le modèle fonctionne avec 23 Go de RAM et est le LLM de taille moyenne le plus performant sur כמעט tous les benchmarks.
{% endupdate %}

{% update date="2026-04-11" tags="model-release" %}

## **Mise à jour Gemma 4 + MiniMax-M2.7**

[GGUF de Gemma 4](https://huggingface.co/collections/unsloth/gemma-4) sont désormais mis à jour avec les correctifs officiels du modèle de chat de Google (qui ont corrigé/amélioré l’appel d’outils), ainsi que les derniers correctifs de llama.cpp. Mettez à jour vers la dernière version de llama.cpp, retéléchargez les quantifications et vous ne devriez plus voir `jeton inutilisé` de problèmes.\
\
[MiniMax-M2.7](/docs/fr/modeles/tutorials/minimax-m27.md) est disponible maintenant ! Vous pouvez exécuter le modèle localement avec nos GGUF en quantification 4 bits sur 128 Go de RAM / mémoire unifiée. [**GGUF de MiniMax-M2.7**](https://huggingface.co/unsloth/MiniMax-M2.7-GGUF)
{% endupdate %}

{% update date="2026-04-08" tags="new-releases,v0.1.36-beta" %}

## **Correctifs pour Gemma 4**

Nous avons mis à jour Gemma 4 [avec de nombreux correctifs](/docs/fr/modeles/gemma-4/train.md). Ces bugs sont universels et ont affecté tous les packages et implémentations d’entraînement et **ne proviennent pas d’Unsloth**. Nous avons identifié les bugs, les avons corrigés, et l’entraînement de Gemma 4 fonctionne désormais correctement dans Unsloth.

Vous avez seulement besoin de **8 Go de VRAM** pour entraîner **Gemma-4-E2B** en local. Unsloth entraîne Gemma 4 **\~1,5× plus vite tout en utilisant \~60 % de VRAM en moins** que les configurations FA2. Pour le guide complet et les notebooks sur l’entraînement de Gemma 4, [consultez notre blog](/docs/fr/modeles/gemma-4/train.md).

#### Correctifs d’entraînement de Gemma 4

1. **L’accumulation de gradients** ne provoque plus d’explosions de perte. Auparavant, les pertes pouvaient grimper jusqu’à **300–400**; la perte attendue est d’environ **10–15**.
2. Correction de **IndexError** affectant **26B** et **31B** l’inférence dans `transformers`.
3. Correction des sorties incohérentes pour **E2B/E4B** lorsque `use_cache=False`. Voir [le problème n° 45242](https://github.com/huggingface/transformers/issues/45242).
4. Correction de **l’audio float16** du dépassement de `-1e9` valeurs.

Si vous voyez des pertes supérieures à **13–15,** par exemple **100** ou **300** - l’accumulation de gradients est probablement gérée incorrectement. C’est corrigé dans **Unsloth** et **Unsloth Studio**.

#### Réuploads des quantifications Gemma 4

Nous avons également mis à jour nos GGUF de Gemma 4, vous devrez donc les retélécharger. Encore une fois, ces problèmes de quantification ne sont **pas liés à Unsloth ni causés par lui**:

1. CUDA : vérifier le chevauchement des tampons avant la fusion - correctif critique pour `<unused24>` jetons - [PR n° 21566](https://github.com/ggml-org/llama.cpp/pull/21566)
2. `kv-cache`: prise en charge de la rotation de l’attention pour iSWA hétérogène - [PR n° 21513](https://github.com/ggml-org/llama.cpp/pull/21513)
3. `vocab`: ajout de la gestion des jetons d’octet au détokeniseur BPE pour Gemma 4 - [PR n° 21488](https://github.com/ggml-org/llama.cpp/pull/21488)
4. `convertir`: définir `« add bos » == True` pour Gemma 4 - [PR n° 21500](https://github.com/ggml-org/llama.cpp/pull/21500)
5. `commun`: ajout d’un analyseur spécialisé Gemma 4 - [PR n° 21418](https://github.com/ggml-org/llama.cpp/pull/21418)
6. `llama-model`: lire `final_logit_softcapping` pour Gemma 4 - [PR n° 21390](https://github.com/ggml-org/llama.cpp/pull/21390)
7. `llama`: ajout d’une séparation personnalisée des sauts de ligne pour Gemma 4 - [PR n° 21406](https://github.com/ggml-org/llama.cpp/pull/21406)

#### Mises à jour d’Unsloth Studio

* Ajouter **le décodage spéculatif** la prise en charge (ngram-mod, activée par défaut)
* Llama.cpp mis à jour vers la dernière version avec tous les correctifs pour Gemma 4
* Corriger les problèmes d’entraînement de Qwen3.5 et Gemma 4
* Autoriser l’export et l’enregistrement des modèles Gemma 4
* Renforcer la sécurité du bac à sable pour les outils terminal et Python
* Permettre aux recettes d’utiliser le modèle chargé dans Chat
* Corriger les fils de discussion vides lors de la navigation (et à chaque changement d’onglet) et stabiliser le nouveau flux de chat
* Autoriser l’exécution des recettes non-LLM et placer l’onglet Données en premier dans les exécutions
* Réutiliser la casse du dépôt mis en cache par HF pour éviter les doublons de téléchargement
  {% endupdate %}

{% update date="2026-04-03" tags="new-releases,v0.1.36-beta" %}

## **Google - Gemma 4**

* Vous pouvez maintenant exécuter et entraîner les [Gemma 4](/docs/fr/modeles/gemma-4.md) modèles dans Unsloth.
* Les Mac Intel fonctionnent maintenant
* Binaires précompilés pour llama.cpp pour 2 correctifs Gemma 4 :
  * vocab : corriger le tokenizer Gemma4 ([#21343](https://github.com/ggml-org/llama.cpp/pull/21343))
  * corriger : modèle Gemma 4 ([#21326](https://github.com/ggml-org/llama.cpp/pull/21326))
* Les appels d’outils pour les petits modèles sont désormais plus stables et ne s’interrompent plus
* Binaires précompilés pour Windows, Linux, Mac, appareils WSL - CPU et GPU
* Le décodage spéculatif a été ajouté pour les modèles non vision (Gemma-4 est malheureusement vision et Qwen3.5)
* La longueur de contexte est désormais appliquée correctement.
* La recherche web récupère désormais réellement le contenu des pages et pas seulement des résumés
* 90 % d’appels à l’API HF en moins - moins de limites de débit
  {% endupdate %}

{% update date="2026-03-31" tags="new-releases,improvements" %}

## **+50 % de précision des appels d’outils + davantage de prise en charge**

* Les appels d’outils pour tous les modèles sont désormais **de +30 % à +80 % plus précis.**
* La recherche web récupère désormais réellement le contenu des pages et pas seulement des résumés
* Le nombre d’appels d’outils autorisés passe de 10 à 25
* Les appels d’outils se terminent désormais beaucoup mieux, donc les boucles / répétitions seront réduites
* Plus de **réparation des appels d’outils** et de logique de déduplication pour empêcher également les appels d’outils de fuir du XML
* Testé avec `unsloth/Qwen3.5-4B-GGUF` (`UD-Q4_K_XL`), recherche web + exécution de code + réflexion activées.

| Métrique                                 | Avant  | Après           |
| ---------------------------------------- | ------ | --------------- |
| Fuites XML dans la réponse               | 10/10  | 0/10            |
| Récupérations d’URL utilisées            | 0      | 4/10 exécutions |
| Exécutions avec les bons noms de chanson | 0/10   | 2/10            |
| Moy. d’appels d’outils                   | 5.5    | 3.8             |
| Temps de réponse moyen                   | 12,3 s | 9,8 s           |

#### Nouvelles fonctionnalités

* Ajout de **dossiers personnalisés** pour que vous puissiez utiliser n’importe quels GGUF dans n’importe quel dossier - pour l’instant, accès dans les Paramètres avancés de Chat et Dossiers personnalisés
* **Bouton de mise à jour** désormais visible
* Le style du script d’installation a été entièrement mis à jour !
* Préliminaire **Prise en charge automatique de plusieurs GPU pour l’inférence et l’entraînement** - utile pour les grands modèles qui ne tiennent pas sur 1 GPU - Studio allouera automatiquement les ressources GPU
* Les Mac Intel devraient fonctionner immédiatement

### Studio beaucoup plus fluide et rapide

* **Correction des délais d’attente lors du téléchargement de grands modèles** - plus aucun délai d’attente observé.
* **Correction du bridage de débit de Hugging Face - appels à l’API HF réduits de 90 %**
* Correction de bun sur Windows et installations plus rapides
  {% endupdate %}

{% update date="2026-03-27" tags="new-releases,fixes,improvements" %}

## **Nouvelles mises à jour importantes**

Cela ne fait que 2 jours depuis notre précédente version, mais nous avons des mises à jour plus importantes :

* **L’inférence est désormais 20 à 30 % plus rapide.** Auparavant, l’appel d’outils et la pénalité de répétition pouvaient ralentir l’inférence sous les vitesses normales. Le débit en jetons/s de l’inférence devrait désormais être identique à celui de `llama-server` / `llama.cpp`.
* **Détecte désormais automatiquement les modèles plus anciens ou préexistants** téléchargés depuis **LM Studio, Hugging Face,** et des sources similaires.
* **La vitesse d’inférence en jetons/s est désormais calculée correctement.** Auparavant, les jetons/s incluaient le temps de démarrage, ce qui donnait l’impression que la vitesse affichée était plus lente qu’en réalité. Elle devrait désormais refléter la vitesse d’inférence « réelle ».
* **L’utilisation du CPU ne monte plus en pic.** Auparavant, l’identité du requêteur en ligne changeait à chaque rendu, ce qui provoquait `useLiveQuery` de se réabonner en continu.
* **Unsloth Studio dispose désormais d’un bouton x d’arrêt et se ferme correctement.** Auparavant, le fermer après l’avoir ouvert depuis l’icône du bureau ne le fermait pas correctement. Désormais, le lancement depuis le raccourci ouvre aussi le terminal, et la fermeture de ce terminal quitte complètement Unsloth Studio. Si vous l’avez encore ouvert depuis une session précédente, vous pouvez redémarrer votre ordinateur ou exécuter `lsof -i :8888` puis `kill -9 <PID>`.
* **Un appel d’outils et une recherche web encore meilleurs** avec moins d’erreurs.
* Documentation mise à jour avec beaucoup de nouvelles informations sur [la suppression de modèles, la désinstallation](/docs/fr/nouveau/studio/install.md#uninstall) etc.
* **Journalisation d’installation et de configuration plus propre et plus intelligente sur Windows et Linux.** La sortie est désormais plus facile à lire avec une mise en forme cohérente, plus discrète par défaut pour une expérience plus fluide, et prend en charge des `--verbose` diagnostics plus riches lorsque vous souhaitez tous les détails techniques.
* Vous pouvez désormais consulter votre historique d’entraînement !
  {% endupdate %}

{% update date="2026-03-25" tags="new-releases,fixes,improvements" %}

## Premier billet de version après Unsloth Studio

Salut les gars, c’est notre première version depuis le lancement d’Unsloth Studio. Beaucoup de nouvelles fonctionnalités et de correctifs :

* **Vous pouvez maintenant mettre à jour Unsloth Studio !** Veuillez mettre à jour via les mêmes commandes d’installation.
* **Windows** Le CPU ou le GPU fonctionnent maintenant sans problème. Veuillez réinstaller !
* **Raccourcis de l’application**. Une fois installé, vous pouvez désormais lancer sous Windows, MacOS et Linux via une icône de raccourci dans le menu Démarrer / Launch et sur le Bureau.
* **Binaires `llama.cpp` précompilés** et `mamba_ssm` - installations 6× plus rapides ! Aussi <300 Mo pour les binaires.
* **tailles d’installation réduites de 50 %** (-7 Go ou plus d’économies), installations 2× plus rapides et résolution plus rapide. Tailles PyPI 50 % plus petites.
* **L’appel d’outils amélioré.** Meilleur parsing de llama.cpp, plus de balisage d’outil brut dans le chat, inférence plus rapide, nouveau panneau de sorties d’outils, minuteries.
* MacOS et le CPU disposent désormais de [Recettes de données](/docs/fr/nouveau/studio/data-recipe.md) activées avec téléversement de plusieurs fichiers.
* **Prise en charge AMD préliminaire pour** les machines uniquement - détection automatique.
* **Refonte de la barre latérale des paramètres.** Les paramètres sont désormais regroupés en **Modèle, Échantillonnage, Outils et Préférences**
* **Longueur de contexte** désormais ajustable. Gardez à l’esprit que cela n’est pas nécessaire, car llama.cpp utilise intelligemment le contexte exact dont vous avez besoin via `--fit sur`
* **Téléversement de plusieurs fichiers.** Les recettes de données prennent désormais en charge plusieurs téléversements par glisser-déposer pour les fichiers PDF, DOCX, TXT et MD, avec extraction côté backend, téléversements enregistrés et aperçus améliorés.
* **Colab** avec les GPU T4 gratuits avec Unsloth Studio est maintenant corrigé ! [Essayez-le ici](https://colab.research.google.com/github/unslothai/unsloth/blob/main/studio/Unsloth_Studio_Colab.ipynb). Grâce aux binaires précompilés, c’est aussi 20× plus rapide !
* **Meilleure observabilité du chat.** Studio affiche maintenant `llama-server` les timings et l’utilisation, une barre d’utilisation de la fenêtre de contexte, et des cartes de survol de source plus riches.
* **Meilleure UX globale** - liens cliquables, meilleur parsing LaTeX, infobulles outil / code / web pour les cartes par défaut et bien plus encore !
* **LiteLLM -** Unsloth Studio et Unsloth ont été **PAS** affectés par la récente compromission de LiteLLM. Nemo Data Designer n’a utilisé LiteLLM que jusqu’à `1.80`, pas la version affectée `1.82.7` ou `1.82.8`, et l’a depuis entièrement supprimé.
* Nous avons maintenant une nouvelle commande d’installation en une ligne, il suffit d’exécuter :&#x20;

  <pre class="language-bash" data-overflow="wrap" data-expandable="true"><code class="lang-bash">curl -fsSL https://unsloth.ai/install.sh | sh
  </code></pre>

#### **Correctifs :**

* **Améliorations de Windows / de la configuration.** Correction des fermetures silencieuses de Windows, des plantages au démarrage d’Anaconda/conda-forge, des installations Windows non-NVIDIA cassées et des vérifications de configuration CUDA initiale / venv obsolète manquantes.
* **Les prompts système corrigés.** Ils fonctionnent à nouveau pour l’inférence texte et vision non-GGUF.
* **Prompts système et préréglages persistants.** Les prompts système personnalisés et les préréglages de chat persistent désormais entre les rechargements et les changements de page.
* **Export GGUF étendu.** Les fine-tunes complets, pas seulement LoRA/PEFT, peuvent désormais être exportés en GGUF. La résolution du modèle de base est plus fiable, et les options d’export non prises en charge sont désactivées dans l’interface.
* **Corrections du défilement / de la disposition du chat.** Correction des problèmes de position de défilement pendant la génération, du décalage de disposition du panneau de réflexion et des sauts de fenêtre d’affichage lors de la réduction des panneaux de raisonnement.
* **Détection plus intelligente des conflits de ports.** Studio détecte désormais les conflits de loopback, peut identifier le processus bloquant lorsque c’est possible, et fournit des messages de port de repli plus clairs.
  {% endupdate %}

{% update date="2026-03-17" tags="fixes,improvements" %}

## Nouvel appel d’outils + stabilité sous Windows

* Claude Artifacts fonctionne, donc le HTML peut être exécuté comme un jeu du serpent à l’intérieur du chat
* +30 % de précision en plus des appels d’outils, surtout pour les petits modèles + minuteur pour les appels d’outils
* Les sorties des appels d’outils + recherche web peuvent être enregistrées + bascule de l’auto-réparation des outils on/off
* Nombreux correctifs de bugs - le CPU Windows fonctionne, Mac plus fluide, installations plus rapides et plus petites
  {% endupdate %}
  {% endupdates %}


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/fr/nouveau/changelog.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
