# Bases

- [Inférence et déploiement](https://unsloth.ai/docs/fr/bases/inference-and-deployment.md): Apprenez à enregistrer votre modèle fine-tuné afin de pouvoir l'exécuter dans votre moteur d'inférence préféré.
- [Enregistrement en GGUF](https://unsloth.ai/docs/fr/bases/inference-and-deployment/saving-to-gguf.md): Enregistrez les modèles en 16 bits pour GGUF afin de pouvoir les utiliser avec Ollama, Jan AI, Open WebUI et plus encore !
- [Décodage spéculatif](https://unsloth.ai/docs/fr/bases/inference-and-deployment/saving-to-gguf/speculative-decoding.md): Décodage spéculatif avec llama-server, llama.cpp, vLLM et plus encore pour une inférence 2x plus rapide
- [Guide de déploiement et d'inférence vLLM](https://unsloth.ai/docs/fr/bases/inference-and-deployment/vllm-guide.md): Guide pour enregistrer et déployer des LLMs vers vLLM pour servir des LLMs en production
- [Arguments du moteur vLLM](https://unsloth.ai/docs/fr/bases/inference-and-deployment/vllm-guide/vllm-engine-arguments.md)
- [Guide de permutation à chaud LoRA](https://unsloth.ai/docs/fr/bases/inference-and-deployment/vllm-guide/lora-hot-swapping-guide.md)
- [Enregistrement pour Ollama](https://unsloth.ai/docs/fr/bases/inference-and-deployment/saving-to-ollama.md)
- [Déploiement de modèles vers LM Studio](https://unsloth.ai/docs/fr/bases/inference-and-deployment/lm-studio.md): Enregistrez les modèles en GGUF afin de pouvoir les exécuter et les déployer dans LM Studio
- [Comment installer LM Studio CLI dans le terminal Linux](https://unsloth.ai/docs/fr/bases/inference-and-deployment/lm-studio/how-to-install-lm-studio-cli-in-linux-terminal.md): Guide d'installation de LM Studio CLI sans interface dans une instance de terminal.
- [Guide de déploiement et d'inférence SGLang](https://unsloth.ai/docs/fr/bases/inference-and-deployment/sglang-guide.md): Guide pour enregistrer et déployer des LLMs vers SGLang pour servir des LLMs en production
- [Inférence Unsloth](https://unsloth.ai/docs/fr/bases/inference-and-deployment/unsloth-inference.md): Apprenez à exécuter votre modèle fine-tuné avec l'inférence plus rapide d'Unsloth.
- [Guide de déploiement de llama-server et du point de terminaison OpenAI](https://unsloth.ai/docs/fr/bases/inference-and-deployment/llama-server-and-openai-endpoint.md): Déploiement via llama-server avec un point de terminaison compatible OpenAI
- [Comment exécuter et déployer des LLMs sur votre téléphone iOS ou Android](https://unsloth.ai/docs/fr/bases/inference-and-deployment/deploy-llms-phone.md): Tutoriel pour fine-tuner votre propre LLM et le déployer sur votre Android ou iPhone avec ExecuTorch.
- [Dépannage de l'inférence](https://unsloth.ai/docs/fr/bases/inference-and-deployment/troubleshooting-inference.md): Si vous rencontrez des problèmes lors de l'exécution ou de l'enregistrement de votre modèle.
- [Déploiement de LLMs avec Hugging Face Jobs](https://unsloth.ai/docs/fr/bases/inference-and-deployment/deploying-llms-with-hugging-face-jobs.md): Utiliser Hugging Face jobs et skills pour fine-tuner LFM avec Codex / Claude Code à l'aide d'un SKILL.
- [Comment exécuter des LLMs locaux avec Claude Code](https://unsloth.ai/docs/fr/bases/claude-code.md): Guide pour utiliser des modèles ouverts avec Claude Code sur votre appareil local.
- [Comment exécuter des LLMs locaux avec OpenAI Codex](https://unsloth.ai/docs/fr/bases/codex.md): Utilisez des modèles ouverts avec OpenAI Codex sur votre appareil localement.
- [Fine-tuning multi-GPU avec Unsloth](https://unsloth.ai/docs/fr/bases/multi-gpu-training-with-unsloth.md): Apprenez à fine-tuner des LLMs sur plusieurs GPU et en parallèle avec Unsloth.
- [Fine-tuning multi-GPU avec Distributed Data Parallel (DDP)](https://unsloth.ai/docs/fr/bases/multi-gpu-training-with-unsloth/ddp.md): Apprenez à utiliser l'interface CLI d'Unsloth pour entraîner sur plusieurs GPU avec Distributed Data Parallel (DDP) !
- [Guide de fine-tuning des modèles d'embedding avec Unsloth](https://unsloth.ai/docs/fr/bases/embedding-finetuning.md): Apprenez à fine-tuner facilement des modèles d'embedding avec Unsloth.
- [Fine-tunez des modèles MoE 12x plus rapidement avec Unsloth](https://unsloth.ai/docs/fr/bases/faster-moe.md): Entraînez localement des LLMs MoE à l'aide du guide Unsloth.
- [Guide de fine-tuning Text-to-Speech (TTS)](https://unsloth.ai/docs/fr/bases/text-to-speech-tts-fine-tuning.md): Apprenez à fine-tuner des modèles vocaux TTS et STT avec Unsloth.
- [Unsloth Dynamic 2.0 GGUF](https://unsloth.ai/docs/fr/bases/unsloth-dynamic-2.0-ggufs.md): Une grande nouvelle amélioration de nos quantifications dynamiques !
- [Unsloth Dynamic GGUF sur Aider Polyglot](https://unsloth.ai/docs/fr/bases/unsloth-dynamic-2.0-ggufs/unsloth-dynamic-ggufs-on-aider-polyglot.md): Performances des GGUF dynamiques d'Unsloth sur les benchmarks Aider Polyglot
- [Guide d'appel d'outils pour les LLMs locaux](https://unsloth.ai/docs/fr/bases/tool-calling-guide-for-local-llms.md)
- [Fine-tuning de la vision](https://unsloth.ai/docs/fr/bases/vision-fine-tuning.md): Apprenez à fine-tuner des LLMs vision/multimodaux avec Unsloth
- [Dépannage et FAQ](https://unsloth.ai/docs/fr/bases/troubleshooting-and-faqs.md): Conseils pour résoudre les problèmes et questions fréquemment posées.
- [Hugging Face Hub, débogage XET](https://unsloth.ai/docs/fr/bases/troubleshooting-and-faqs/hugging-face-hub-xet-debugging.md): Débogage, dépannage des téléchargements bloqués, coincés et lents
- [Modèles de chat](https://unsloth.ai/docs/fr/bases/chat-templates.md): Apprenez les bases et les options de personnalisation des modèles de chat, y compris les formats Conversational, ChatML, ShareGPT, Alpaca et plus encore !
- [Indicateurs d'environnement Unsloth](https://unsloth.ai/docs/fr/bases/unsloth-environment-flags.md): Indicateurs avancés qui peuvent être utiles si vous voyez des fine-tunings cassés, ou si vous voulez désactiver certaines choses.
- [Pré-entraînement continu](https://unsloth.ai/docs/fr/bases/continued-pretraining.md): Également appelé fine-tuning continu. Unsloth vous permet de poursuivre le pré-entraînement afin qu'un modèle puisse apprendre une nouvelle langue.
- [Fine-tuning à partir du dernier point de contrôle](https://unsloth.ai/docs/fr/bases/finetuning-from-last-checkpoint.md): Les points de contrôle vous permettent d'enregistrer la progression de votre fine-tuning afin de pouvoir le mettre en pause puis le reprendre.
- [Benchmarks Unsloth](https://unsloth.ai/docs/fr/bases/unsloth-benchmarks.md): Benchmarks enregistrés par Unsloth sur les GPU NVIDIA.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/fr/bases.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
