> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/fr/bases.md).

# Bases

- [Comment utiliser Unsloth comme point de terminaison API](https://unsloth.ai/docs/fr/bases/api.md)
- [Inférence et déploiement](https://unsloth.ai/docs/fr/bases/inference-and-deployment.md): Apprenez à enregistrer votre modèle fine-tuné afin de pouvoir l'exécuter dans votre moteur d'inférence préféré.
- [Enregistrement en GGUF](https://unsloth.ai/docs/fr/bases/inference-and-deployment/saving-to-gguf.md)
- [Décodage spéculatif](https://unsloth.ai/docs/fr/bases/inference-and-deployment/saving-to-gguf/speculative-decoding.md): Décodage spéculatif avec llama-server, llama.cpp, vLLM et plus encore pour une inférence 2x plus rapide
- [Guide de déploiement et d'inférence vLLM](https://unsloth.ai/docs/fr/bases/inference-and-deployment/vllm-guide.md): Guide pour enregistrer et déployer des LLM vers vLLM afin de servir des LLM en production
- [Arguments du moteur vLLM](https://unsloth.ai/docs/fr/bases/inference-and-deployment/vllm-guide/vllm-engine-arguments.md)
- [Guide du hot swapping LoRA](https://unsloth.ai/docs/fr/bases/inference-and-deployment/vllm-guide/lora-hot-swapping-guide.md)
- [Enregistrer des modèles dans Ollama](https://unsloth.ai/docs/fr/bases/inference-and-deployment/saving-to-ollama.md)
- [Déployer des modèles dans LM Studio](https://unsloth.ai/docs/fr/bases/inference-and-deployment/lm-studio.md): Enregistrer des modèles en GGUF afin de pouvoir les exécuter et les déployer dans LM Studio
- [Comment installer LM Studio CLI dans le terminal Linux](https://unsloth.ai/docs/fr/bases/inference-and-deployment/lm-studio/how-to-install-lm-studio-cli-in-linux-terminal.md): Guide d'installation de LM Studio CLI sans interface graphique dans une instance de terminal.
- [Guide de déploiement et d'inférence SGLang](https://unsloth.ai/docs/fr/bases/inference-and-deployment/sglang-guide.md): Guide pour enregistrer et déployer des LLM vers SGLang afin de servir des LLM en production
- [Inférence Unsloth](https://unsloth.ai/docs/fr/bases/inference-and-deployment/unsloth-inference.md): Apprenez à exécuter votre modèle fine-tuné avec l'inférence plus rapide d'Unsloth.
- [Guide de déploiement de llama-server et du point de terminaison OpenAI](https://unsloth.ai/docs/fr/bases/inference-and-deployment/llama-server-and-openai-endpoint.md): Déploiement via llama-server avec un point de terminaison compatible OpenAI
- [Comment exécuter et déployer des LLM sur votre téléphone iOS ou Android](https://unsloth.ai/docs/fr/bases/inference-and-deployment/deploy-llms-phone.md): Tutoriel pour fine-tuner votre propre LLM et le déployer sur votre Android ou iPhone avec ExecuTorch.
- [Dépannage de l'inférence](https://unsloth.ai/docs/fr/bases/inference-and-deployment/troubleshooting-inference.md): Si vous rencontrez des problèmes lors de l'exécution ou de l'enregistrement de votre modèle.
- [Déployer des LLM avec Hugging Face Jobs](https://unsloth.ai/docs/fr/bases/inference-and-deployment/deploying-llms-with-hugging-face-jobs.md): Utiliser les jobs et skills Hugging Face pour fine-tuner LFM avec Codex / Claude Code avec un SKILL.
- [Comment exécuter des LLM locaux avec Claude Code](https://unsloth.ai/docs/fr/bases/claude-code.md): Guide pour utiliser des modèles ouverts avec Claude Code sur votre appareil local.
- [Comment exécuter des LLM locaux avec OpenAI Codex](https://unsloth.ai/docs/fr/bases/codex.md): Utilisez des modèles ouverts avec OpenAI Codex localement sur votre appareil.
- [Guide pour exécuter Unsloth Dynamic NVFP4](https://unsloth.ai/docs/fr/bases/nvfp4.md): Découvrez comment Unsloth Dynamic NVFP4 permet une inférence 4 bits rapide et précise sur les GPU NVIDIA Blackwell.
- [Entraînez et exécutez des modèles sur des GPU AMD avec Unsloth](https://unsloth.ai/docs/fr/bases/amd.md)
- [Comment utiliser des serveurs MCP avec des LLM locaux](https://unsloth.ai/docs/fr/bases/mcp.md): Apprenez à connecter des serveurs MCP à des modèles d'IA ouverts avec des captures d'écran.
- [Fine-tuning multi-GPU avec Unsloth](https://unsloth.ai/docs/fr/bases/multi-gpu-training-with-unsloth.md): Apprenez à fine-tuner des LLM sur plusieurs GPU et en parallèle avec Unsloth.
- [Fine-tuning multi-GPU avec Distributed Data Parallel (DDP)](https://unsloth.ai/docs/fr/bases/multi-gpu-training-with-unsloth/ddp.md): Apprenez à utiliser l'interface CLI d'Unsloth pour entraîner sur plusieurs GPU avec Distributed Data Parallel (DDP) !
- [Guide de fine-tuning des modèles d'embedding avec Unsloth](https://unsloth.ai/docs/fr/bases/embedding-finetuning.md): Apprenez à fine-tuner facilement des modèles d'embedding avec Unsloth.
- [Fine-tuner des modèles MoE 12x plus vite avec Unsloth](https://unsloth.ai/docs/fr/bases/faster-moe.md): Guide pour entraîner des LLM MoE localement avec Unsloth.
- [Guide de fine-tuning Text-to-Speech (TTS)](https://unsloth.ai/docs/fr/bases/text-to-speech-tts-fine-tuning.md): Apprenez à fine-tuner des modèles vocaux TTS et STT avec Unsloth.
- [GGUF dynamiques 2.0 d'Unsloth](https://unsloth.ai/docs/fr/bases/unsloth-dynamic-2.0-ggufs.md): Une grande nouvelle mise à niveau de nos quantifications dynamiques !
- [GGUF dynamiques Unsloth sur Aider Polyglot](https://unsloth.ai/docs/fr/bases/unsloth-dynamic-2.0-ggufs/unsloth-dynamic-ggufs-on-aider-polyglot.md): Performances des GGUF dynamiques d'Unsloth sur les benchmarks Aider Polyglot
- [Guide d'appel d'outils pour les LLM locaux](https://unsloth.ai/docs/fr/bases/tool-calling-guide-for-local-llms.md)
- [Fine-tuning de la vision](https://unsloth.ai/docs/fr/bases/vision-fine-tuning.md): Apprenez à fine-tuner des LLM de vision/multimodaux avec Unsloth
- [Dépannage et FAQ](https://unsloth.ai/docs/fr/bases/troubleshooting-and-faqs.md): Conseils pour résoudre les problèmes et questions fréquemment posées.
- [Débogage de Hugging Face Hub et XET](https://unsloth.ai/docs/fr/bases/troubleshooting-and-faqs/hugging-face-hub-xet-debugging.md): Débogage et résolution des téléchargements bloqués, figés et lents
- [Modèles de chat](https://unsloth.ai/docs/fr/bases/chat-templates.md): Apprenez les fondamentaux et les options de personnalisation des modèles de chat, notamment les formats Conversational, ChatML, ShareGPT, Alpaca, et plus encore !
- [Variables d'environnement Unsloth](https://unsloth.ai/docs/fr/bases/unsloth-environment-flags.md): Indicateurs avancés qui peuvent être utiles si vous constatez des fine-tunings cassés, ou si vous souhaitez désactiver certaines choses.
- [Préentraînement continu](https://unsloth.ai/docs/fr/bases/continued-pretraining.md): Aussi appelé fine-tuning continu. Unsloth vous permet de préentraîner en continu afin qu'un modèle puisse apprendre une nouvelle langue.
- [Fine-tuning à partir du dernier point de contrôle](https://unsloth.ai/docs/fr/bases/finetuning-from-last-checkpoint.md): Le checkpointing vous permet de sauvegarder votre progression de fine-tuning afin de pouvoir l'interrompre puis le reprendre.
- [Benchmarks Unsloth](https://unsloth.ai/docs/fr/bases/unsloth-benchmarks.md): Benchmarks enregistrés par Unsloth sur des GPU NVIDIA.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://unsloth.ai/docs/fr/bases.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.