> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/fr/notions-de-base.md).

# Notions de base

- [Comment utiliser Unsloth comme point de terminaison API](https://unsloth.ai/docs/fr/notions-de-base/api.md)
- [Inférence et déploiement](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment.md): Apprenez à enregistrer votre modèle affiné afin de pouvoir l'exécuter dans votre moteur d'inférence préféré.
- [Enregistrement au format GGUF](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/saving-to-gguf.md)
- [Décodage spéculatif](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/saving-to-gguf/speculative-decoding.md): Décodage spéculatif avec llama-server, llama.cpp, vLLM et plus encore pour une inférence 2x plus rapide
- [Guide de déploiement et d'inférence vLLM](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/vllm-guide.md): Guide pour enregistrer et déployer des LLM sur vLLM afin de servir des LLM en production
- [Arguments du moteur vLLM](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/vllm-guide/vllm-engine-arguments.md)
- [Guide de changement à chaud LoRA](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/vllm-guide/lora-hot-swapping-guide.md)
- [Enregistrement vers Ollama](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/saving-to-ollama.md)
- [Déploiement de modèles sur LM Studio](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/lm-studio.md): Enregistrement des modèles en GGUF afin de pouvoir les exécuter et les déployer sur LM Studio
- [Comment installer LM Studio CLI dans le terminal Linux](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/lm-studio/how-to-install-lm-studio-cli-in-linux-terminal.md): Guide d'installation de LM Studio CLI sans interface utilisateur dans une instance de terminal.
- [Guide de déploiement et d'inférence SGLang](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/sglang-guide.md): Guide pour enregistrer et déployer des LLM sur SGLang afin de servir des LLM en production
- [Inférence Unsloth](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/unsloth-inference.md): Apprenez à exécuter votre modèle affiné avec l'inférence plus rapide d'Unsloth.
- [Guide de déploiement llama-server et point de terminaison OpenAI](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/llama-server-and-openai-endpoint.md): Déploiement via llama-server avec un point de terminaison compatible OpenAI
- [Comment exécuter et déployer des LLM sur votre téléphone iOS ou Android](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/deploy-llms-phone.md): Tutoriel pour affiner votre propre LLM et le déployer sur votre Android ou iPhone avec ExecuTorch.
- [Dépannage de l'inférence](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/troubleshooting-inference.md): Si vous rencontrez des problèmes lors de l'exécution ou de l'enregistrement de votre modèle.
- [Déploiement de LLM avec les tâches Hugging Face](https://unsloth.ai/docs/fr/notions-de-base/inference-and-deployment/deploying-llms-with-hugging-face-jobs.md): Utiliser les tâches et compétences Hugging Face pour affiner LFM avec Codex / Claude Code avec une SKILL.
- [Comment exécuter des LLM locaux avec Claude Code](https://unsloth.ai/docs/fr/notions-de-base/claude-code.md): Guide pour utiliser des modèles ouverts avec Claude Code sur votre appareil local.
- [Comment exécuter des LLM locaux avec OpenAI Codex](https://unsloth.ai/docs/fr/notions-de-base/codex.md): Utilisez des modèles ouverts avec OpenAI Codex sur votre appareil localement.
- [Affinage multi-GPU avec Unsloth](https://unsloth.ai/docs/fr/notions-de-base/multi-gpu-training-with-unsloth.md): Apprenez à affiner des LLM sur plusieurs GPU et avec parallélisme grâce à Unsloth.
- [Affinage multi-GPU avec Distributed Data Parallel (DDP)](https://unsloth.ai/docs/fr/notions-de-base/multi-gpu-training-with-unsloth/ddp.md): Apprenez à utiliser l'interface CLI d'Unsloth pour entraîner sur plusieurs GPU avec Distributed Data Parallel (DDP) !
- [Guide d'affinage des modèles d'embeddings avec Unsloth](https://unsloth.ai/docs/fr/notions-de-base/embedding-finetuning.md): Apprenez à affiner facilement des modèles d'embeddings avec Unsloth.
- [Affinez les modèles MoE 12x plus vite avec Unsloth](https://unsloth.ai/docs/fr/notions-de-base/faster-moe.md): Entraînez des LLM MoE localement à l'aide du guide Unsloth.
- [Guide d'affinage de la synthèse vocale (TTS)](https://unsloth.ai/docs/fr/notions-de-base/text-to-speech-tts-fine-tuning.md): Découvrez comment affiner des modèles vocaux TTS et STT avec Unsloth.
- [GGUF dynamiques 2.0 d'Unsloth](https://unsloth.ai/docs/fr/notions-de-base/unsloth-dynamic-2.0-ggufs.md): Une grande nouvelle amélioration de nos quantifications dynamiques !
- [GGUF dynamiques d'Unsloth sur Aider Polyglot](https://unsloth.ai/docs/fr/notions-de-base/unsloth-dynamic-2.0-ggufs/unsloth-dynamic-ggufs-on-aider-polyglot.md): Performances des GGUF dynamiques d'Unsloth sur les benchmarks Aider Polyglot
- [Guide d'appel d'outils pour les LLM locaux](https://unsloth.ai/docs/fr/notions-de-base/tool-calling-guide-for-local-llms.md)
- [Affinage vision](https://unsloth.ai/docs/fr/notions-de-base/vision-fine-tuning.md): Apprenez à affiner des LLM vision/multimodaux avec Unsloth
- [Dépannage et FAQ](https://unsloth.ai/docs/fr/notions-de-base/troubleshooting-and-faqs.md): Conseils pour résoudre les problèmes et questions fréquemment posées.
- [Hugging Face Hub, débogage XET](https://unsloth.ai/docs/fr/notions-de-base/troubleshooting-and-faqs/hugging-face-hub-xet-debugging.md): Débogage, résolution des téléchargements bloqués, coincés et lents
- [Modèles de chat](https://unsloth.ai/docs/fr/notions-de-base/chat-templates.md): Découvrez les fondements et les options de personnalisation des modèles de chat, y compris les formats Conversational, ChatML, ShareGPT, Alpaca, et plus encore !
- [Indicateurs d'environnement Unsloth](https://unsloth.ai/docs/fr/notions-de-base/unsloth-environment-flags.md): Indicateurs avancés pouvant être utiles si vos affinages échouent ou si vous souhaitez désactiver certaines fonctionnalités.
- [Pré-entraînement continu](https://unsloth.ai/docs/fr/notions-de-base/continued-pretraining.md): Aussi appelé affinage continu. Unsloth vous permet de pré-entraîner en continu afin qu'un modèle puisse apprendre une nouvelle langue.
- [Affinage à partir du dernier checkpoint](https://unsloth.ai/docs/fr/notions-de-base/finetuning-from-last-checkpoint.md): Le checkpointing vous permet d'enregistrer la progression de votre affinage afin de pouvoir le mettre en pause puis le reprendre.
- [Benchmarks Unsloth](https://unsloth.ai/docs/fr/notions-de-base/unsloth-benchmarks.md): Benchmarks enregistrés par Unsloth sur les GPU NVIDIA.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://unsloth.ai/docs/fr/notions-de-base.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
