> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/fr/integrations/hermes-agent.md).

# Comment exécuter des modèles d'IA locaux avec Hermes Agent

Ce guide vous permet d’exécuter des LLM ouverts localement avec **Hermes Agent** via [**Unsloth**](https://github.com/unslothai/unsloth). Hermes Agent de Nous Research est un **open source** agent IA autonome qui se connecte à un point de terminaison de modèle, exécute des tâches et s’améliore au fil du temps grâce à la mémoire et aux compétences acquises.

{% columns %}
{% column width="58.333333333333336%" %}
Hermes fonctionnera avec n’importe quel **modèle local** exposé via le **API compatible OpenAI**d’Unsloth, y compris : DeepSeek, Qwen, Gemma, et bien plus. Hermes agit comme le client de l’agent, tandis qu’Unsloth charge et sert les modèles via le [API locale](/docs/fr/bases/api.md) entièrement hors ligne.

Après la configuration, chaque invite envoyée via Hermes s’exécutera à l’aide de votre modèle local sur votre appareil.
{% endcolumn %}

{% column width="41.666666666666664%" %}

<figure><img src="/files/63a6edca64e39a036bdba40e80d1f72d1bc3861b" alt=""><figcaption><p>Qwen3.5 exécuté localement dans Hermes via Unsloth.</p></figcaption></figure>
{% endcolumn %}
{% endcolumns %}

<a href="https://unsloth.ai/docs/integrations/hermes-agent#setup-hermes-agent" class="button primary" data-icon="caduceus">Configurer Hermes</a><a href="https://unsloth.ai/docs/integrations/hermes-agent#integrate-hermes-with-unsloth-api" class="button primary">🦥 Connectez votre modèle local</a>

{% hint style="info" %}
Dans ce tutoriel, vous installerez Hermes et le configurerez pour utiliser `unsloth/Qwen3.6-27B-GGUF` fourni par Unsloth. Vous préférez un autre modèle ? Remplacez-le par n’importe quel autre modèle en le chargeant dans Unsloth et en mettant à jour la configuration.
{% endhint %}

### <i class="fa-caduceus">:caduceus:</i> Configurer Hermes Agent

**Prérequis :**

Le [Hermes](https://github.com/NousResearch/hermes-agent/blob/main/website/docs/getting-started/installation.md) l’installateur en ligne de commande prend en charge Linux, macOS et WSL2. Assurez-vous **Git** est installé ; sous Linux, installez également **curl** et **xz-utils**. L’installateur provisionne automatiquement `uv`, Python 3.11, Node.js 22, `ripgrep`et `ffmpeg`.

#### 1. Exécutez l’installateur

```bash
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
```

L’installateur :

* Détecte votre plateforme et vérifie les dépendances.
* Clone Hermes dans `~/.hermes/hermes-agent/`.
* Crée un environnement virtuel Python et installe les dépendances Python.
* Installe les dépendances de l’outil navigateur et le moteur Chromium de Playwright.
* Ajoute la commande `hermes` et lance l’assistant de configuration.

{% columns %}
{% column %}
Playwright peut demander `sudo` d’installer les bibliothèques système partagées de Chromium. Hermes n’a pas besoin d’un accès root.
{% endcolumn %}

{% column %}

<figure><img src="/files/3fce4a1cd142d8966897ea6ed9dc28f83d7dde70" alt="" width="375"><figcaption></figcaption></figure>
{% endcolumn %}
{% endcolumns %}

#### **2. Rechargez votre shell** pour que la commande `hermes` soit dans votre `PATH`:

{% code title="bash" %}

```bash
source ~/.bashrc
```

{% endcode %}

{% code title="zsh" %}

```bash
source ~/.zshrc
```

{% endcode %}

#### **3. Vérifiez l’installation :**

```bash
hermes --version
```

Si la commande répond, Hermes est installé. Tout se trouve sous `~/.hermes/`:

| Path                                    | Ce que c’est                                                |
| --------------------------------------- | ----------------------------------------------------------- |
| `~/.hermes/config.yaml`                 | Paramètres principaux (modèle, fournisseur, outils, TTS, …) |
| `~/.hermes/.env`                        | Clés API et autres secrets                                  |
| `~/.hermes/hermes-agent/`               | Le code source de Hermes + l’environnement virtuel          |
| `~/.hermes/cron/`, `sessions/`, `logs/` | Données d’exécution                                         |
| `~/.hermes/skills/`                     | Compétences installées (synchronisées depuis le Skills Hub) |

{% hint style="info" %}
Référence d’installation complète : [hermes-agent.nousresearch.com/docs/getting-started/installation](https://hermes-agent.nousresearch.com/docs/getting-started/installation). Si l’installateur signale un prérequis manquant, installez-le et relancez la commande en une ligne. L’installateur est idempotent.
{% endhint %}

### ⚡ Démarrage rapide

Après avoir installé Hermes, nous devrons installer Unsloth Studio pour permettre à Hermes de servir et d’exécuter l’inférence de modèles locaux.

1. **Installez ou mettez à jour Unsloth Studio.** Les versions antérieures n’exposent pas l’API externe. Voir Installation.
2. **Lancez Unsloth.** Notez que le port sur lequel il démarre est généralement `8000` ou `8888`. Vous le verrez dans la sortie du terminal et dans l’URL du navigateur (`http://localhost:PORT`).
3. **Chargez un modèle.** Cliquez sur **Nouveau chat**, choisissez ou recherchez un modèle (GGUF) et attendez la fin du chargement.
4. **Connectez Hermes.** Exécutez `unsloth start hermes`. Il génère une clé API, écrit la configuration et lance Hermes sur votre modèle chargé.

### ⚡ Exécutez Hermes Agent avec `unsloth start`

Pour lancer Hermes directement avec un modèle, exécutez :

```bash
unsloth start hermes \

  --model unsloth/gemma-4-E2B-it-GGUF:UD-Q4_K_XL \

  --context-length 32768
```

Avec un modèle chargé dans Unsloth Studio, exécutez :

```bash
unsloth start hermes
```

<figure><img src="/files/c0c51b8ac732f1a0ca149d624baffec393c3dd15" alt="Hermes Agent connected to a local model through Unsloth Studio"><figcaption><p>Hermes Agent s’exécutant via son fournisseur Unsloth Studio.</p></figcaption></figure>

Unsloth lance Hermes depuis un répertoire personnel géré séparé, avec le fournisseur Unsloth, le modèle et les paramètres de contexte déjà configurés. Votre configuration Hermes existante reste inchangée.

Ce répertoire personnel géré est temporaire par défaut. Pour conserver vos sessions et votre état, ajoutez `--persist` dès votre premier lancement :

```bash
unsloth start hermes --persist
```

Pour revenir plus tard à votre dernière session, exécutez :

```bash
unsloth start hermes --persist --continue
```

Pour rouvrir une session spécifique, utilisez `--resume <session-id-or-title>` à la place.

Consultez la [unsloth start](/docs/fr/integrations/unsloth-start.md) référence pour la sélection du modèle, les connexions distantes et les options avancées.

L’assistant de configuration ci-dessous reste disponible si vous préférez gérer vous-même le fournisseur Hermes.

### 🔑 Création d’une clé API

1. Ouvrez la barre latérale, cliquez sur votre **Unsloth** avatar en bas à gauche.
2. Allez dans **Paramètres** → **API**.
3. Entrez un nom parlant (p. ex. `hermes-agent-macbook`).
4. *(Facultatif)* Définissez une date d’expiration.
5. Cliquez sur **Créer**.
6. **Copiez la clé immédiatement.** Unsloth ne stocke qu’un hachage et vous ne pourrez plus la consulter.

<figure><img src="/files/236f8680018f6e8f0517e6ead4329fe9f5efb49f" alt="" width="375"><figcaption></figcaption></figure>

Toutes les clés commencent par le `sk-unsloth-` préfixe. Révoquez une clé depuis cette même page à tout moment. Les requêtes effectuées avec une clé révoquée échoueront avec `401 Non autorisé`.

### 🦥 Intégrez Hermes avec l’API Unsloth

Hermes envoie chaque tour de conversation à un fournisseur d’inférence configuré et se connecte aux **Compatible avec OpenAI** points de terminaison. Configurez le fournisseur pendant l’installation ou plus tard dans l’assistant de configuration.

**1. Ouvrez l’assistant de configuration :**

{% columns %}
{% column %}

```bash
hermes setup
```

Choisissez **Modèle et fournisseur** dans le menu « Que souhaitez-vous faire ? » pour configurer uniquement le point de terminaison d’inférence, ou **Configuration complète** pour tout parcourir (TTS, outils, passerelle de messagerie, paramètres de l’agent).
{% endcolumn %}

{% column %}

<figure><img src="/files/cc70103e340a951295cdfc20b79fb5b4778b9706" alt="" width="539"><figcaption></figcaption></figure>
{% endcolumn %}
{% endcolumns %}

**2. Sélectionnez le point de terminaison personnalisé compatible OpenAI** quand Hermes vous demande un fournisseur d’inférence.

<figure><img src="/files/f5dfa2252272a652b70411e4c8509da2253f1f98" alt="" width="563"><figcaption></figcaption></figure>

**3. Renseignez les invites** au fur et à mesure qu’Hermes vous les présente :

| Invite                                      | Valeur                                                                |
| ------------------------------------------- | --------------------------------------------------------------------- |
| **URL de base de l’API**                    | `http://localhost:8888/v1` *(votre port Unsloth + `/v1`)*             |
| **Clé API**                                 | Vos `sk-unsloth-…` clé                                                |
| **Modèle détecté : … Utiliser ce modèle ?** | `Y` *(Hermes détecte automatiquement le modèle via `GET /v1/models`)* |
| **Longueur du contexte en tokens**          | *(laissez vide pour la détection automatique)*                        |
| **Nom d’affichage**                         | Ce que vous voulez, par ex. `unsloth-api`                             |

Hermes vérifie le point de terminaison par rapport à `/v1/models` et confirme le modèle détecté avant de continuer.

<figure><img src="/files/e75bf2f83feaa0ff0bb73d2cedc26a4c12a45612" alt=""><figcaption></figcaption></figure>

**4. Acceptez les valeurs par défaut pour les invites restantes** (TTS, outils, passerelle de messagerie, paramètres de l’agent) vous pourrez en reconfigurer chacun plus tard. Hermes écrit tout dans `~/.hermes/config.yaml` et `~/.hermes/.env`.

<figure><img src="/files/3fccf55c761dbd6ed66c2565341f5193a460d7a9" alt=""><figcaption></figcaption></figure>

**5. Lancez Hermes :**

```bash
hermes
```

La bannière de démarrage affiche le nom de votre modèle Unsloth dans la barre d’état (par ex. `unsloth/Qwen3.6-27B-GGUF`), et l’invite est prête pour la saisie.

<figure><img src="/files/d538070c65bb36cc80bd6e6885a45e1bd44cccc2" alt=""><figcaption></figcaption></figure>

{% hint style="info" %}
Pour reconfigurer uniquement le modèle plus tard, exécutez `hermes setup model`. Pour modifier directement le fichier de configuration, `hermes config edit` ouvre `~/.hermes/config.yaml` dans votre `$EDITOR`.
{% endhint %}

### Facultatif : ajuster le serveur Unsloth

`unsloth run` démarre le serveur API local et charge un modèle auquel votre application peut se connecter. Vous pouvez aussi personnaliser le comportement du serveur au démarrage.

```bash
# Servir Hermes (--disable-tools transmet les propres outils de l’agent)
unsloth run \\
  --model unsloth/gemma-4-26B-A4B-it-GGUF \
  --disable-tools \
  --reasoning off \
  -p 8888
```

{% hint style="warning" %}
Utilisez `--disable-tools` lors de l’utilisation de Hermes (ou de tout agent externe ayant ses propres outils). Par défaut, Unsloth Studio exécute ses propres outils côté serveur, ce qui absorbe les appels d’outils de l’agent, de sorte que Hermes répond mais n’exécute jamais ses outils. `--disable-tools` passe en mode passthrough, de sorte que les propres outils de Hermes sont utilisés.
{% endhint %}

Utilisez `--reasoning off` pour désactiver la réflexion, ou `--reasoning on` pour l’activer pour les modèles qui prennent en charge le raisonnement.

```bash
# Exposer l’API sur votre réseau local
unsloth run \\
  --model unsloth/gemma-4-26B-A4B-it-GGUF \
  -H 0.0.0.0 \\
  -p 8888
```

Cela démarre le serveur sur `0.0.0.0:8888`, permettant à d’autres appareils de votre réseau local de se connecter. `-p` modifie le port sur lequel le serveur s’exécute. Si vous souhaitez que des téléphones, ordinateurs portables ou d’autres appareils sur votre réseau se connectent au serveur API, lancez-le avec `-H 0.0.0.0`.

Certaines applications peuvent encore remplacer les paramètres de génération pour des requêtes individuelles. Pour une configuration d’exécution plus avancée, consultez le principal [optimisation de l’API](https://unsloth.ai/docs/basics/api#unsloth-run-command) section.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://unsloth.ai/docs/fr/integrations/hermes-agent.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.