> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/fr/integrations/hermes-agent.md).

# Comment exécuter des modèles IA locaux avec Hermes Agent

Ce guide vous permet d’exécuter des LLM ouverts localement avec **Hermes Agent** via [**Unsloth**](https://github.com/unslothai/unsloth). Hermes Agent est un **open source** agent IA autonome qui se connecte à un point de terminaison de modèle, exécute des tâches et s’améliore au fil du temps grâce à sa mémoire et à des compétences apprises.

Il fonctionne avec n’importe quel **modèle local** exposé via l’ **API compatible OpenAI**, notamment : DeepSeek, Qwen, Gemma, et plus encore. Hermes agit comme client agent, tandis qu’Unsloth charge et sert les modèles via une API locale.

Une fois la configuration terminée, chaque prompt envoyé via Hermes s’exécutera sur votre modèle local au lieu d’un fournisseur distant.

<a href="https://sites.gitbook.com/preview/site_mXXTe/~/revisions/8qhhFNFFeOYycrfr36Ug/integrations/hermes-agent?theme=light#setup-hermes-agent" class="button primary" data-icon="caduceus">Configurer Hermes</a><a href="/pages/b6a49cae84f0f86f978aafa589d0d905608eb666#integrate-hermes-agent-with-the-unsloth-studio-api" class="button primary">🦥 Utiliser des modèles ouverts avec Unsloth</a>

{% hint style="info" %}
&#x20;Dans ce tutoriel, vous installerez Hermes et le configurerez pour utiliser `unsloth/Qwen3.6-27B-GGUF` servi depuis Unsloth. Vous préférez un autre modèle ? Remplacez-le par n’importe quel autre modèle en le chargeant dans Unsloth et en mettant à jour la configuration.
{% endhint %}

### <i class="fa-caduceus">:caduceus:</i> Configurer Hermes Agent

**Prérequis.** L’installateur les vérifie et s’arrête si l’un d’eux manque. Installez d’abord ce qui n’est pas déjà présent sur votre machine :

* **SE** Linux, macOS ou Windows via WSL.
* **uv** Gestionnaire de paquets Python. Installez-le avec `curl -LsSf https://astral.sh/uv/install.sh | sh`.
* **Python 3.11+** l’installateur peut le provisionner via `uv` s’il est manquant.
* **Git** pour cloner le dépôt Hermes.
* **Node.js** 18+ pour les outils de navigateur d’Hermes.
* **ripgrep** (`rg`) pour une recherche rapide dans les fichiers.
* **ffmpeg** pour la synthèse vocale / les messages vocaux.

#### **1. Exécutez l’installateur** dans un terminal :

```bash
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
```

L’installateur va :

1. Détecter votre système d’exploitation.
2. Vérifier chaque prérequis listé ci-dessus et afficher un ✓ ou un ✗ pour chacun.
3. Cloner Hermes dans `~/.hermes/hermes-agent/` (via SSH si une clé SSH GitHub est configurée, sinon via HTTPS).
4. Créer un environnement virtuel Python 3.11 à `~/.hermes/hermes-agent/venv/`.
5. Installer Hermes et toutes les dépendances Python.
6. Installer les dépendances Node.js pour les outils de navigateur.
7. Installer le moteur Chromium de Playwright. **Cette étape demande `sudo`** afin que Playwright puisse installer des bibliothèques partagées. Hermes lui-même ne nécessite pas les privilèges root.

<figure><img src="/files/7006d8db56ed7b2400b44d6b190317f805499a05" alt=""><figcaption></figcaption></figure>

#### **2. Rechargez votre shell** pour que la commande `hermes` soit disponible dans votre `PATH`:

{% code title="bash" %}

```bash
source ~/.bashrc
```

{% endcode %}

{% code title="zsh" %}

```bash
source ~/.zshrc
```

{% endcode %}

#### **3. Vérifiez l’installation :**

```bash
hermes --version
```

Si la commande est résolue, Hermes est installé. Tout se trouve sous `~/.hermes/`:

| Chemin                                  | Ce que c’est                                                |
| --------------------------------------- | ----------------------------------------------------------- |
| `~/.hermes/config.yaml`                 | Paramètres principaux (modèle, fournisseur, outils, TTS, …) |
| `~/.hermes/.env`                        | Clés API et autres secrets                                  |
| `~/.hermes/hermes-agent/`               | Le code source d’Hermes + l’environnement virtuel           |
| `~/.hermes/cron/`, `sessions/`, `logs/` | Données d’exécution                                         |
| `~/.hermes/skills/`                     | Compétences installées (synchronisées depuis le Skills Hub) |

{% hint style="info" %}
Référence complète d’installation : [hermes-agent.nousresearch.com/docs/getting-started/installation](https://hermes-agent.nousresearch.com/docs/getting-started/installation). Si l’installateur signale un prérequis manquant, installez-le et relancez la commande en une ligne. L’installateur est idempotent.
{% endhint %}

### Installation d’Unsloth

### ⚡ Démarrage rapide

Après avoir installé OpenCode, nous devrons installer Unsloth Studio pour permettre à OpenCode de servir et d’exécuter l’inférence des modèles locaux.

1. **Installez ou mettez à jour Unsloth Studio.** Les versions antérieures n’exposent pas l’API externe. Voir Installation.
2. **Lancez Unsloth.** Notez que le port de démarrage est généralement `8000` ou `8888`. Vous le verrez dans la sortie du terminal et dans l’URL du navigateur (`http://localhost:PORT`).
3. **Chargez un modèle.** Cliquez sur **Nouvelle conversation**, sélectionnez ou recherchez un modèle (GGUF), et attendez la fin du chargement.
4. **Créez une clé API.** Dans Unsloth, cliquez sur votre **Unsloth** avatar en bas à gauche → **Paramètres** → **API** → saisissez un nom de clé → **Créer**. Copiez la `sk-unsloth-…` valeur qui apparaît. Unsloth ne l’affiche qu’une seule fois.
5. **Configurez votre client pour pointer vers Unsloth.** Utilisez `http://localhost:PORT` comme URL de base et votre `sk-unsloth-…` clé pour l’authentification. Passez à la procédure correspondant à votre outil ci-dessous.

### 🔑 Création d’une clé API

1. Ouvrez la barre latérale, cliquez sur votre **Unsloth** avatar en bas à gauche.
2. Accédez à **Paramètres** → **API**.
3. Entrez un nom explicite (p. ex. `claude-code-macbook`).
4. *(Facultatif)* Définissez une expiration.
5. Cliquez sur **Créer**.
6. **Copiez immédiatement la clé.** Unsloth ne stocke qu’un hachage et vous ne pourrez plus la consulter.

<figure><img src="/files/236f8680018f6e8f0517e6ead4329fe9f5efb49f" alt="" width="375"><figcaption></figcaption></figure>

Toutes les clés commencent par le `sk-unsloth-` préfixe. Révoquez une clé depuis la même page à tout moment. Les requêtes effectuées avec une clé révoquée échoueront avec `401 Unauthorized`.

{% hint style="warning" %}
Traitez votre clé API comme un mot de passe. Toute personne disposant de la clé et d’un accès réseau à votre instance Unsloth peut envoyer des requêtes à votre modèle chargé.
{% endhint %}

### 🦥 Intégrer Hermes à l’API Unsloth

Hermes envoie chaque tour de conversation à un fournisseur d’inférence configuré et se connecte à **compatible OpenAI** points de terminaison. Configurez le fournisseur lors de l’installation ou plus tard dans l’assistant de configuration.

**1. Ouvrez l’assistant de configuration :**

```bash
hermes setup
```

Choisissez **Modèle et fournisseur** dans le menu « Que souhaitez-vous faire ? » pour configurer uniquement le point de terminaison d’inférence, ou **Configuration complète** pour tout configurer (TTS, outils, passerelle de messagerie, paramètres de l’agent).

<figure><img src="/files/e16fff64767661967d6e3aeadbab88bfc6e28c32" alt="" width="563"><figcaption></figcaption></figure>

**2. Sélectionnez le point de terminaison personnalisé compatible OpenAI** quand Hermes vous demande un fournisseur d’inférence.

<figure><img src="/files/f5dfa2252272a652b70411e4c8509da2253f1f98" alt="" width="563"><figcaption></figcaption></figure>

**3. Renseignez les invites** au fur et à mesure qu’Hermes les parcourt :

| Invite                                      | Valeur                                                                |
| ------------------------------------------- | --------------------------------------------------------------------- |
| **URL de base de l’API**                    | `http://localhost:8888/v1` *(votre port Unsloth + `/v1`)*             |
| **Clé API**                                 | Votre `sk-unsloth-…` clé                                              |
| **Modèle détecté : … Utiliser ce modèle ?** | `Y` *(Hermes détecte automatiquement le modèle via `GET /v1/models`)* |
| **Longueur du contexte en jetons**          | *(laissez vide pour la détection automatique)*                        |
| **Nom d’affichage**                         | Ce que vous voulez, p. ex. `unsloth-api`                              |

Hermes vérifie le point de terminaison via `/v1/models` et confirme le modèle détecté avant de continuer.

<figure><img src="/files/e75bf2f83feaa0ff0bb73d2cedc26a4c12a45612" alt=""><figcaption></figcaption></figure>

**4. Acceptez les valeurs par défaut pour les invites restantes** (TTS, outils, passerelle de messagerie, paramètres de l’agent) ; vous pourrez les reconfigurer plus tard. Hermes écrit tout dans `~/.hermes/config.yaml` et `~/.hermes/.env`.

<figure><img src="/files/3fccf55c761dbd6ed66c2565341f5193a460d7a9" alt=""><figcaption></figcaption></figure>

**5. Lancez Hermes :**

```bash
hermes
```

La bannière de démarrage affiche le nom de votre modèle Unsloth dans la barre d’état (p. ex. `unsloth/Qwen3.6-27B-GGUF`), et l’invite est prête à recevoir une entrée.

<figure><img src="/files/d538070c65bb36cc80bd6e6885a45e1bd44cccc2" alt=""><figcaption></figcaption></figure>

{% hint style="info" %}
Pour reconfigurer uniquement le modèle plus tard, exécutez `hermes setup model`. Pour modifier directement le fichier de configuration, `hermes config edit` ouvre `~/.hermes/config.yaml` dans votre `$EDITOR`.
{% endhint %}

### Facultatif : ajuster le serveur Unsloth

`unsloth run` démarre le serveur API local et charge un modèle auquel votre application peut se connecter. Vous pouvez aussi personnaliser le comportement du serveur au démarrage.

```bash
# Désactiver le raisonnement et exécuter sur le port 8888
unsloth run \
  --model unsloth/gemma-4-26B-A4B-it-GGUF \
  --reasoning off \
  -p 8888
```

Utilisez `--reasoning off` pour désactiver la réflexion, ou `--reasoning on` pour l’activer pour les modèles qui prennent en charge le raisonnement.

```bash
# Exposer l’API sur votre réseau local
unsloth run \
  --model unsloth/gemma-4-26B-A4B-it-GGUF \
  -H 0.0.0.0 \
  -p 8888
```

Cela démarre le serveur sur `0.0.0.0:8888`, permettant à d’autres appareils de votre réseau local de s’y connecter. `-p` modifie le port sur lequel le serveur s’exécute. Si vous voulez que des téléphones, ordinateurs portables ou autres appareils de votre réseau se connectent au serveur API, démarrez-le avec `-H 0.0.0.0`.

Certaines applications peuvent encore remplacer les paramètres de génération pour des requêtes individuelles. Pour une configuration d’exécution plus avancée, voir la section principale [Ajustement de l’API](https://unsloth.ai/docs/basics/api#unsloth-run-command) .


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/fr/integrations/hermes-agent.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
