> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/jp/tong-he/hermes-agent.md).

# Hermes AgentでローカルAIモデルを実行する方法

このガイドでは、次の方法でオープンLLMをローカルで実行できます **Hermes Agent** 経由で [**Unsloth**](https://github.com/unslothai/unsloth)。Hermes Agent は **オープンソースの** 自律型AIエージェントで、モデルのエンドポイントに接続し、タスクを実行し、記憶と学習したスキルを通じて時間とともに改善します。

これは任意の **ローカルモデル** に対応しており、Unsloth の **OpenAI互換API**を通じて公開されたものなら使用できます。たとえば DeepSeek、Qwen、Gemma などです。Hermes はエージェントクライアントとして機能し、Unsloth はローカルAPI経由でモデルを読み込み、提供します。

セットアップ後は、Hermes 経由で送信されるすべてのプロンプトが、リモートのプロバイダーではなくローカルモデルに対して実行されます。

<a href="https://sites.gitbook.com/preview/site_mXXTe/~/revisions/8qhhFNFFeOYycrfr36Ug/integrations/hermes-agent?theme=light#setup-hermes-agent" class="button primary" data-icon="caduceus">Hermes のセットアップ</a><a href="/pages/a624ad2fe3b378ac0bbfee74cfdda2550bac8b5d#integrate-hermes-agent-with-the-unsloth-studio-api" class="button primary">🦥 Unsloth でオープンモデルを使う</a>

{% hint style="info" %}
&#x20;このチュートリアルでは、Hermes をインストールし、次を使うように設定します `unsloth/Qwen3.6-27B-GGUF` Unsloth から提供されるモデルです。別のモデルを使いたいですか？Unsloth でそのモデルを読み込み、設定を更新すれば別のモデルに差し替えられます。
{% endhint %}

### <i class="fa-caduceus">:caduceus:</i> Hermes Agent のセットアップ

**前提条件。** インストーラーはこれらを確認し、欠けているものがあれば停止します。まず、まだ入っていないものをインストールしてください:

* **OS** Linux、macOS、または WSL 経由の Windows。
* **uv** Python パッケージマネージャー。次でインストールします `curl -LsSf https://astral.sh/uv/install.sh | sh`.
* **Python 3.11+** インストーラーはこれを次でプロビジョニングできます `uv` もし未インストールなら。
* **Git** Hermes リポジトリをクローンするため。
* **Node.js** Hermes のブラウザツール用に 18+。
* **ripgrep** (`rg`）で高速なファイル検索。
* **ffmpeg** TTS/音声メッセージ用。

#### **1. インストーラーを実行** を端末で:

```bash
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
```

インストーラーは次を行います:

1. OS を検出します。
2. 上記に列挙した各前提条件を確認し、それぞれに ✓ または ✗ を表示します。
3. Hermes を次にクローンします `~/.hermes/hermes-agent/` （GitHub の SSH キーが設定されていれば SSH 経由、そうでなければ HTTPS）。
4. 次に Python 3.11 の仮想環境を作成します `~/.hermes/hermes-agent/venv/`.
5. Hermes とすべての Python 依存関係をインストールします。
6. ブラウザツール用の Node.js 依存関係をインストールします。
7. Playwright の Chromium エンジンをインストールします。 **この手順では `sudo`** を要求します。これにより Playwright が共有ライブラリをインストールできます。Hermes 自体に root 権限は必要ありません。

<figure><img src="/files/071d33573fc82d5d392cf3d56b5d6008a29b1804" alt=""><figcaption></figcaption></figure>

#### **2. シェルを再読み込み** して `hermes` コマンドが `PATH`:

{% code title="bash" %}

```bash
source ~/.bashrc
```

{% endcode %}

{% code title="zsh" %}

```bash
source ~/.zshrc
```

{% endcode %}

#### **3. インストールを確認:**

```bash
hermes --version
```

コマンドが解決できれば、Hermes はインストールされています。すべては次の下にあります `~/.hermes/`:

| パス                                      | 内容                           |
| --------------------------------------- | ---------------------------- |
| `~/.hermes/config.yaml`                 | 主な設定（モデル、プロバイダー、ツール、TTS など）  |
| `~/.hermes/.env`                        | APIキーやその他の秘密情報               |
| `~/.hermes/hermes-agent/`               | Hermes のソース + 仮想環境           |
| `~/.hermes/cron/`, `sessions/`, `logs/` | 実行時データ                       |
| `~/.hermes/skills/`                     | インストール済みスキル（Skills Hub から同期） |

{% hint style="info" %}
インストールの完全な参照: [hermes-agent.nousresearch.com/docs/getting-started/installation](https://hermes-agent.nousresearch.com/docs/getting-started/installation)。インストーラーが不足している前提条件を報告した場合は、それをインストールしてから、そのワンライナーを再実行してください。インストーラーは冪等です。
{% endhint %}

### Unsloth のインストール

### ⚡ クイックスタート

OpenCode をインストールした後、OpenCode がローカルモデルの推論を提供・実行できるようにするため、Unsloth Studio をインストールする必要があります。

1. **Unsloth Studio をインストールまたは更新します。** 以前のバージョンでは外部APIが公開されません。インストールを参照してください。
2. **Unsloth を起動します。** 起動時のポート番号は通常 `8000` または `8888`です。これは端末の出力とブラウザのURL（`http://localhost:PORT`).
3. **モデルを読み込みます。** クリック **New Chat**を選び、モデル（GGUF）を選択または検索して、読み込み完了まで待ちます。
4. **APIキーを作成します。** Unsloth で、左下の **Unsloth** アバターをクリック → **設定** → **API** → キー名を入力 → **作成**。表示された `sk-unsloth-…` の値をコピーします。Unsloth で表示されるのは一度だけです。
5. **クライアントを Unsloth に向けます。** 次を使います `http://localhost:PORT` をベースURLとして、 `sk-unsloth-…` を認証用キーにします。下のツール別レシピへ進んでください。

### 🔑 APIキーの作成

1. サイドバーを開き、左下の **Unsloth** アバターをクリックします。
2. 次へ移動 **設定** → **API**.
3. 親しみやすい名前を入力します（例: `claude-code-macbook`).
4. *（任意）* 有効期限を設定します。
5. クリック **作成**.
6. **すぐにキーをコピーします。** Unsloth はハッシュのみを保存するため、再度表示することはできません。

<figure><img src="/files/56897ad32966d1081797ea8ccf97a7df82f0a550" alt="" width="375"><figcaption></figcaption></figure>

すべてのキーは次で始まります `sk-unsloth-` というプレフィックスです。キーの失効は同じページからいつでも行えます。失効したキーで行われたリクエストは `401 Unauthorized`.

{% hint style="warning" %}
APIキーはパスワードのように扱ってください。キーと Unsloth インスタンスへのネットワークアクセスを持つ人なら誰でも、読み込まれたモデルにリクエストを送信できます。
{% endhint %}

### 🦥 Hermes を Unsloth API に統合

Hermes は各チャットターンを設定済みの推論プロバイダーに送り、 **OpenAI互換の** エンドポイントに接続します。プロバイダーはインストール中または後でセットアップウィザードで設定できます。

**1. セットアップウィザードを開く:**

```bash
hermes setup
```

選択 **Model & Provider** を「What would you like to do?」メニューから選び、推論エンドポイントのみを設定します。あるいは **Full Setup** を選んで、すべて（TTS、ツール、メッセージングゲートウェイ、エージェント設定）を順に設定します。

<figure><img src="/files/8d562d084a84ddd43bb546a3d41ce6f053a32b1a" alt="" width="563"><figcaption></figcaption></figure>

**2. カスタム OpenAI 互換エンドポイントを選択** Hermes が推論プロバイダーを尋ねたときに。

<figure><img src="/files/1aae32d6cd7ec15ef3863c6c765ea8738b10ea13" alt="" width="563"><figcaption></figcaption></figure>

**3. プロンプトに入力** Hermes の案内に従って:

| プロンプト                         | 値                                                   |
| ----------------------------- | --------------------------------------------------- |
| **API ベースURL**                | `http://localhost:8888/v1` *（Unsloth のポート + `/v1`)* |
| **APIキー**                     | あなたの `sk-unsloth-…` キー                              |
| **検出されたモデル: … このモデルを使用しますか?** | `Y` *（Hermes は次でモデルを自動検出します `GET /v1/models`)*      |
| **トークン単位のコンテキスト長**            | *（自動検出するには空欄のまま）*                                   |
| **表示名**                       | 好きな名前で構いません。例: `unsloth-api`                        |

Hermes は次に対してエンドポイントを検証します `/v1/models` を確認し、続行する前に検出されたモデルを確定します。

<figure><img src="/files/ec3e51aef408df3e9d9ae856c012c906b9e5fa1b" alt=""><figcaption></figcaption></figure>

**4. 残りのプロンプトではデフォルトを قبول** （TTS、ツール、メッセージングゲートウェイ、エージェント設定）は後で再設定できます。Hermes はすべてを書き込みます `~/.hermes/config.yaml` および `~/.hermes/.env`.

<figure><img src="/files/fb8126221234da24ea2ab9168f668fa176011a07" alt=""><figcaption></figcaption></figure>

**5. Hermes を起動:**

```bash
hermes
```

起動バナーにはステータスバーに Unsloth のモデル名が表示されます（例: `unsloth/Qwen3.6-27B-GGUF`）、そしてプロンプトは入力待ちになります。

<figure><img src="/files/f3850832a3cb2c97985634a0ffb3536adcedbb4c" alt=""><figcaption></figcaption></figure>

{% hint style="info" %}
後でモデルだけを再設定するには、次を実行します `hermes setup model`。設定ファイルを直接編集するには、 `hermes config edit` を開きます `~/.hermes/config.yaml` あなたの `$EDITOR`.
{% endhint %}

### 任意: Unsloth サーバーを調整する

`unsloth run` はローカルAPIサーバーを起動し、アプリが接続するためのモデルを読み込みます。起動時のサーバーの動作もカスタマイズできます。

```bash
# 推論を無効にしてポート 8888 で実行
unsloth run \
  --model unsloth/gemma-4-26B-A4B-it-GGUF \
  --reasoning off \
  -p 8888
```

次を使います `--reasoning off` で思考をオフにするか、 `--reasoning on` で、推論をサポートするモデルでそれを有効にします。

```bash
# ローカルネットワーク上にAPIを公開
unsloth run \
  --model unsloth/gemma-4-26B-A4B-it-GGUF \
  -H 0.0.0.0 \
  -p 8888
```

これによりサーバーは `0.0.0.0:8888`で起動し、同じローカルネットワーク上の他のデバイスが接続できるようになります。 `-p` はサーバーの実行ポートを変更します。ネットワーク上のスマートフォン、ノートPC、その他のデバイスをAPIサーバーに接続したい場合は、次を付けて起動してください `-H 0.0.0.0`.

一部のアプリは、個々のリクエストに対して生成設定を上書きすることがあります。より高度な実行時設定については、メインの [API調整](https://unsloth.ai/docs/basics/api#unsloth-run-command) セクションを参照してください。


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/jp/tong-he/hermes-agent.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
