# 基本

- [UnslothをAPIエンドポイントとして使う方法](https://unsloth.ai/docs/jp/ji-ben/api.md)
- [推論とデプロイ](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment.md): ファインチューニング済みモデルを保存して、お気に入りの推論エンジンで実行できるようにする方法を学びましょう。
- [GGUFへの保存](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/saving-to-gguf.md)
- [Speculative Decoding](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/saving-to-gguf/speculative-decoding.md): llama-server、llama.cpp、vLLMなどを使ったSpeculative Decodingで、推論を2倍高速化
- [vLLMデプロイメントと推論ガイド](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/vllm-guide.md): 本番環境でLLMを提供するために、LLMをvLLMへ保存・デプロイするためのガイド
- [vLLMエンジン引数](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/vllm-guide/vllm-engine-arguments.md)
- [LoRAホットスワッピングガイド](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/vllm-guide/lora-hot-swapping-guide.md)
- [Ollamaへの保存](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/saving-to-ollama.md)
- [LM Studioへのモデルデプロイ](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/lm-studio.md): LM Studioで実行・デプロイできるように、モデルをGGUFへ保存する方法
- [LinuxターミナルにLM Studio CLIをインストールする方法](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/lm-studio/how-to-install-lm-studio-cli-in-linux-terminal.md): ターミナル上でUIなしでLM Studio CLIをインストールするガイド。
- [SGLangデプロイメントと推論ガイド](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/sglang-guide.md): 本番環境でLLMを提供するために、LLMをSGLangへ保存・デプロイするためのガイド
- [Unsloth推論](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/unsloth-inference.md): Unslothの高速推論でファインチューニング済みモデルを実行する方法を学びましょう。
- [llama-serverとOpenAIエンドポイントのデプロイガイド](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/llama-server-and-openai-endpoint.md): OpenAI互換エンドポイントを備えたllama-server経由でのデプロイ
- [iOSまたはAndroidスマホでLLMを実行・デプロイする方法](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/deploy-llms-phone.md): 自分のLLMをファインチューニングし、ExecuTorchを使ってAndroidまたはiPhoneにデプロイするチュートリアル。
- [推論のトラブルシューティング](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/troubleshooting-inference.md): モデルの実行や保存で問題が発生している場合。
- [Hugging Face Jobsを使ったLLMのデプロイ](https://unsloth.ai/docs/jp/ji-ben/inference-and-deployment/deploying-llms-with-hugging-face-jobs.md): Hugging Face jobsとskillsを使って、SKILLを用いながらCodex / Claude CodeでLFMをファインチューニングする方法。
- [Claude CodeでローカルLLMを実行する方法](https://unsloth.ai/docs/jp/ji-ben/claude-code.md): ローカルデバイスでClaude Codeとオープンモデルを使うためのガイド。
- [OpenAI CodexでローカルLLMを実行する方法](https://unsloth.ai/docs/jp/ji-ben/codex.md): デバイス上でOpenAI Codexとオープンモデルをローカルで使います。
- [UnslothによるマルチGPUファインチューニング](https://unsloth.ai/docs/jp/ji-ben/multi-gpu-training-with-unsloth.md): Unslothを使って複数GPUと並列処理でLLMをファインチューニングする方法を学びましょう。
- [Distributed Data Parallel（DDP）によるマルチGPUファインチューニング](https://unsloth.ai/docs/jp/ji-ben/multi-gpu-training-with-unsloth/ddp.md): Unsloth CLIを使ってDistributed Data Parallel（DDP）で複数GPU学習を行う方法を学びましょう！
- [UnslothガイドによるEmbeddingモデルのファインチューニング](https://unsloth.ai/docs/jp/ji-ben/embedding-finetuning.md): Unslothを使ってEmbeddingモデルを簡単にファインチューニングする方法を学びましょう。
- [UnslothでMoEモデルを12倍高速にファインチューニング](https://unsloth.ai/docs/jp/ji-ben/faster-moe.md): Unslothガイドを使ってMoE LLMをローカルで学習しましょう。
- [Text-to-Speech（TTS）ファインチューニングガイド](https://unsloth.ai/docs/jp/ji-ben/text-to-speech-tts-fine-tuning.md): Unslothを使ってTTSとSTTの音声モデルをファインチューニングする方法を学びましょう。
- [Unsloth Dynamic 2.0 GGUF](https://unsloth.ai/docs/jp/ji-ben/unsloth-dynamic-2.0-ggufs.md): Dynamic Quantsの大きな新アップグレードです！
- [Aider Polyglot上のUnsloth Dynamic GGUF](https://unsloth.ai/docs/jp/ji-ben/unsloth-dynamic-2.0-ggufs/unsloth-dynamic-ggufs-on-aider-polyglot.md): Aider PolyglotベンチマークにおけるUnsloth Dynamic GGUFの性能
- [ローカルLLMのツール呼び出しガイド](https://unsloth.ai/docs/jp/ji-ben/tool-calling-guide-for-local-llms.md)
- [ビジョンファインチューニング](https://unsloth.ai/docs/jp/ji-ben/vision-fine-tuning.md): Unslothを使ってビジョン/マルチモーダルLLMをファインチューニングする方法を学びましょう
- [トラブルシューティングとFAQ](https://unsloth.ai/docs/jp/ji-ben/troubleshooting-and-faqs.md): 問題を解決するためのヒントと、よくある質問。
- [Hugging Face Hub、XETデバッグ](https://unsloth.ai/docs/jp/ji-ben/troubleshooting-and-faqs/hugging-face-hub-xet-debugging.md): デバッグ、停止したダウンロードのトラブルシューティング、遅いダウンロード
- [チャットテンプレート](https://unsloth.ai/docs/jp/ji-ben/chat-templates.md): 会話形式、ChatML、ShareGPT、Alpaca形式などを含む、チャットテンプレートの基本とカスタマイズオプションを学びましょう！
- [Unsloth環境フラグ](https://unsloth.ai/docs/jp/ji-ben/unsloth-environment-flags.md): ファインチューニングが壊れるのを見かけたときや、何かを無効化したいときに役立つ高度なフラグ。
- [継続事前学習](https://unsloth.ai/docs/jp/ji-ben/continued-pretraining.md): 継続ファインチューニングとも呼ばれます。Unslothを使うと継続的に事前学習でき、モデルが新しい言語を学習できます。
- [最後のチェックポイントからのファインチューニング](https://unsloth.ai/docs/jp/ji-ben/finetuning-from-last-checkpoint.md): チェックポイント保存により、ファインチューニングの進捗を保存して、一時停止してから続行できます。
- [Unslothベンチマーク](https://unsloth.ai/docs/jp/ji-ben/unsloth-benchmarks.md): NVIDIA GPU上で記録されたUnslothのベンチマーク。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/jp/ji-ben.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
