# 始める

- [Unslothドキュメント](https://unsloth.ai/docs/jp/meru/readme.md): Unslothは、モデルの実行と学習のためのオープンソースフレームワークです。
- [初心者向けファインチューニング](https://unsloth.ai/docs/jp/meru/fine-tuning-for-beginners.md)
- [Unslothの要件](https://unsloth.ai/docs/jp/meru/fine-tuning-for-beginners/unsloth-requirements.md): こちらは、システム要件とGPU VRAM要件を含むUnslothの要件です。
- [FAQ + ファインチューニングは私に向いていますか？](https://unsloth.ai/docs/jp/meru/fine-tuning-for-beginners/faq-+-is-fine-tuning-right-for-me.md): ファインチューニングが自分に合っているか迷っているなら、こちらをご覧ください！ファインチューニングの誤解、RAGとの比較などを学べます:
- [Unslothノートブック](https://unsloth.ai/docs/jp/meru/unsloth-notebooks.md): ファインチューニング用ノートブック: Unslothカタログを見てみましょう。
- [Unslothモデルカタログ](https://unsloth.ai/docs/jp/meru/unsloth-model-catalog.md)
- [Unslothのインストール](https://unsloth.ai/docs/jp/meru/install.md): Unslothをローカルまたはオンラインでインストールする方法を学びましょう。
- [pipとuvでUnslothをインストール](https://unsloth.ai/docs/jp/meru/install/pip-install.md): Pipを使ってローカルにUnslothをインストールするには、以下の手順に従ってください:
- [MacOSにUnslothをインストール](https://unsloth.ai/docs/jp/meru/install/mac.md)
- [Unslothを使ってWindowsでLLMをファインチューニングする方法（ステップバイステップガイド）](https://unsloth.ai/docs/jp/meru/install/windows-installation.md): ローカルでLLMのファインチューニングを始めるために、WindowsへのUnslothのインストール方法を確認しましょう。
- [DockerでUnslothをインストール](https://unsloth.ai/docs/jp/meru/install/docker.md): 公式Dockerコンテナを使ってUnslothをインストールします
- [Unslothの更新](https://unsloth.ai/docs/jp/meru/install/updating.md): Unslothを更新する、または古いバージョンを使うには、以下の手順に従ってください:
- [UnslothガイドでAMD GPU上のLLMをファインチューニング](https://unsloth.ai/docs/jp/meru/install/amd.md): Unslothを使ってAMD GPU上で大規模言語モデル（LLM）をファインチューニングする方法を学びましょう。
- [UnslothによるAMD AI強化学習ハッカソン](https://unsloth.ai/docs/jp/meru/install/amd/amd-hackathon.md): Unslothの開発者であるDaniel Hanから、AIモデル向け強化学習の実践的テクニックを学びましょう。
- [Unslothを使ってIntel GPU上のLLMをファインチューニング](https://unsloth.ai/docs/jp/meru/install/intel.md): Intel GPU上で大規模言語モデルを学習・ファインチューニングする方法を学びましょう。
- [Condaでインストール](https://unsloth.ai/docs/jp/meru/install/conda-install.md): Condaを使ってローカルにUnslothをインストールするには、以下の手順に従ってください:
- [UnslothとColab GPUを使ってVS CodeでLLMをファインチューニングする方法](https://unsloth.ai/docs/jp/meru/install/vs-code.md): UnslothとGoogle Colabを介してVisual Studio Code内で直接モデルをファインチューニングするガイド。
- [Google Colab](https://unsloth.ai/docs/jp/meru/install/google-colab.md): Google ColabでUnslothをインストールして実行するには、以下の手順に従ってください:
- [LLMファインチューニングガイド](https://unsloth.ai/docs/jp/meru/fine-tuning-llms-guide.md): ファインチューニングの基本とベストプラクティスをすべて学びましょう。初心者向けです。
- [データセットガイド](https://unsloth.ai/docs/jp/meru/fine-tuning-llms-guide/datasets-guide.md): ファインチューニング用データセットの作成と準備方法を学びましょう。
- [LoRAファインチューニングのハイパーパラメータガイド](https://unsloth.ai/docs/jp/meru/fine-tuning-llms-guide/lora-hyperparameters-guide.md): 最適なLLMファインチューニング設定をステップバイステップで学びましょう。LoRAのランクとalpha、エポック、バッチサイズ＋勾配蓄積、QLoRA対LoRA、対象モジュールなどを扱います。
- [どのモデルをファインチューニングに使うべきですか？](https://unsloth.ai/docs/jp/meru/fine-tuning-llms-guide/what-model-should-i-use.md)
- [チュートリアル: Llama-3をファインチューニングしてOllamaで使う方法](https://unsloth.ai/docs/jp/meru/fine-tuning-llms-guide/tutorial-how-to-finetune-llama-3-and-use-in-ollama.md): Ollama上でローカル実行するカスタマイズされた個人アシスタント（ChatGPTのようなもの）を作成する初心者向けガイド
- [強化学習（RL）ガイド](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide.md): 強化学習（RL）のすべてと、GRPOを使ってUnslothで自分のDeepSeek-R1推論モデルを学習する方法を学びましょう。初心者から上級者まで対応した完全ガイドです。
- [7倍長いコンテキストでの強化学習GRPO](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/grpo-long-context.md): Unslothがどのように超長文コンテキストのRLファインチューニングを可能にするかを学びましょう。
- [ビジョン強化学習（VLM RL）](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/vision-reinforcement-learning-vlm-rl.md): Unslothを使ってGRPOとRLでビジョン/マルチモーダルモデルを学習しましょう！
- [FP8強化学習](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/fp8-reinforcement-learning.md): UnslothでFP8精度による強化学習（RL）とGRPOを学習しましょう。
- [チュートリアル: GRPOで自分の推論モデルを学習する](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/tutorial-train-your-own-reasoning-model-with-grpo.md): UnslothとGRPOを使って、Llama 3.1（8B）のようなモデルを推論モデルへ変換する初心者向けガイド。
- [高度な強化学習ドキュメント](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/advanced-rl-documentation.md): UnslothをGRPOと併用する際の高度なドキュメント設定。
- [GSPO強化学習](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/advanced-rl-documentation/gspo-reinforcement-learning.md): UnslothでGSPO（Group Sequence Policy Optimization）RLを使って学習します。
- [RL報酬ハッキング](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/advanced-rl-documentation/rl-reward-hacking.md): 強化学習における報酬ハッキングとは何か、そしてそれを防ぐ方法を学びましょう。
- [RLにおけるFP16とBF16](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/advanced-rl-documentation/fp16-vs-bf16-for-rl.md): 「Defeating the Training-Inference Mismatch via FP16 https://arxiv.org/pdf/2510.26788」では、float16の使用がbfloat16より優れていることが示されています
- [メモリ効率の高いRL](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/memory-efficient-rl.md)
- [選好最適化学習 - DPO、ORPO、KTO](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/preference-dpo-orpo-and-kto.md): Unslothを使ってDPO、GRPO、ORPO、KTOによる選好アライメントのファインチューニングを学びましょう。以下の手順に従ってください:
- [RLでAIエージェントを学習する](https://unsloth.ai/docs/jp/meru/reinforcement-learning-rl-guide/training-ai-agents-with-rl.md): 強化学習（RL）を使って、実世界のタスク向けにAIエージェントを学習する方法を学びましょう。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/jp/meru.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
