For the complete documentation index, see llms.txt. This page is also available as Markdown.

🦥Unslothドキュメント

Unslothは、モデルの実行と学習のためのオープンソースフレームワークです。

Unslothを使うと、オープンソースのUIを通じて、自分のローカルハードウェア上でAIモデルを実行・学習できます。

当社のドキュメントが、ローカルで自分のLLMを実行・学習する手順を案内します。

始める 私たちのGitHub

DiffusionGemma

Googleの新しい拡散テキストモデルを実行・学習。

MTPガイド

Qwen3.6とGemma 4を約2倍高速に実行!

Gemma 4 QAT

メモリ使用量が3倍少なく、精度はほぼ元のまま。

🦥 なぜUnsloth?

⭐ 機能

Unslothを使うと、テキスト用のモデルを実行・学習できます、 音声, 埋め込み, ビジョン など。Unslothは、推論と学習の両方に役立つ多くの重要機能を提供します:

推論

学習

  • 学習し RL 500以上のモデルを約2倍高速に、VRAM使用量を約70%削減して(精度低下なし)

  • フルファインチューニング、事前学習、4ビット、16ビット、FP8学習をサポート。

  • データセットを自動作成 PDF、CSV、DOCXファイルから。視覚的なノードワークフローでデータを編集。

  • 可観測性: 学習をライブ監視、lossの追跡、GPU使用率の確認、グラフのカスタマイズ

  • 最も効率的な 強化学習 ライブラリ。GRPOで必要なVRAMを80%削減し、 FP8 など。

  • マルチGPU は動作しますが、もっと良いバージョンが登場予定です!

クイックスタート

UnslothはMacOS、Linux、 Windows, NVIDIA、Intel、CPU環境をサポートしています。こちらを参照: Unslothの要件。更新には同じコマンドを使用してください:

MacOS、Linux、WSL:

Windows PowerShell:

Docker

公式の Dockerイメージ: unsloth/unsloth これは現在Windows、WSL、Linuxで動作します。MacOS対応は近日公開予定です。

ファインチューニングとRLとは?なぜ?

ファインチューニング LLMを すると、その振る舞いをカスタマイズし、ドメイン知識を強化し、特定タスク向けに性能を最適化できます。データセット上で事前学習済みモデル(例: Llama-3.1-8B)をファインチューニングすることで、次のことが可能です:

  • 知識を更新する: 新しいドメイン固有の情報を導入する。

  • 振る舞いをカスタマイズする: モデルの口調、性格、応答スタイルを調整する。

  • タスク向けに最適化する: 特定のユースケースでの精度と関連性を向上させる。

強化学習(RL) とは、"エージェント"が環境と相互作用しながら意思決定を学び、 フィードバック という形で 報酬 または 罰則.

  • 行動: モデルが生成するもの(例: 1文)。

  • 報酬: モデルの行動がどれだけ良かったか悪かったかを示すシグナル(例: 応答が指示に従っていたか?役に立ったか?)。

  • 環境: モデルが取り組んでいるシナリオまたはタスク(例: ユーザーの質問に答えること)。

ファインチューニングまたはRLの使用例:

  • 見出しが企業にとってプラスかマイナスかをLLMが予測できるようにします。

  • 過去の顧客対応を使って、より正確で個別化された応答が可能です。

  • 契約分析、判例調査、コンプライアンスのために、法律文書でLLMをファインチューニングできます。

ファインチューニング済みモデルは、特定のタスクをより効果的かつ効率的に行うために設計された専用エージェントだと考えるとよいでしょう。 ファインチューニングはRAGの機能をすべて再現できますが、逆は成り立ちません。

最終更新

役に立ちましたか?