Cogito v2.1: ローカル実行方法

Cogito v2.1 LLMは、IDAで学習された世界最強クラスのオープンモデルの一つです。またv1は70B、109B、405B、671Bの4サイズがあり、自分のハードウェアに最も合うサイズを選べます。

Cogito v2.1 は 1 種類の 671B MoE サイズで提供され、一方 Cogito v2 Preview は Deep Cogitoのモデル公開は、70B から 671B までの 4 つのモデルサイズに及びます。 IDA(Iterated Distillation & Amplification)を用いることで、これらのモデルは、推論時に単により長く探索するのではなく(DeepSeek R1 のように)、反復的な方策改善を用いて推論過程をモデル内部に内面化するよう訓練されています。

Deep Cogito は 米国サンフランシスコに拠点を置いています (Unsloth のように 🇺🇸)そして、4 つすべてのモデルサイズ向けに量子化された動的モデルを提供できることを嬉しく思います! すべてのアップロードは Unsloth Dynamic 2.0 を使用しており、SOTA の 5-shot MMLU と KL Divergence の性能を実現しています。つまり、最小限の精度低下で、これらの LLM を量子化したまま実行・ファインチューニングできます!

チュートリアルのナビゲーション:

671B MoE を実行109B MoE を実行405B Dense を実行70B Dense を実行

💎 モデルサイズとアップロード

モデルサイズは 4 種類あります:

  1. Llama ベースの Dense モデルが 2 種類 - 70B と 405B

  2. Llama 4 Scout(109B)と DeepSeek R1(671B)をベースにした MoE モデルが 2 種類

モデルサイズ
推奨 Quant & リンク
ディスクサイズ
アーキテクチャ

70B Dense

44GB

Llama 3 70B

109B MoE

50GB

Llama 4 Scout

405B Dense

152GB

Llama 3 405B

671B MoE

251GB

DeepSeek R1

🐳 llama.cpp で Cogito 671B MoE を実行

  1. 最新の llama.cppGitHub こちらから取得してください。以下のビルド手順に従うこともできます。 -DGGML_CUDA=ON-DGGML_CUDA=OFF に変更してください。GPU がない場合、または CPU 推論だけを使いたい場合です。 Apple Mac / Metal デバイスの場合、次を設定して -DGGML_CUDA=OFF その後は通常どおり続けてください - Metal サポートは既定で有効です。

  1. もし llama.cpp モデルを直接読み込むには、以下のようにできます。(:IQ1_S) は量子化タイプです。Hugging Face からもダウンロードできます(ポイント 3)。これは次のものに似ています ollama run に似ています。使用 export LLAMA_CACHE="folder" して llama.cpp 特定の場所に保存するために。

  1. モデルのダウンロード( pip install huggingface_hub hf_transfer のインストール後)。 UD-IQ1_S(動的 1.78bit 量子化)または次のような他の量子化版 Q4_K_M 私たちは 当社の 2.7bit 動的量子化版の使用を推奨します UD-Q2_K_XL サイズと精度のバランスを取るためです。その他のバージョンはこちら: https://huggingface.co/unsloth/cogito-671b-v2.1-GGUF

  1. 編集 --threads 32 CPU スレッド数を --ctx-size 16384 コンテキスト長を --n-gpu-layers 2 GPU オフロードする層数を指定します。GPU のメモリ不足になる場合は調整してみてください。CPU のみで推論する場合は、これも削除してください。

🖱️llama.cpp で Cogito 109B MoE を実行

  1. その後、以下を実行します:

🌳llama.cpp で Cogito 405B Dense を実行

  1. その後、以下を実行します:

😎 llama.cpp で Cogito 70B Dense を実行

  1. その後、以下を実行します:

参照 https://www.deepcogito.com/research/cogito-v2-1 詳細はこちら

最終更新

役に立ちましたか?