hexagonCogito v2.1: ローカル実行ガイド

Cogito v2.1 LLM は IDA で学習された世界最強クラスのオープンモデルのひとつです。v1 は 70B、109B、405B、671B の 4 サイズがあり、ハードウェアに最適なサイズを選べます。

circle-check

Cogito v2.1 は 1 つの 671B MoE サイズで提供され、Cogito v2 Preview は Deep Cogitoarrow-up-rightのモデル公開は 70B から 671B までの 4 つのモデルサイズに及びます。これらは IDA(反復蒸留と増幅)を用いることで、推論時に単により長く探索する(DeepSeek R1 のように)のではなく、反復的な方策改善を用いてモデルが推論プロセスを内在化する形で訓練されています。

Deep Cogito の所在地は 米国サンフランシスコarrow-up-right (Unsloth のように 🇺🇸)で、4 つのモデルサイズすべてについて量子化された動的モデルを提供できることを嬉しく思います!すべてのアップロードは Unsloth を使用して Dynamic 2.0 SOTA の 5-shot MMLU と KL 発散性能を達成しており、これによりこれらの LLM を量子化したまま最小限の精度低下で実行および微調整できます!

チュートリアル ナビゲーション:

671B MoE を実行109B MoE を実行405B Dense を実行70B Dense を実行

circle-check

💎 モデルサイズとアップロード

モデルサイズは 4 つあります:

  1. Llama ベースの 2 つの Dense モデル - 70B と 405B

  2. Llama 4 Scout(109B)および DeepSeek R1(671B)をベースとした 2 つの MoE モデル

モデルサイズ
推奨量子化&リンク
ディスクサイズ
アーキテクチャ
circle-check

🐳 llama.cpp で Cogito 671B MoE を実行する

  1. 最新の llama.cppGitHubで入手してくださいarrow-up-right。以下のビルド手順にも従うことができます。を変更してください -DGGML_CUDA=ON-DGGML_CUDA=OFF GPUを持っていない場合やCPUで推論したい場合は Apple Mac / Metalデバイスの場合、次を設定してください -DGGML_CUDA=OFF その後通常通り続行してください — Metalサポートはデフォルトで有効です。

  1. もし直接 llama.cpp モデルを直接ロードするには、下記を行えます:(:IQ1_S)は量子化タイプです。Hugging Face(ポイント 3)からもダウンロードできます。これは以下と類似しています ollama run に類似しています。 使用してください export LLAMA_CACHE="folder" llama.cpp 特定の場所に保存するために。

circle-check
  1. モデルをダウンロードするには(をインストールした後) モデルをダウンロードするには( を選択できます。 UD-IQ1_S(動的 1.78bit 量子化)や他の量子化バージョンのような Q4_K_M Q4_K_XL などの他の量子化版です。私たちは サイズと精度のバランスを取るために私たちの2.7ビット動的量子化を UD-Q2_K_XLなどがあります。さらに多くのバージョンは: https://huggingface.co/unsloth/cogito-671b-v2.1-GGUFarrow-up-right

  1. 編集 次の --threads 32 はCPUスレッドの数、 --ctx-size 16384 はコンテキスト長、 --n-gpu-layers 2

🖱️llama.cpp で Cogito 109B MoE を実行する

  1. 上記の 671B モデルを実行する際の手順に従ってください 上記の 671B モデル.

  2. その後、以下を実行してください:

🌳llama.cpp で Cogito 405B Dense を実行する

  1. 上記の 671B モデルを実行する際の手順に従ってください 上記の 671B モデル.

  2. その後、以下を実行してください:

😎 llama.cpp で Cogito 70B Dense を実行する

  1. 上記の 671B モデルを実行する際の手順に従ってください 上記の 671B モデル.

  2. その後、以下を実行してください:

print(completion.choices[0].message.content) https://www.deepcogito.com/research/cogito-v2-1arrow-up-right 詳細はこちら

最終更新

役に立ちましたか?