For the complete documentation index, see llms.txt. This page is also available as Markdown.

🐱Ministral 3 - Leitfaden zum Ausführen

Leitfaden für Mistral-Ministral-3-Modelle, um sie lokal auf deinem Gerät auszuführen oder feinabzustimmen

Mistral veröffentlicht Ministral 3, ihre neuen multimodalen Modelle in den Varianten Base, Instruct und Reasoning, verfügbar in 3B, 8Bund 14B Größen. Sie bieten erstklassige Leistung für ihre Größe und sind für Anwendungsfälle wie Anweisungen und Chat feinabgestimmt. Die multimodalen Modelle unterstützen 256K Kontext Fenster, mehrere Sprachen, native Funktionsaufrufe und JSON-Ausgabe.

Das vollständige, nicht quantisierte Modell 14B Ministral-3-Instruct-2512 passt in 24 GB RAM/VRAM. Sie können jetzt alle Ministral-3-Modelle mit Unsloth ausführen, feinabstimmen und RL darauf anwenden:

Ministral-3-Tutorials ausführenMinistral 3 feinabstimmen

Wir haben außerdem Mistral Large 3 hochgeladen GGUFs zu. Für alle Ministral-3-Uploads (BnB, FP8), sehen Sie hier.

Ministral-3-Instruct GGUFs:
Ministral-3-Reasoning GGUFs:

3B8B14B

3B8B14B

⚙️ Nutzungsanleitung

Um eine optimale Leistung für Instructzu erzielen, empfiehlt Mistral die Verwendung niedrigerer Temperaturen wie temperature = 0.15 oder 0.1

Für Reasoningempfiehlt Mistral temperature = 0.7 und top_p = 0.95.

Instruct:
Reasoning:

Temperatur = 0,15 oder 0.1

Temperatur = 0,7

Top_P = Standard

Top_P = 0,95

Angemessene Ausgabelänge: Verwenden Sie eine Ausgabelänge von 32,768 Tokens für die meisten Abfragen für die Reasoning-Variante und 16,384 für die Instruct-Variante. Bei Bedarf können Sie die maximale Ausgabegröße für das Reasoning-Modell erhöhen.

Die maximale Kontextlänge, die Ministral 3 erreichen kann, ist 262,144

Das Chat-Template-Format findet man, wenn man die folgende Verwendung nutzt:

tokenizer.apply_chat_template([
    {"role" : "user", "content" : "Was ist 1+1?"},
    {"role" : "assistant", "content" : "2"},
    {"role" : "user", "content" : "Was ist 2+2?"}
    ], add_generation_prompt = True
)

Ministral Reasoning Chat-Template:

Ministral Instruct Chat-Template:

📖 Ministral-3-Tutorials ausführen

Unten sind Anleitungen für die Reasoning und Instruct Varianten des Modells.

Instruct: Ministral-3-Instruct-2512

Um eine optimale Leistung für Instructzu erzielen, empfiehlt Mistral die Verwendung niedrigerer Temperaturen wie temperature = 0.15 oder 0.1

Llama.cpp: Tutorial zum Ausführen von Ministral-3-14B-Instruct

1

Hole dir die neueste llama.cpp auf GitHub hier. Du kannst auch den untenstehenden Build-Anweisungen folgen. Ändere -DGGML_CUDA=ON zu -DGGML_CUDA=OFF wenn du keine GPU hast oder nur CPU-Inferenz möchtest. Für Apple Mac / Metal-Geräte, setze -DGGML_CUDA=OFF und fahre dann wie gewohnt fort - Metal-Unterstützung ist standardmäßig aktiviert.

2

Sie können direkt von Hugging Face ziehen über:

3

Lade das Modell herunter über (nach der Installation von pip install huggingface_hub hf_transfer ). Du kannst UD_Q4_K_XL oder andere quantisierte Versionen auswählen.

Reasoning: Ministral-3-Reasoning-2512

Um eine optimale Leistung für Reasoningempfiehlt Mistral die Verwendung von temperature = 0.7 und top_p = 0.95.

Llama.cpp: Tutorial zum Ausführen von Ministral-3-14B-Reasoning

1

Hole dir die neueste llama.cpp auf GitHub. Du kannst auch die Build-Anweisungen unten verwenden. Ändere -DGGML_CUDA=ON zu -DGGML_CUDA=OFF wenn du keine GPU hast oder nur CPU-Inferenz möchtest.

2

Sie können direkt von Hugging Face ziehen über:

3

Lade das Modell herunter über (nach der Installation von pip install huggingface_hub hf_transfer ). Du kannst UD_Q4_K_XL oder andere quantisierte Versionen auswählen.

🛠️ Ministral 3 feinabstimmen

Unsloth unterstützt jetzt das Fine-Tuning aller Ministral-3-Modelle, einschließlich Unterstützung für Vision. Zum Trainieren müssen Sie die neueste 🤗Hugging Face transformers v5 und unsloth verwenden, was unsere jüngste ultralange Kontext- Unterstützung umfasst. Das große 14B-Ministral-3-Modell sollte auf eine kostenlose Colab-GPU passen.

Wir haben kostenlose Unsloth-Notebooks zum Fine-Tuning von Ministral 3 erstellt. Ändern Sie den Namen, um das gewünschte Modell zu verwenden.

Notizbuch zur Feinabstimmung von Ministral Vision

Ministral Sudoku GRPO RL-Notizbuch

Reinforcement Learning (GRPO)

Unsloth unterstützt jetzt ebenfalls RL und GRPO für die Mistral-Modelle. Wie üblich profitieren sie von all den Verbesserungen von Unsloth, und morgen werden wir bald ein Notizbuch veröffentlichen, speziell für das autonome Lösen des Sudoku-Rätsels.

Um die neueste Version von Unsloth und transformers v5 zu verwenden, aktualisieren Sie über:

Das Ziel ist es, Strategien zur Lösung von Sudoku automatisch zu generieren!

Bei den Belohnungsdiagrammen für Ministral erhalten wir das Folgende. Wir sehen, dass es gut funktioniert!

Zuletzt aktualisiert

War das hilfreich?