🌠Qwen3 - Comment exécuter et affiner
Apprenez à exécuter et affiner Qwen3 localement avec Unsloth + nos quantifications Dynamic 2.0
Qwen3 - Unsloth Dynamic 2.0 avec des configurations optimales :
Dynamic 2.0 GGUF (pour exécuter)
GGUF Contexte 128K
Safetensor dynamique 4 bits (pour affiner/déployer)
🖥️ Exécution de Qwen3
⚙️ Paramètres officiels recommandés
Paramètres en mode non-pensée :
Paramètres en mode pensée :
Basculer entre le mode Pensée et le mode Non-Pensée
Instructions pour llama.cpp et Ollama :
Instructions pour transformers et vLLM :
blocs, pas de chaîne de pensée.
Si vous rencontrez des boucles, Ollama a peut-être défini votre fenêtre de longueur de contexte à environ 2 048. Dans ce cas, augmentez-la à 32 000 et voyez si le problème persiste.
-no-cnv
--prompt "<|im_start|>user\nCreate a Flappy Bird game in Python. You must include these things:\n1. You must use pygame.\n2. The background color should be randomly chosen and is a light shade. Start with a light blue color.\n3. Pressing SPACE multiple times will accelerate the bird.\n4. The bird's shape should be randomly chosen as a square, circle or triangle. The color should be randomly chosen as a dark color.\n5. Place on the bottom some land colored as dark brown or yellow chosen randomly.\n6. Make a score shown on the top right side. Increment if you pass pipes and don't hit them.\n7. Make randomly spaced pipes with enough space. Color them randomly as dark green or light brown or a dark gray shade.\n8. When you lose, show the best score. Make the text inside the screen. Pressing q or Esc will quit the game. Restarting is pressing SPACE again.\nThe final game should be inside a markdown section in Python. Check your code for errors and fix them before the final markdown section.<|im_end|>\n<|im_start|>assistant\n"
(pour les modèles de base)
load_in_4bit = True, # Quantification 4 bits pour réduire la mémoire

guide complet ici

Mis à jour
Ce contenu vous a-t-il été utile ?

