🔮Catalogue des modèles Unsloth

Répertoire des LLM Unsloth pour tous nos Dynamique modèles GGUF, 4 bits et 16 bits sur Hugging Face.

QwenDeepSeekGemmaLlamaMistralGLM

Les GGUF vous permettent d’exécuter des modèles dans des outils comme Unsloth Studio✨, Ollama et llama.cpp. Instruct (4 bits) safetensors peuvent être utilisés pour l’inférence ou le fine-tuning via Unsloth.

Nouveaux modèles et modèles recommandés :

Modèle
Variante
GGUF
Instruct (4 bits)

35B-A3B

26B-A4B

Kimi

K2.6

NVIDIA Nemotron 3

Nano-Omni-30B-A3B

35B-A3B

27B

122B-A10B

0,8B

2B

4B

9B

397B-A17B

NVIDIA Nemotron 3

Kimi

MiniMax

NVIDIA Nemotron 3

30B

Edit-2511

123B

Mistral Large 3

675B

80B-A3B-Instruct

80B-A3B-Thinking

2B-Instruct

2B-Thinking

4B-Instruct

4B-Thinking

8B-Instruct

8B-Thinking

30B-A3B-Instruct

30B-A3B-Thinking

32B-Instruct

32B-Thinking

235B-A22B-Instruct

235B-A22B-Thinking

30B-A3B-Instruct

30B-A3B-Thinking

235B-A22B-Instruct

30B-A3B

4.7

4.6V-Flash

V3.1

Granite-4.0

H-Small

Kimi-K2

Thinking

0905

Modèles DeepSeek :

Modèle
Variante
GGUF
Instruct (4 bits)

DeepSeek-V3.1

Terminus

V3.1

DeepSeek-V3

V3-0324

V3

DeepSeek-R1

R1-0528

R1-0528-Qwen3-8B

R1

R1 Zero

Distill Llama 3 8 B

Distill Llama 3.3 70 B

Distill Qwen 2.5 1.5 B

Distill Qwen 2.5 7 B

Distill Qwen 2.5 14 B

Distill Qwen 2.5 32 B

Modèles Llama :

Modèle
Variante
GGUF
Instruct (4 bits)

Llama 4

Scout 17 B-16 E

Maverick 17 B-128 E

Llama 3.3

70 B

Llama 3.2

1 B

11 B Vision

90 B Vision

Llama 3.1

8 B

70 B

405 B

Llama 3

8 B

70 B

Llama 2

7 B

13 B

CodeLlama

7 B

13 B

34 B

Modèles Gemma :

Modèle
Variante
GGUF
Instruct (4 bits)

Gemma 4

E2B

26B-A4B

FunctionGemma

270M

Gemma 3n

E2B

lien

Gemma 3

270M

MedGemma

4 B (vision)

27 B (vision)

Gemma 2

2 B

9 B

27 B

Modèles Qwen :

Modèle
Variante
GGUF
Instruct (4 bits)

35B-A3B

35B-A3B

27B

122B-A10B

0,8B

2B

4B

9B

397B-A17B

Edit-2511

2B-Instruct

2B-Thinking

4B-Instruct

4B-Thinking

8B-Instruct

8B-Thinking

Qwen3-Coder

30B-A3B

480B-A35B

30B-A3B-Instruct

30B-A3B-Thinking

235B-A22B-Thinking

235B-A22B-Instruct

Qwen 3

0,6 B

30 B-A3B

235 B-A22B

Qwen 2.5 Omni

3 B

7 B

Qwen 2.5 VL

3 B

Qwen 2.5

0,5 B

1,5 B

3 B

7 B

14 B

32 B

72 B

Qwen 2.5 Coder (128 K)

0,5 B

QwQ

32 B

QVQ (aperçu)

72 B

Qwen 2 (chat)

1,5 B

7 B

72 B

Qwen 2 VL

2 B

7 B

72 B

Modèles GLM :

Modèle
Variante
GGUF
Instruct (4 bits)

4.6V-Flash

4.6

4.5-Air

Modèles Mistral :

Modèle
Variante
GGUF
Instruct (4 bits)

Magistral

Small (2506)

Small (2509)

Small (2507)

Mistral Small

3.2-24 B (2506)

3.1-24 B (2503)

3-24 B (2501)

2409-22 B

Devstral

Small-24 B (2507)

Small-24 B (2505)

Pixtral

12 B (2409)

Mistral NeMo

12 B (2407)

Mistral Large

2407

Mistral 7 B

v0.3

v0.2

Mixtral

8 × 7 B

Modèles Phi :

Modèle
Variante
GGUF
Instruct (4 bits)

Phi-4

Reasoning-plus

Raisonnement

Mini-Reasoning

Phi-4 (instruct)

mini (instruct)

Phi-3.5

mini

Phi-3

mini

medium

Autres modèles (GLM, Orpheus, Smol, Llava, etc.) :

Modèle
Variante
GGUF
Instruct (4 bits)

GLM

4.5-Air

4.5

4-32B-0414

Grok 2

270B

Baidu-ERNIE

4.5-21B-A3B-Thinking

Hunyuan

A13B

Orpheus

0.1-ft (3B)

LLava

1.5 (7 B)

1.6 Mistral (7 B)

TinyLlama

Chat

SmolLM 2

135 M

Zephyr-SFT

7 B

Yi

6 B (v1.5)

6 B (v1.0)

34 B (chat)

34 B (base)

Mis à jour

Ce contenu vous a-t-il été utile ?