👁️Vision-Feinabstimmung
Lerne, wie man Vision-/Multimodal-LLMs mit Unsloth feinabstimmt
Vision-/Nur-Text-Fine-Tuning deaktivieren
model = FastVisionModel.get_peft_model(
model,
finetune_vision_layers = True, # False, wenn keine Vision-Layer feinabgestimmt werden
finetune_language_layers = True, # False, wenn keine Sprach-Layer feinabgestimmt werden
finetune_attention_modules = True, # False, wenn keine Attention-Layer feinabgestimmt werden
finetune_mlp_modules = True, # False, wenn keine MLP-Layer feinabgestimmt werden
r = 16, # Je größer, desto höher die Genauigkeit, aber möglicherweise Overfitting
lora_alpha = 16, # Empfohlene Alpha mindestens == r
lora_dropout = 0,
bias = "none",
random_state = 3407,
use_rslora = False, # Wir unterstützen rank-stabilisiertes LoRA
loftq_config = None, # Und LoftQ
target_modules = "all-linear", # Jetzt optional! Kann bei Bedarf eine Liste angegeben werden
modules_to_save=[
"lm_head",
"embed_tokens",
],
)Vision-Daten-Collator
Training mit mehreren Bildern
Datensatz für Vision-Fine-Tuning
Bild
Bildunterschrift

🔎Training nur auf Assistentenantworten für Vision-Modelle, VLMs
Zuletzt aktualisiert
War das hilfreich?

