> For the complete documentation index, see [llms.txt](https://unsloth.ai/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://unsloth.ai/docs/de/neu/changelog.md).

# Unsloth-Updates

Um die neuesten Änderungen zu verwenden, [aktualisiere Unsloth](/docs/de/neu/studio/install.md#update-unsloth-studio).

{% updates format="full" %}
{% update date="2026-06-18" tags="new-releases,v0.1.47-beta" %}

## GLM 5.2 + Hub + 3x längere Kontexte

[GLM-5.2](broken://pages/58e5f3df7be61773c8d7055c30a65310240079a4) wird jetzt in Unsloth Studio unterstützt! Alle Reasoning-Stufen werden unterstützt. **3x längere Kontextlängen** sind jetzt mit unserem neuen Auto-Fit-Algorithmus mit MTP erreichbar, wodurch längere Chats möglich werden. Umgehe den Berechtigungsmodus, verzweigende Chats, in die Warteschlange stellbare Chats, ein neues Hub zur Modellentdeckung, parallele Module + HTTPS-Cloudflare-Unterstützung und mehr! Verwende `unsloth studio --secure` für sicheren globalen HTTPS-Zugriff!

<div data-with-frame="true"><img src="https://github.com/user-attachments/assets/93c18616-415f-48ea-957d-9e0fa97a45dd" alt="" width="563"></div>

#### Besserer Algorithmus für die Kontextlänge

Gemäß [PR 1](https://github.com/unslothai/unsloth/pull/6312) und [PR 2](https://github.com/unslothai/unsloth/pull/6447), haben wir Unsloth Studios Bestimmung von Speichernutzung und Kontextlänge deutlich verbessert und insgesamt 3x längere Kontexte erreicht:

| Szenario                         | KV       | vorher  | nachher |
| -------------------------------- | -------- | ------- | ------- |
| 1x 32-GB-Pipeline (\~31 GB frei) | f16      | 23,040  | 64,000  |
|                                  | q8\_0    | 43,520  | 114,944 |
|                                  | q4\_0    | 82,432  | 199,680 |
| 2x 32-GB-Pipeline                | beliebig | 262,144 | 262,144 |
| 2x 24-GB-Tensor (\~23 GB frei)   | f16      | 134,049 | 262,144 |
|                                  | q8\_0    | 252,329 | 262,144 |

#### Chat-Canvas, Verzweigung & Warteschlange

* Bearbeite Assistentennachrichten an Ort und Stelle und starte von jedem Punkt im Thread neu.
* Verzweige einen Thread, um eine Unterhaltung zu verzweigen, ohne das Original zu verlieren.
* Temporäre (Inkognito-)Chats, die nichts zurücklassen.
* Stelle neue Prompts in die Warteschlange, während eine Generierung noch läuft, statt zu warten.
* Chat-„Artefakte“ sind jetzt **Canvas**, mit eingebetteten **HTML-Canvas-Karten** die automatisch gerendert werden, einer Code-Ansicht, und DiffusionGemma behält seinen Rohcode weiterhin inline sichtbar, statt ihn einzuklappen.
* Die Chatsuche umfasst jetzt jede Nachricht und zeigt zuerst deine eigenen Nachrichten an.

#### Hub (neu gestaltet)

* Vollseitiger Hub mit Trend-Feed, Suche und Unterstützung für benutzerdefinierte Modellpfade.
* README-Vorschau in einem Split-View-Feed, damit du vor dem Herunterladen lesen kannst.
* Downloads verwenden standardmäßig das schnellere **Xet** Transportprotokoll, mit automatischem HTTP-Fallback, falls eine Übertragung hängen bleibt.
* Neuer Umschalter „Laden bei Auswahl“, um Ladeoptionen festzulegen, bevor ein Modell geladen wird.
* Google-Logo für DiffusionGemma und zukünftige Gemma-Derivate angezeigt.

#### Modelle & Inferenz

* DeepSeek-OCR und weitere Vision-Modelle laden und laufen jetzt ohne Fehler.
* Fast Inference auf dem neuesten vLLM (0.22+) behoben, damit Beschleunigungen wieder funktionieren.
* Tensor-Parallellisierung ist zuverlässiger: Falls der schnellere MTP-Pfad fehlschlägt, erholt er sich jetzt selbstständig statt abzustürzen.
* DiffusionGemma zeigt jetzt live, wie das Bild beim Entrauschen entsteht, mit genauen Geschwindigkeitsstatistiken.

#### Sicherheit & Cloudflare-verschlüsselte Studios

* Neu `--secure` nur-Cloudflare-Modus für Ende-zu-Ende-verschlüsselte Studios, wobei serverseitige Tools unter `--secure`. Verwende `unsloth studio --secure`!
* den Modus zum Umgehen von Berechtigungen, um Bestätigungen zu überspringen und die Tool-Sandbox zu deaktivieren, wenn du willst.
* Automatische Erkennung von Hugging-Face-Virenscans + gefährlichen Dateien in Repos.

#### Protokollierung und API

* Neu **API-Server-Monitor** im Studio.
* Schnellere API-Aufrufe und geringere Latenz
* Viel bessere, gestraffte Logs – jetzt mit Durchsatz und Latenz und viele überladene Logs entfernt.

#### Hardware & Backend

* Bessere Unterstützung für Blackwell RTX 50X- und 60X-GPUs
* Stilles Downgrade auf CPU statt GPU beheben
* Die torchao-Version wird jetzt anhand des installierten torch ausgewählt.
* Der Installer repariert jetzt automatisch eine beschädigte oder nur-CPU-PyTorch-Installation und warnt vor stillem CPU-Fallback, auf NVIDIA + AMD unter Win/Linux/Mac/WSL.
* Gibt den VRAM des Chat-Modells frei, wenn das Training startet, aber nur, wenn die GPU tatsächlich knapp ist (sonst keine unnötigen Neuladungen).
* Wenn llama-server beim Start hart abstürzt, durchläuft Studio jetzt eine Wiederherstellungsleiter statt einfach zu scheitern.

#### Training & allgemeine Fehlerbehebungen & parallele Module

* MLX-Trainingsupdates.
* Verbesserte Zuverlässigkeit des GRPO-Trainings mit vLLM.
* Trainingsstart zuverlässiger gemacht, mit klareren Fehlern für ungültige VLM-Batches.
* Studio bereinigt jetzt verwaiste Backend-Prozesse zuverlässiger nach Abstürzen, Neustarts oder unterbrochenen Herunterfahrvorgängen.
* Export, Chat, Training, Rezepte sind alle individualisiert / abgeschottet! Das bedeutet, du kannst jetzt alle 4 parallel erledigen! Du kannst chatten / Inferenz machen, während du auf einen Trainingslauf oder einen Export wartest!

Um Unsloth zu aktualisieren oder ein neues Unsloth Studio zu installieren, musst du verwenden:

**macOS, Linux, WSL:**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows:**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% endupdate %}

{% update date="2026-06-12" tags="new-releases,v0.1464-beta" %}

## DiffusionGemma + Gemma 4 MTP

Stelle sicher, dass du das Neueste installierst [`v0.1.464-beta`](https://github.com/unslothai/unsloth/tree/v0.1.462-beta) oder `2026.6.7`. [DiffusionGemma](https://unsloth.ai/docs/models/diffusiongemma), [Gemma 4 MTP](https://unsloth.ai/docs/models/mtp) und [**MiniMax-M3**](https://unsloth.ai/docs/models/minimax-m3) werden jetzt alle unterstützt.

* Ausführen und trainieren [DiffusionGemma](https://unsloth.ai/docs/models/diffusiongemma) über [Unsloth Studio](https://unsloth.ai/docs/new/studio).
* [Gemma 4 MTP](https://unsloth.ai/docs/models/mtp) ist da! Ausführen [Gemma 4](https://unsloth.ai/docs/models/gemma-4) mit MTP etwa 2x schneller.
* Audio-Chat wird jetzt für Gemma 4 unterstützt (`wav`, `mp3`, `m4a`, `flac`, `webm`).
* „Preserve Think“ zu Gemma 4 hinzugefügt.

<figure><img src="/files/37d41a9986d4b1f503942b2654532cfdd5149728" alt="" width="375"><figcaption></figcaption></figure>

#### Hub + Download-Manager (experimentell)

* Eine neue **Hub** Seite zum Durchsuchen, Herunterladen und Verwalten von Hugging-Face-Modellen und -Datensätzen hinzugefügt.
* Unsloth kann jetzt Modelle und Datensätze erkennen, die bereits auf deinem Rechner vorhanden sind, und sie neben heruntergeladenen Assets anzeigen.
* Heruntergeladen [GGUF-Modelle](https://unsloth.ai/docs/basics/inference-and-deployment/saving-to-gguf) haben jetzt direkte **Ausführen / Neuer Chat** Aktionen.

#### RAG / Chat mit Dateien (experimentell)

* Hinzugefügt [**Chat mit Dateien**](https://unsloth.ai/docs/new/studio/chat) im Studio, sodass du Fragen zu deinen eigenen Dokumenten und Wissensdatenbanken stellen kannst.
* Unterstützt hybride Suche, Zitate, PDF-Vorschauen, Dokumente pro Thread und ein integriertes `search_knowledge_base` Tool.

#### Neue Schaltfläche „Aktualisieren“ + Hardware-Unterstützung

* Unsloth verwendet jetzt konstant frische, aktuelle [llama.cpp-Vorab-Builds](https://unsloth.ai/docs/new/changelog) über CUDA, ROCm, Windows, Linux und macOS.
* Eine In-App- **llama.cpp aktualisieren** Schaltfläche wurde hinzugefügt, damit Benutzer das lokale Backend aktualisieren können, ohne Studio neu zu installieren.
* Verbesserte Windows-/WSL-AMD-Unterstützung, [Strix-Halo-ROCm-Unterstützung](https://unsloth.ai/docs/get-started/install/amd), [Blackwell-CUDA-Auswahl](https://unsloth.ai/docs/blog/fine-tuning-llms-with-blackwell-rtx-50-series-and-unsloth)und klarere Installermeldungen.

#### Lokaler Chat, Tools & API-Kompatibilität

* Lokale [Tool-Aufrufe](https://unsloth.ai/docs/basics/tool-calling-guide-for-local-llms) sind zuverlässiger, mit besserer Reihenfolge der Tool-Karten, weniger doppelten Tool-Schleifen und Unterstützung für Tool-Nutzung mit GGUF-Vision-Modellen.
* Verbesserte [OpenAI-kompatible API](https://unsloth.ai/docs/basics/inference-and-deployment/llama-server-and-openai-endpoint) und Anthropic-kompatibles API-Verhalten für lokale Studio-Server, einschließlich besserer Fehler, Token-Nutzung, Stoppgründe und [Claude-Code-Kompatibilität](https://unsloth.ai/docs/basics/claude-code).

#### Training & Fehlerbehebungen

* Verbesserte [MLX-Unterstützung](https://unsloth.ai/docs/new/studio/install) mit besseren Modellbezeichnungen, Generierungsgeschwindigkeitsstatistiken und Fehlerbehebungen für [VLM-Training](https://unsloth.ai/docs/basics/vision-fine-tuning).
* Mehrere [Trainings-](https://unsloth.ai/docs/get-started/fine-tuning-llms-guide) und [Datensatz-](https://unsloth.ai/docs/get-started/fine-tuning-llms-guide/datasets-guide) Randfälle behoben, einschließlich nicht beschreibbarer Hugging-Face-Caches und benutzerdefinierter Datensatzzuordnungen.
* Viele UI-Polish-Fixes in Chat, Menüs, Modellauswahl, Dark Mode, Import/Export und Einstellungen hinzugefügt.

Um Unsloth zu aktualisieren oder ein neues Unsloth Studio zu installieren, musst du verwenden:

**macOS, Linux, WSL:**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows:**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% endupdate %}

{% update date="2026-06-03" tags="new-releases,v0.1.44-beta" %}

## Gemma 4 12B, neue UI, MCP, Projekte

Dieses Update konzentriert sich hauptsächlich auf Gemma 4 12B, MCP, Projekte, Canvas, CUDA 13.3 und die neue Chat-UI. Nächste Woche gibt es ein noch größeres Update.

<div data-with-frame="true"><figure><img src="/files/03c0fa542e2dd3a0afc9fcd0c9c021346fd41c97" alt="" width="375"><figcaption></figcaption></figure></div>

#### Gemma 4 12B

Google veröffentlicht [Gemma 4 12B](https://unsloth.ai/docs/models/gemma-4)ein neues Modell, das lokal auf 8 GB RAM läuft. [GGUF](https://huggingface.co/unsloth/gemma-4-12b-it-GGUF) / [Anleitung](https://unsloth.ai/docs/models/gemma-4)

Gemma 4 12B Unified unterstützt Bild, Audio und 256K Kontext. Führe das Modell über Unsloth Studio aus und trainiere es.

#### MCP

* Entfernter `MCP` Serverunterstützung, einschließlich benutzerdefinierter Header und OAuth
* Lokale befehlsbasierte `MCP` Serverunterstützung
* `MCP` kann jetzt im Chat-Composer aktiviert werden
* Eingebaute Voreinstellungen für gängige `MCP` Server

#### Neue Chat-UI

* Projekte, Canvas, `MCP`, RAG- und Vergleichssteuerungen befinden sich jetzt im Plus-Menü
* Suche und Code-Steuerungen sind leichter über den Composer zugänglich
* Menüs, Overlays, Symbole und anklickbare Steuerelemente sind in Studio konsistenter

#### Projekte

* Verwandte Chats in dedizierten Projektarbeitsbereichen organisieren
* Bestehende Chats in Projekte verschieben
* Projekte direkt aus der Seitenleiste erstellen und verwalten

#### Experimentelles Canvas / Artefakte

* Öffnet generiertes HTML in einem dedizierten Canvas-Bereich innerhalb von Unsloth Studio
* Unterstützt interaktive Ausgaben, einschließlich browserbasierter Visualisierungen und per CDN geladener Pakete
* Ermöglicht das Umschalten zwischen gerenderter Vorschau und Quellcode

#### Installation, Laufzeit und Hardware

* Windows-Vorabinstallationen erfordern die frühe `CUDA Toolkit` Prüfung
* Linux `llama.cpp` Vorab-Builds entsprechen jetzt der erkannten Laufzeit `cudart` Haupt-
* `ROCm` gfx-Erkennung wird in die Auswahl der Vorab-Builds übernommen
* `Blackwell`, `B300` und `ARM64` Linux-Unterstützungsupdates

Um Unsloth zu aktualisieren oder ein neues Unsloth Studio zu installieren, musst du verwenden:

**macOS, Linux, WSL:**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows:**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% hint style="warning" %}
**NICHT VERWENDEN `unsloth studio-Update` mehr, da das Packaging nicht die neuesten Updates erhält!**
{% endhint %}
{% endupdate %}

{% update date="2026-05-31" tags="new-releases,v0.1.43-beta" %}

## CUDA 13.3, Windows, Mac

**Um Unsloth zu aktualisieren oder ein neues Unsloth Studio zu installieren, musst du verwenden:**

**macOS, Linux, WSL:**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows:**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

{% hint style="warning" %}
**NICHT VERWENDEN `unsloth studio-Update` mehr, da das Packaging nicht die neuesten Updates erhält!**
{% endhint %}

#### Mac-Updates

* Wieder aktiviert `llama.cpp` Vorab-Binärdateien für Apple Silicon (M1-M4) - Mac OS 14 / 15 / 26 (Tahoe) erneut aktiviert
* Apple Silicon Mac OS 13 (Ventura) ist ein Source-Build
* Intel (x86\_64) für Mac OS 13.3 / 14 / 15 / 26 (Tahoe) verwendet `llama.cpp` Vorab-Binärdateien
* Intel für Max 13.0 - 13.2 ist ein Source-Build

#### Windows-Updates

* CUDA 13.3 `llama.cpp` Vorab-Binärdateien funktionieren jetzt für Windows
* Für CUDA 13.2, CUDA 13.1 und darunter verwenden Windows-Geräte den CUDA-12.4-Fallback – wir arbeiten bald an CUDA-13.1-Binärdateien.

#### CUDA 13.3-Update

* CUDA 13.3-Binärdateien außerhalb von Linux funktionieren. Vorerst verwenden wir weiterhin CUDA 13.1
* CUDA 13.3 löst das Wirrwarr-Problem von CUDA 13.2 – siehe <https://github.com/unslothai/unsloth/issues/4849>

#### Blackwell-GPUs-Update

* Vorerst werden Blackwell-Vorab-Binärdateien verzögert veröffentlicht `llama.cpp` Vorab-Binärdateien, da CUDA 12.4 nicht funktioniert – wir arbeiten daran, dies bald zu lösen.
  {% endupdate %}

{% update date="2026-05-26" tags="new-releases,v0.1.42-beta" %}

## Ein Update vor dem Revamp.

Hey Leute, wir machen noch ein weiteres Update vor einem größeren Revamp, der wahrscheinlich diese oder nächste Woche kommt. Unser Revamp wird vieles verändern, insbesondere mit neuen großen Funktionen und vielen Designänderungen.

{% embed url="<https://github.com/user-attachments/assets/70456395-e016-4273-8256-35adb206267e>" %}

* NEU: [**Unterstützung für API-Aufrufe**](https://unsloth.ai/docs/integrations/connections) jetzt mit Bildgenerierung + Bearbeitung, ordentlicher Websuche, Code-Ausführung, automatischem Prompt-Caching. Verbinde [OpenAI](https://unsloth.ai/docs/integrations/connections/openai), [Anthropic](https://unsloth.ai/docs/integrations/connections/anthropic-claude) und mehr.
* Ordentliche Unterstützung für **nicht-englische Sprachen** z. B. Japanisch, Chinesisch, Indisch usw.

Viele von euch haben möglicherweise unsere vorherige Veröffentlichung verpasst, die nur einen Tag lang verfügbar war. Wir haben eingeführt:

* Verbinde dich mit externen Inferenz-Backends: [vLLM](https://unsloth.ai/docs/integrations/connections/vllm), [Ollama](https://unsloth.ai/docs/integrations/connections/ollama), [llama-server](https://unsloth.ai/docs/integrations/connections/connect-llama.cpp-to-unsloth-run-ggufs-with-llama-server)
* **Sicherheitsverbesserungen**
* **Automatisches MTP-spekulatives Dekodieren** für MTP-GGUFs; erhalte die besten für deine Hardware angepassten Einstellungen.

#### API-Anbieter-Aufrufe & externe Verbindungen

* Du kannst Unsloth jetzt mit jedem API-Cloud-Anbieter verbinden (OpenAI, Anthropic, OpenRouter usw.)
* **Eingebaute Websuche** für OpenAI, Anthropic, OpenRouter und Kimi
* **Eingebaute Code-Ausführung** für OpenAI und Anthropic (Anthropic-Container bleiben bestehen und werden über Turns hinweg wiederverwendet)
* Prompt-Caching ist für OpenAI- und Anthropic-Modelle aktiviert und spart 50 bis 90 % der Kosten.
* Bildgenerierung + Bearbeitung
* API-Schlüssel ist jetzt für lokale Anbieter optional (llama.cpp / vLLM / Ollama)
* Modelle automatisch laden, wenn ein Cloud-Anbieter hinzugefügt wird

#### Weitere Unsloth-Studio-Updates

* OpenDocument-Chat-Anhänge
* o3-Reasoning-Zusammenfassungspayload
* Senden/Prompten nicht-englischer Sprachen (z. B. Japanisch, Chinesisch) funktioniert jetzt ordnungsgemäß
* Härtung des IME-Composers, RTL `dir="auto"`, Behebung der Trunkierung langer Logzeilen
* Rendering von Tool-Reasoning-Traces in der UI
* Vollständig Offline-Unterstützung: zwischengespeckte GGUF-Erkennung und Offline-DNS-Autoerkennung für Inferenz und Training

#### Sicherheitsverbesserungen in Unsloth Studio

* Authentifizierungs-Ratenbegrenzung, proxybewusst, damit Reverse-Proxys sie nicht umgehen
* Sandboxed Worker mit einer verschärften Blockliste (bash, `hf-Upload`, `NOFILE`)
* Pfadbegrenzung, damit Worker ihren laufenden tmp-Verzeichnissen nicht entkommen können
* Strikte Schema-Validierung über die gesamte Studio-API
* Verschärfte CSP-/Sicherheitsheader (nur legitime Favicon-Hosts erlaubt)
* Entfernt wurde der `torch.load` Fallback bei `training_args.bin` sodass nicht vertrauenswürdige Pickles beim Laden des Modells niemals ausgeführt werden können
* Abgesicherter Tauri-Desktop-Release-Flow
* Frontend-Authentifizierung: Singleflight-Tokenaktualisierung, Eingabe des aktuellen Passworts bei Änderungen, funktionierendes Logout, gemeinsamer 422-Helfer
* Die Abbruchbereinigung ist jetzt strikt auf laufende tmp-Verzeichnisse beschränkt, sodass sie niemals Benutzerzustand löschen kann
  {% endupdate %}

{% update date="2026-05-19" tags="new-releases,v0.1.41-beta" %}

## MTP + Unsloth-Fehlerbehebungen

Viele Fehlerbehebungen, UI-, UX-Fehlerbehebungen für Studio! Um die neuesten Updates zu erhalten, mache:

**macOS, Linux, WSL:**

```bash
curl -fsSL https://unsloth.ai/install.sh | sh
```

**Windows:**

```powershell
irm https://unsloth.ai/install.ps1 | iex
```

#### Fehlerbehebungen

1. Beheben `unsloth studio-Update` funktioniert nicht gut
2. Beheben, dass man hängen bleibt auf `Passwort zurücksetzen` Seite
3. Mehr Unterstützung für den Offline-Modus
4. MTP auf Macs, CPUs und GPUs beschleunigen – jetzt ist es viel besser!
5. Beheben, dass die Desktop-Verknüpfung nach dem Update nicht funktionierte
6. Viele, viele UI/UX-Fehlerbehebungen
   {% endupdate %}

{% update date="2026-05-18" tags="new-releases,model-release,v0.1.405-beta" %}

## Qwen3.6 MTP + API-Verbindungen

Wir haben viele neue Updates für Unsloth `v0.1.41-beta`:

* **etwa 2x schnellere GGUF-Inferenz** mit automatisch aktiviertem [MTP](/docs/de/modelle/qwen3.6.md#mtp-guide)
* [**Unterstützung für API-Aufrufe**](broken://pages/0f8e9568d5c07455e71a53b9fbadf4f2dfaf00ef) für [OpenAI](broken://pages/367023c3a571cf59a464858fab871c02b879dfce), [Anthropic](broken://pages/e7a9e0d50422d2dc896e7340d38f8010a7904825) usw. mit automatischem Prompt-Caching, Websuche, Code-Ausführung
* Verbinde dich mit externen Inferenz-Backends: [vLLM](broken://pages/e615d4a28cd587792fdd00408d9085f357a98264), [Ollama](broken://pages/53348ce7be14c59b1b8a799eda5d5b74555da546), [llama-server](broken://pages/cd3683501afcafe783ce99834e5b05d2ee3053a6)
* Experimentell **MLX-Inferenz**
* Ordentliche Unterstützung für **nicht-englische Sprachen**
* **Sicherheit** Verbesserungen

<a href="/pages/efc00d6b1d286a029d0eec8a5a6a24d50b063840#qwen3.6-inference-tutorials" class="button primary">Qwen3.6-Tutorials ausführen</a><a href="/pages/efc00d6b1d286a029d0eec8a5a6a24d50b063840#mtp-guide" class="button primary">MTP-Anleitung</a>

<div data-with-frame="true"><figure><img src="/files/7b482fd313c9534e8f7f4639059ce9449817c948" alt="" width="375"><figcaption></figcaption></figure></div>

#### MTP-Unterstützung für spekulatives Dekodieren 1,4 bis 2x schnellere Inferenz!

* **Automatisches MTP-spekulatives Dekodieren** für MTP-GGUFs; warne, wenn der gebündelte llama.cpp-Vorab-Build veraltet oder zu alt für MTP ist
* Neue vorgefertigte llama.cpp-Binärdateien für MTP-Unterstützung!

#### API-Anbieter-Aufrufe & externe Verbindungen

* Du kannst Unsloth jetzt mit jedem API-Cloud-Anbieter verbinden (OpenAI, Anthropic, OpenRouter usw.)
* **Eingebaute Websuche** für OpenAI, Anthropic, OpenRouter und Kimi
* **Eingebaute Code-Ausführung** für OpenAI und Anthropic (Anthropic-Container bleiben bestehen und werden über Turns hinweg wiederverwendet)
* Prompt-Caching ist für OpenAI- und Anthropic-Modelle aktiviert und spart 50 bis 90 % der Kosten.
* API-Schlüssel ist jetzt für lokale Anbieter optional (llama.cpp / vLLM / Ollama)
* Modelle automatisch laden, wenn ein Cloud-Anbieter hinzugefügt wird

#### MLX-Inferenz (experimentell)

* MLX-Quants und -Modelle können jetzt lokal auf deinen Mac-Rechnern laufen!
* Wir werden bald Thinking, Tools und Websuche hinzufügen!

#### Weitere Unsloth-Studio-Updates

* Senden/Prompten nicht-englischer Sprachen (z. B. Japanisch, Chinesisch) funktioniert jetzt ordnungsgemäß
* OpenDocument-Chat-Anhänge
* o3-Reasoning-Zusammenfassungspayload
* Härtung des IME-Composers, RTL `dir="auto"`, Behebung der Trunkierung langer Logzeilen
* Rendering von Tool-Reasoning-Traces in der UI
* Vollständig Offline-Unterstützung: zwischengespeckte GGUF-Erkennung und Offline-DNS-Autoerkennung für Inferenz und Training
* Viele UI/UX-Politur: Dark-Theme-Refaktorierung, Neugestaltung der rechten Seitenleiste, Faultier-Maskottchen zur Tageszeit, wegklickbare kopierbare Toasts, größerer Chat-Composer, Politur der Code-Ausführungs-Konfiguration, Styling der Composer-Aktions-Pille, schmalerer Discord-Button

#### Trainingsupdates

* Fehlerbehebungen für Gemma-Attention-Masken
* Multi-Bild GRPO
* GRPO-Experimente zur Rückgabe des Hidden States
* Neue CPT-Trainingsmethode als erstklassige Option für fortgesetztes Vortraining
* Gemma-4 MoE LoRA-Extraktor registriert zur Behebung `grouped_mm` Absturz bei der Kontraktion
* Optionale Fusion `lm_head` + Kreuzentropie-Forward, mit Single-Matmul-Pfad unter `UNSLOTH_RETURN_LOGITS=1`
* Batch-Größe für Eval übergeben
* Eval-/Trainingspfade beachten jetzt `HF_DATASETS_OFFLINE` zusammen mit `HF_HUB_OFFLINE`

#### Sicherheitsverbesserungen in Unsloth Studio

* Authentifizierungs-Ratenbegrenzung, proxybewusst, damit Reverse-Proxys sie nicht umgehen
* Sandboxed Worker mit einer verschärften Blockliste (bash, `hf-Upload`, `NOFILE`)
* Pfadbegrenzung, damit Worker ihren laufenden tmp-Verzeichnissen nicht entkommen können
* Strikte Schema-Validierung über die gesamte Studio-API
* Verschärfte CSP-/Sicherheitsheader (nur legitime Favicon-Hosts erlaubt)
* Entfernt wurde der `torch.load` Fallback bei `training_args.bin` sodass nicht vertrauenswürdige Pickles beim Laden des Modells niemals ausgeführt werden können
* Abgesicherter Tauri-Desktop-Release-Flow
* Frontend-Authentifizierung: Singleflight-Tokenaktualisierung, Eingabe des aktuellen Passworts bei Änderungen, funktionierendes Logout, gemeinsamer 422-Helfer
* Die Abbruchbereinigung ist jetzt strikt auf laufende tmp-Verzeichnisse beschränkt, sodass sie niemals Benutzerzustand löschen kann
  {% endupdate %}

{% update date="2026-05-05" tags="new-releases,v0.1.39-beta,v0.1.38-beta" %}

## Unsloth-API-Endpunkt

#### ***Fehlerbehebung in v0.1.39-beta*** **5. Mai 2026**

Behebt, dass der Chatverlauf nicht angezeigt wird (der vorhandene Chatverlauf geht nicht verloren) und Anhänge nicht korrekt angehängt werden. Der Fehler betraf nur das Rendering – verwende `2026.5.2` oder rufe direkt auf `curl -fsSL https://unsloth.ai/install.sh | sh`  um zu aktualisieren

Du kannst lokale LLMs mit Tools wie [Claude Code](https://unsloth.ai/docs/basics/claude-code) und [Codex](https://unsloth.ai/docs/basics/codex) verwenden, indem du sie mit dem Unsloth-API-Endpunkt verbindest. So kannst du Modelle wie [Qwen](https://unsloth.ai/docs/models/qwen3.6) und [Gemma](https://unsloth.ai/docs/models/gemma-4) lokal ausführen, mit zusätzlichen Funktionen wie selbstheilender Tool-Aufrufung, Codeausführung und Websuche.

Unsloth als API-Inferenz-Endpunkt zu verwenden ist nicht nur deshalb vorteilhaft, weil es einfach einzurichten und schnell ist, sondern auch, weil Unsloth Folgendes bietet:

* [Selbstheilende Tool-Aufrufung](https://unsloth.ai/docs/new/studio/chat#auto-healing-tool-calling), was hilft, fehlerhafte oder falsch formatierte Tool-Aufrufe um 50 % zu reduzieren
* [Codeausführung](https://unsloth.ai/docs/new/studio/chat#code-execution) Unterstützung, die Bash- und Python-Ausführung für genauere Code-Ausgaben ermöglicht.
* Erweitert [Websuche](https://unsloth.ai/docs/new/studio/chat#advanced-web-search) die Webseiten besucht und tatsächlich liest, um ausführliche Informationen zu sammeln.
* [Automatische Inferenz-Einstellungen](https://unsloth.ai/docs/new/studio/chat#auto-parameter-tuning) für GGUF-Modelle (temp, top-k usw.)

<div data-with-frame="true"><figure><img src="/files/4d7f67e24fb64209883a9782fb1c8e4d7782a66f" alt="" width="375"><figcaption></figcaption></figure></div>

#### Neue Modelle

Wir haben außerdem einige neue Modelle zum Ausführen, darunter NVIDIA [Nemotron 3 Nano Omni](/docs/de/modelle/nemotron-3-nano-omni.md), IBM [Granite 4.1](/docs/de/modelle/ibm-granite-4.1.md) und [Mistral 3.5](/docs/de/modelle/mistral-3.5.md) Medium. Wir haben Mistral dabei geholfen, einige Probleme mit der Implementierung in Transformers und GGUFs zu lösen.

#### Unsloth-Updates

* Gestoppte Studio-Trainingsläufe können jetzt von Checkpoints fortgesetzt werden.
* Chat-Threads speichern jetzt automatisch und bleiben zuverlässiger erhalten.
* DPO-Trainingshänger in Multi-Prozess-Setups wurden behoben.
* Die VLM-GRPO-Unterstützung wurde mit MROPE-Updates verbessert.
* Der Stopp-Button von Studio beendet die Generierung jetzt korrekt.
* Behebt, dass die Chat-Vorlage nach einem Browser-Refresh verschwindet.
  {% endupdate %}

{% update date="2026-04-23" tags="new-releases,v0.1.37-beta" %}

## Brandneues UI-Redesign

Hey Leute, wir haben die gesamte Unsloth-Studio-UI und das UX-Erlebnis überarbeitet, um den Fokus auf Chat und Training zu legen:

* Eine einklappbare Seitenleiste wurde basierend auf Community-Feedback hinzugefügt

<div data-with-frame="true"><figure><img src="/files/185679ec5ea5e6010281442e142bd0d961fb8f08" alt="" width="375"><figcaption></figcaption></figure></div>

* Du kannst jetzt Chats löschen und frühere Unterhaltungen durchsuchen

<div><figure><img src="/files/e57d933175dd866c23fb6d9276cdfb38ea19b22d" alt=""><figcaption></figcaption></figure> <figure><img src="/files/458049913eb8246383936137e5b124396134423d" alt=""><figcaption></figcaption></figure></div>

* Neuer Schalter „Denken beibehalten“ für Modelle, die dies unterstützen, wie Qwen3.6
* Saubereres, konsistenteres Design mit einfacherer Navigation
* Erweiterte Einstellungsseite mit Optionen zum Ändern deines Profilbilds, Namens und mehr

<div data-with-frame="true"><figure><img src="/files/e1b3c839b73e0fd270b11a2912b3fa53fd6ac640" alt="" width="375"><figcaption></figcaption></figure></div>

* Kein doppeltes Eingeben deines Hugging-Face-Tokens mehr
* gpt-oss hat jetzt Schalter für niedriges, mittleres und hohes Denken.
* Verwendet jetzt das neueste vorgefertigte llama.cpp, sogar unter Linux CUDA
* Viele Fehler-, Konsistenz- und Stabilitätskorrekturen
* Kimi-K2.6 kann jetzt ausgeführt werden!
* Wir haben außerdem experimentelle API-Unterstützung hinzugefügt. Leitfäden, Ankündigungen usw. kommen nächste Woche.

Qwen3.6 wurde auch zuvor bereits in Unsloth Studio zum Ausführen und Trainieren unterstützt. Du kannst Qwen3.6-27B jetzt sofort trainieren und ausführen!
{% endupdate %}

{% update date="2026-04-22" tags="model-release,new-releases" %}

## **Qwen3.6-27B + Kimi K2.6**

[**Qwen3.6-27B**](/docs/de/modelle/qwen3.6.md) kann jetzt in Unsloth Studio ausgeführt werden (18 GB RAM) und feinabgestimmt werden. Kimi K2.6 kann auch in Unsloth ausgeführt werden (350 GB RAM).

Unsloth Studio hat viele neue Updates erhalten, also bitte aktualisieren. Details und ein ausführlicher Beitrag folgen in den nächsten Tagen.
{% endupdate %}

{% update date="2026-04-16" tags="model-release,new-releases" %}

## **Qwen3.6**

[**Qwen3.6**](/docs/de/modelle/qwen3.6.md) kann jetzt in Unsloth Studio ausgeführt und feinabgestimmt werden. Das Modell läuft mit 23 GB RAM und ist das stärkste mittelgroße LLM in nahezu allen Benchmarks.
{% endupdate %}

{% update date="2026-04-11" tags="model-release" %}

## **Gemma-4-Update + MiniMax-M2.7**

[Gemma 4 GGUFs](https://huggingface.co/collections/unsloth/gemma-4) wurden jetzt mit Googles offiziellen Korrekturen an der Chat-Vorlage aktualisiert (was das Tool-Calling behoben/verbessert hat), zusammen mit den neuesten llama.cpp-Korrekturen. Aktualisiere auf die neueste llama.cpp-Version, lade die Quantisierungen neu herunter, und du solltest `unused token` Probleme nicht mehr sehen.\
\
[MiniMax-M2.7](/docs/de/modelle/tutorials/minimax-m27.md) ist jetzt verfügbar! Du kannst das Modell lokal mit unseren GGUFs in 4-Bit-Quantisierung auf 128 GB RAM / Unified Memory ausführen. [**MiniMax-M2.7 GGUF**](https://huggingface.co/unsloth/MiniMax-M2.7-GGUF)
{% endupdate %}

{% update date="2026-04-08" tags="new-releases,v0.1.36-beta" %}

## **Gemma-4-Korrekturen**

Wir haben Gemma 4 aktualisiert [mit vielen Korrekturen](/docs/de/modelle/gemma-4/train.md). Diese Fehler sind universell und betrafen alle Trainingspakete und Implementierungen und **stammen nicht von Unsloth**. Wir haben die Fehler identifiziert, behoben, und das Training von Gemma 4 funktioniert in Unsloth jetzt korrekt.

Du brauchst nur **8 GB VRAM** um **Gemma-4-E2B** lokal zu trainieren. Unsloth trainiert Gemma 4 **\~1,5x schneller und verwendet dabei \~60 % weniger VRAM** als FA2-Setups. Den vollständigen Leitfaden und die Notebooks zum Training von Gemma 4 [siehe unseren Blog](/docs/de/modelle/gemma-4/train.md).

#### Korrekturen für das Gemma-4-Training

1. **Gradientenakkumulation** führt nicht mehr zu Loss-Explosionen. Zuvor konnten Losses auf **300–400**ansteigen; der erwartete Loss liegt bei etwa **10–15**.
2. Behoben wurde der **IndexError** der **26B** und **31B** Inferenz in `Transformers`.
3. Behobene Unsinnsausgaben für **E2B/E4B** wenn `use_cache=False`. Siehe [Issue #45242](https://github.com/huggingface/transformers/issues/45242).
4. Behoben **Float16-Audio** Überlauf von `-1e9` Werten.

Wenn du Losses über **13–15** siehst, zum Beispiel **100** oder **300** - wird die Gradientenakkumulation wahrscheinlich falsch gehandhabt. Dies ist in beiden behoben **Unsloth** und **Unsloth Studio**.

#### Gemma-4-Quant-Re-Uploads

Wir haben auch unsere Gemma-4-GGUFs aktualisiert, daher musst du sie erneut herunterladen. Auch diese Quantisierungsprobleme sind **nicht mit Unsloth verbunden oder von Unsloth verursacht**:

1. CUDA: vor dem Fusionieren auf Pufferüberlappung prüfen - kritische Korrektur für `<unused24>` Tokens - [PR #21566](https://github.com/ggml-org/llama.cpp/pull/21566)
2. `kv-cache`: Unterstützung für Aufmerksamkeitsrotation bei heterogenem iSWA - [PR #21513](https://github.com/ggml-org/llama.cpp/pull/21513)
3. `Vokabular`: Byte-Token-Verarbeitung zum BPE-Detokenizer für Gemma 4 hinzufügen - [PR #21488](https://github.com/ggml-org/llama.cpp/pull/21488)
4. `konvertieren`: setzen `"add bos" == True` für Gemma 4 - [PR #21500](https://github.com/ggml-org/llama.cpp/pull/21500)
5. `gemeinsam`: spezialisierten Gemma-4-Parser hinzufügen - [PR #21418](https://github.com/ggml-org/llama.cpp/pull/21418)
6. `llama-model`: lesen `final_logit_softcapping` für Gemma 4 - [PR #21390](https://github.com/ggml-org/llama.cpp/pull/21390)
7. `llama`: benutzerdefinierte Zeilenumbruch-Aufteilung für Gemma 4 hinzufügen - [PR #21406](https://github.com/ggml-org/llama.cpp/pull/21406)

#### Unsloth-Studio-Updates

* Hinzufügen **spekulativer Dekodierung** Unterstützung (ngram-mod, standardmäßig aktiviert)
* Llama.cpp wurde auf die neueste Version mit allen Gemma-4-Korrekturen aktualisiert
* Trainingsprobleme mit Qwen3.5 und Gemma 4 beheben
* Export und Speichern von Gemma-4-Modellen aktivieren
* Sandbox-Sicherheit für Terminal- und Python-Tools härten
* Rezepte das in Chat geladene Modell verwenden lassen
* Leere Chat-Threads bei der Navigation (und beim Wechseln von Tabs) beheben und den Ablauf für neue Chats stabilisieren
* Nicht-LLM-Rezepte ausführen lassen und den Daten-Tab bei Ausführungen an erste Stelle setzen
* Groß-/Kleinschreibung des gecachten HF-Repos wiederverwenden, um doppelte Downloads zu verhindern
  {% endupdate %}

{% update date="2026-04-03" tags="new-releases,v0.1.36-beta" %}

## **Google - Gemma 4**

* Du kannst jetzt die [Gemma 4](/docs/de/modelle/gemma-4.md) Modelle in Unsloth ausführen und trainieren.
* Intel-Mac funktioniert jetzt
* Vorgefertigte Binärdateien für llama.cpp für 2 Gemma-4-Korrekturen:
  * vocab: Gemma4-Tokenizer beheben ([#21343](https://github.com/ggml-org/llama.cpp/pull/21343))
  * fix: gemma-4-Vorlage ([#21326](https://github.com/ggml-org/llama.cpp/pull/21326))
* Tool-Aufrufe für kleinere Modelle sind jetzt stabiler und werden nicht mehr abgeschnitten
* Vorgefertigte Binärdateien für Windows-, Linux-, Mac- und WSL-Geräte - CPU und GPU
* Spekulative Dekodierung für Nicht-Vision-Modelle hinzugefügt (Gemma-4 ist leider Vision und Qwen3.5)
* Die Kontextlänge wird jetzt korrekt angewendet.
* Die Websuche erhält jetzt tatsächlich Webinhalte und nicht nur Zusammenfassungen
* 90 % weniger HF-API-Aufrufe - weniger Ratenlimits
  {% endupdate %}

{% update date="2026-03-31" tags="new-releases,improvements" %}

## **+50 % genauere Tool-Aufrufe + mehr Unterstützung**

* Tool-Aufrufe für alle Modelle sind jetzt **+30 % bis +80 % genauer.**
* Die Websuche erhält jetzt tatsächlich Webinhalte und nicht nur Zusammenfassungen
* Die Anzahl der erlaubten Tool-Aufrufe wurde von 10 auf 25 erhöht
* Tool-Aufrufe beenden jetzt viel besser, sodass Schleifen / Wiederholungen reduziert werden
* Mehr **Tool-Call-Heilung** und Deduplizierungslogik, um auch zu verhindern, dass Tool-Calls XML auslaufen
* Getestet mit `unsloth/Qwen3.5-4B-GGUF` (`UD-Q4_K_XL`), Websuche + Codeausführung + Denken aktiviert.

| Metrik                        | Vorher | Nachher    |
| ----------------------------- | ------ | ---------- |
| XML-Leaks in der Antwort      | 10/10  | 0/10       |
| Verwendete URL-Abrufe         | 0      | 4/10 Läufe |
| Läufe mit korrekten Songnamen | 0/10   | 2/10       |
| Durchschn. Tool-Aufrufe       | 5.5    | 3.8        |
| Durchschn. Antwortzeit        | 12,3 s | 9,8 s      |

#### Neue Funktionen

* Hinzugefügt **benutzerdefinierte Ordner** damit du jede GGUF in jedem Ordner verwenden kannst - der Zugriff erfolgt vorerst in den erweiterten Einstellungen im Chat und unter Benutzerdefinierte Ordner
* **Update-Button** jetzt sichtbar
* Installationsskript-Styling vollständig aktualisiert!
* Vorläufig **Automatische Multi-GPU-Unterstützung für Inferenz und Training** - nützlich für große Modelle, die nicht auf 1 GPU passen - Studio weist GPU-Ressourcen automatisch zu
* Intel-Macs sollten sofort funktionieren

### Deutlich flüssigeres und schnelleres Studio

* **Zeitüberschreitungen beim Download großer Modelle behoben** - keine Zeitüberschreitungen mehr zu sehen.
* **Ratenbegrenzung bei Hugging Face behoben - HF-API-Aufrufe um 90 % reduziert**
* Bun unter Windows behoben und schnellere Installationen
  {% endupdate %}

{% update date="2026-03-27" tags="new-releases,fixes,improvements" %}

## **Neue wichtige Updates**

Es sind erst 2 Tage seit unserem vorherigen Release vergangen, aber wir haben wichtigere Updates:

* **Inferenz ist jetzt 20–30 % schneller.** Zuvor konnten Tool-Calling und Repeat-Penalty die Inferenz unter normale Geschwindigkeiten verlangsamen. Die Inferenz-Token/s sollten jetzt genauso laufen wie `llama-server` / `llama.cpp`.
* **Erkennt jetzt automatisch ältere oder bereits vorhandene Modelle** heruntergeladen von **LM Studio, Hugging Face,** und ähnlichen Quellen.
* **Die Geschwindigkeit der Inferenz-Token/s wird jetzt korrekt berechnet.** Zuvor enthielten Tokens/s die Startzeit, wodurch die angezeigte Geschwindigkeit langsamer wirkte, als sie tatsächlich war. Sie sollte jetzt die „echte“ Inferenzgeschwindigkeit widerspiegeln.
* **Die CPU-Auslastung steigt nicht mehr sprunghaft an.** Zuvor änderte sich die Identität des Inline-Querier bei jedem Rendern, was `useLiveQuery` dazu brachte, sich kontinuierlich neu anzumelden.
* **Unsloth Studio hat jetzt einen Shutdown-X-Button und fährt korrekt herunter.** Zuvor wurde es nach dem Öffnen über das Desktop-Symbol nicht korrekt geschlossen. Jetzt öffnet der Start über die Verknüpfung auch das Terminal, und das Schließen dieses Terminals beendet Unsloth Studio vollständig. Falls es von einer früheren Sitzung noch geöffnet ist, kannst du deinen Computer neu starten oder `lsof -i :8888` dann `kill -9 <PID>`.
* **Noch besseres Tool-Calling und Websuche** mit weniger Fehlern.
* Aktualisierte Dokumentation mit vielen neuen Informationen zum [Löschen von Modellen, Deinstallieren](/docs/de/neu/studio/install.md#uninstall) usw.
* **Sauberere, intelligentere Protokollierung bei Installation und Setup unter Windows und Linux.** Die Ausgabe ist jetzt mit einheitlicher Formatierung leichter lesbar, standardmäßig leiser für ein flüssigeres Erlebnis und unterstützt umfangreichere `--verbose` Diagnosen, wenn du vollständige technische Details möchtest.
* Du kannst jetzt deinen Trainingsverlauf ansehen!
  {% endupdate %}

{% update date="2026-03-25" tags="new-releases,fixes,improvements" %}

## Erster Release-Beitrag nach Unsloth Studio

Hey Leute, dies ist unser erster Release seit dem Start von Unsloth Studio. Viele neue Funktionen und Korrekturen:

* **Du kannst Unsloth Studio jetzt aktualisieren!** Bitte über dieselben Installationsbefehle aktualisieren.
* **Windows** CPU oder GPU funktioniert jetzt nahtlos. Bitte neu installieren!
* **App-Verknüpfungen**. Nach der Installation kannst du jetzt unter Windows, MacOS und Linux über ein Verknüpfungssymbol im Startmenü / Launcher und auf dem Desktop starten.
* **Vorgefertigte `llama.cpp` Binärdateien** und `mamba_ssm` - 6x schnellere Installationen! Außerdem <300 MB groß für Binärdateien.
* **50 % kleinere Installationsgrößen** (-7 GB oder mehr Einsparung), 2x schnellere Installationen und schnelleres Auflösen. 50 % kleinere PyPI-Größen.
* **Tool-Calling verbessert.** Besseres llama.cpp-Parsing, kein rohes Tool-Markup im Chat, schnellere Inferenz, ein neues Tool-Ausgabe-Panel, Timer.
* MacOS und CPU haben jetzt [Daten-Rezepte](/docs/de/neu/studio/data-recipe.md) mit Upload mehrerer Dateien aktiviert.
* **AMD-Unterstützung vorläufig für Linux** nur Maschinen - automatische Erkennung.
* **Neugestaltung der Einstellungs-Seitenleiste.** Einstellungen sind jetzt gruppiert in **Modell, Sampling, Tools und Präferenzen**
* **Kontextlänge** jetzt anpassbar. Beachte, dass dies nicht nötig ist, da llama.cpp den genau benötigten Kontext intelligent über `--fit on`
* **Upload mehrerer Dateien.** Daten-Rezepte unterstützen jetzt mehrere Drag-and-drop-Uploads für PDF, DOCX, TXT und MD, mit Extraktion im Backend, gespeicherten Uploads und verbesserten Vorschauen.
* **Colab** mit kostenlosen T4-GPUs funktioniert jetzt mit Unsloth Studio! [Hier ausprobieren](https://colab.research.google.com/github/unslothai/unsloth/blob/main/studio/Unsloth_Studio_Colab.ipynb). Dank vorgefertigter Binärdateien ist es außerdem 20x schneller!
* **Bessere Chat-Beobachtbarkeit.** Studio zeigt jetzt `llama-server` Zeitmessungen und Nutzung, eine Kontextfenster-Nutzungsleiste und reichhaltigere Hover-Karten für Quellen an.
* **Insgesamt bessere UX** - anklickbare Links, bessere LaTeX-Analyse, Tool-/Code-/Web-Tooltips für Standardkarten und vieles mehr!
* **LiteLLM -** Unsloth Studio und Unsloth waren **NICHT** vom jüngsten LiteLLM-Kompromiss betroffen. Nemo Data Designer verwendete LiteLLM nur bis `1.80`, nicht die betroffene `1.82.7` oder `1.82.8`, und hat es seitdem vollständig entfernt.
* Wir haben jetzt einen neuen Installationsbefehl in einer Zeile, führe einfach aus:&#x20;

  <pre class="language-bash" data-overflow="wrap" data-expandable="true"><code class="lang-bash">curl -fsSL https://unsloth.ai/install.sh | sh
  </code></pre>

#### **Korrekturen:**

* **Verbesserungen für Windows/Setup.** Behebt stille Windows-Beendigungen, Startabstürze mit Anaconda/conda-forge, fehlerhafte Nicht-NVIDIA-Windows-Installationen und fehlende frühe CUDA-/veraltete-Venv-Setup-Prüfungen.
* **System-Prompts behoben.** Sie funktionieren wieder für Text- und Vision-Inferenz außerhalb von GGUFs.
* **Persistente System-Prompts und Presets.** Benutzerdefinierte System-Prompts und Chat-Presets bleiben jetzt über Neuladen und Seitenwechsel hinweg erhalten.
* **GGUF-Export erweitert.** Vollständige Fine-Tunes, nicht nur LoRA/PEFT, können jetzt als GGUF exportiert werden. Die Auflösung des Basismodells ist zuverlässiger, und nicht unterstützte Exportoptionen sind in der UI deaktiviert.
* **Korrekturen für Chat-Scroll/Layout.** Behoben wurden Probleme mit der Scrollposition während der Generierung, Layout-Verschiebungen im Thinking-Panel und Viewport-Sprünge beim Einklappen von Reasoning-Panels.
* **Intelligentere Erkennung von Portkonflikten.** Studio erkennt jetzt Loopback-Konflikte, kann wenn möglich den blockierenden Prozess identifizieren und gibt klarere Meldungen zum Fallback-Port.
  {% endupdate %}

{% update date="2026-03-17" tags="fixes,improvements" %}

## Neue Tool-Aufrufe + Windows-Stabilität

* Claude Artifacts funktioniert so, dass HTML wie ein Snake-Spiel innerhalb des Chats ausgeführt werden kann
* +30 % präzisere Tool-Aufrufe, besonders für kleine Modelle + Timer für Tool-Aufrufe
* Tool- und Websuche-Ausgaben können gespeichert werden + Auto-Healing-Tool ein-/ausschalten
* Viele Fehlerbehebungen - Windows-CPU funktioniert, Mac nahtloser, schnellere und kleinere Installationen
  {% endupdate %}
  {% endupdates %}


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://unsloth.ai/docs/de/neu/changelog.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
