rssRSSフィード

sparklesUnsloth の更新情報

最新リリース、改善、修正に関する Unsloth の変更履歴。

最新の変更を利用するには、Unsloth を更新してください。

新しい重要な更新

前回のリリースからまだ2日しか経っていませんが、より重要な更新があります:

  • 推論が20~30%高速化しました。 以前は、ツール呼び出しとリピートペナルティにより、推論速度が通常より遅くなることがありました。これからは推論トークン/秒が以下と同等に動作するはずです llama-server / llama.cpp.

  • 古いモデルまたは既存のモデルを自動検出するようになりました からダウンロードされた LM Studio、Hugging Face、 および同様のソース。

  • 推論トークン/秒の速度が正しく計算されるようになりました。 以前は、tokens/s に起動時間が含まれていたため、表示される速度が実際より遅く見えていました。これからは「真の」推論速度を反映するはずです。

  • CPU使用率が急上昇しなくなりました。 以前は、inline querier の ID が毎回のレンダーで変わっていたため、 useLiveQuery が継続的に再サブスクライブしていました。

  • Unsloth Studio に終了用の x ボタンが追加され、正しく終了するようになりました。 以前は、デスクトップアイコンから開いた後に閉じても正しく終了しませんでした。今では、ショートカットから起動すると端末も開き、その端末を閉じると Unsloth Studio が完全に終了します。前回のセッションからまだ開いたままの場合は、コンピュータを再起動するか、 lsof -i :8888 を実行してから、 kill -9 <PID>.

  • さらに改善されたツール呼び出しとウェブ検索 エラーを減らしました。

  • 多くの新情報を含む更新済みドキュメント モデルの削除、アンインストール など。

  • Windows と Linux 全体で、よりすっきりして賢いインストールおよびセットアップのログ記録。 出力は、統一された書式で読みやすくなり、デフォルトでは静かになってより滑らかな体験になり、より豊富な --verbose 診断情報に対応しており、完全な技術詳細が必要なときに利用できます。

  • トレーニング履歴を表示できるようになりました!

Unsloth Studio 後の最初のリリース

みなさん、Unsloth Studio を公開してから最初のリリースです。たくさんの新機能と修正があります:

  • Unsloth Studio を更新できるようになりました! 次の方法で更新してください: unsloth studio update

  • Windows CPU または GPU がシームレスに動作するようになりました。再インストールしてください!

  • アプリのショートカット。インストール後は、Windows、MacOS、Linux で、Start / Launch と Desktop のショートカットアイコンから起動できるようになりました。

  • 事前コンパイル済み llama.cpp バイナリ および mamba_ssm - インストールが6倍高速に!バイナリのサイズも300MB未満です。

  • インストールサイズを50%削減 (7GB以上の節約)、インストールが2倍高速になり、解決も高速化しました。pypi サイズも50%小さくなりました。

  • ツール呼び出しが改善されました。 llama.cpp の解析が改善され、チャットに生のツールマークアップが表示されず、推論が高速化し、新しい Tool Outputs パネルとタイマーが追加されました。

  • MacOS と CPU では現在 データレシピ が有効になり、複数ファイルのアップロードに対応しています。

  • Linux 向けの AMD サポートは暫定対応 のみのマシン - 自動検出します。

  • 設定サイドバーの再設計。 設定は現在、 モデル、サンプリング、ツール、設定

  • コンテキスト長 を調整できるようになりました。これは不要であることに注意してください。llama.cpp は以下を使って必要な正確なコンテキストを賢く使用するためです --fit on

  • 複数ファイルのアップロード。 データレシピは、PDF、DOCX、TXT、MD の複数のドラッグ&ドロップアップロード、バックエンド抽出、保存されたアップロード、改善されたプレビューに対応しました。

  • Colab Unsloth Studio で無料の T4 GPU が使えるものは、現在修正されています! こちらで試してくださいarrow-up-right。事前コンパイル済みバイナリのおかげで、20倍高速にもなっています!

  • チャットの可観測性が改善されました。 Studio では現在 llama-server タイミングと使用量、コンテキストウィンドウ使用量バー、より豊富なソースのホバーカードが表示されます。

  • 全体的な UX が改善 - クリック可能なリンク、より良い LaTeX 解析、デフォルトカード用のツール / コード / Web ツールチップなど、さらに多くの機能があります!

  • LiteLLM - Unsloth Studio と Unsloth は 影響を受けていません 最近の LiteLLM 侵害の影響を受けていません。Nemo Data Designer は LiteLLM を 1.80までしか使用しておらず、影響を受けた 1.82.7 または 1.82.8ではなく、その後完全に削除しました。

  • 新しい1行インストールコマンドがあります。次を実行するだけです:

修正:

  • Windows/セットアップの改善。 Windows のサイレント終了、Anaconda/conda-forge の起動クラッシュ、壊れた非 NVIDIA Windows インストール、早期 CUDA の欠落/古い venv のセットアップチェックの欠如を修正しました。

  • システムプロンプトを修正しました。 非 GGUF のテキストおよびビジョン推論で再び動作します。

  • 永続的なシステムプロンプトとプリセット。 カスタムのシステムプロンプトとチャットプリセットが、再読み込みやページ変更をまたいで保持されるようになりました。

  • GGUF エクスポートを拡張。 LoRA/PEFT だけでなく、完全なファインチューニングも GGUF にエクスポートできるようになりました。ベースモデルの解決はより信頼性が高くなり、サポートされていないエクスポートオプションは UI で無効化されています。

  • チャットのスクロール/レイアウト修正。 生成中のスクロール位置の問題、thinking パネルのレイアウトずれ、推論パネルを折りたたんだときのビューポートのジャンプを修正しました。

  • より賢いポート競合検出。 Studio がループバック競合を検出し、可能な場合はブロックしているプロセスを特定し、フォールバックポートのメッセージをより分かりやすく表示するようになりました。

新しいツール呼び出し + Windows の安定性

  • Claude Artifacts が動作するので、HTML をチャット内でスネークゲームのように実行できます

  • ツール呼び出しの精度が30%向上、特に小型モデルで向上 + ツール呼び出し用タイマー

  • Tool + Web Search の出力を保存可能 + 自動修復ツールのオン/オフ切り替え

  • 多くのバグ修正 - Windows の CPU で動作、Mac はよりシームレスに、より速く、より小さいインストール

最終更新

役に立ちましたか?