📱iOS または Android 携帯で LLM を実行・デプロイする方法

独自の LLM をファインチューニングして ExecuTorch を使って Android や iPhone にデプロイするチュートリアル。

トレーニングした大規模言語モデル（LLM）をその後どのように ローカルにデプロイできるかをお見せします から Android電話 および iPhone。我々は協力しました： ExecuTorch （PyTorch & Meta と連携）で、量子化を意識したトレーニング（QAT）を用いた効率的なワークフローを作成し、その後エッジデバイスに直接デプロイします。使用するのは Unsloth、TorchAO、ExecuTorch で、以下を示します：

Meta が Instagram や WhatsApp で数十億人に提供しているのと同じ技術（ExecuTorch）を使用する
Qwen3-0.6B をローカルにデプロイする Pixel 8 および iPhone 15 Pro で約 40 トークン/秒
TorchAO を介した QAT を適用して精度の70%を回復する
プライバシー重視、即時応答、オフライン機能を得る
当社の無料のColabノートブック Qwen3 0.6B をファインチューニングしてフォン向けにエクスポートする

iOSチュートリアル Androidチュートリアル

Qwen3-4B を iPhone 15 Pro にデプロイしました

Qwen3-0.6B は約 40 トークン/秒で動作しています

🦥 モデルのトレーニング

我々は Qwen3、Gemma3、Llama3、Qwen2.5、Phi4 など多くのモデルのフォンデプロイをサポートしています！以下の手順に従ってください： 無料のColabノートブック Qwen3-0.6B のデプロイ用：

Google Colabcolab.research.google.com

まず Unsloth を更新し、TorchAO と Executorch をインストールします。

pip install --upgrade unsloth unsloth_zoo
pip install torchao==0.14.0 executorch pytorch_tokenizers

その後単に以下を使います qat_scheme = "phone-deployment" これは電話にデプロイしたいことを示します。完全ファインチューニングのために以下も設定している点に注意してください： full_finetuning = True 完全ファインチューニングのために設定しています！

from unsloth import FastLanguageModel
import torch
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/Qwen3-0.6B",
    max_seq_length = 1024,
    full_finetuning = True,
    qat_scheme = "phone-deployment", # 電話デプロイ用のフラグ
)

我々は使用しています qat_scheme = "phone-deployment" 実際には次を使用します qat_scheme = "int8-int4" 内部的に Unsloth/TorchAO の QAT を有効にするために使用し、 をシミュレートします 線形層に対してトレーニング中に（偽量子化操作を介して）INT8 の動的アクティベーション量子化と INT4 の重み量子化をシミュレートしつつ、計算は 16 ビットで行います。トレーニング後にモデルは実際の量子化バージョンに変換されるため、オンデバイスのモデルは小さくなり通常は 単純な PTQ よりも精度を保ちます.

前述のファインチューニングの後、 Colab ノートブックその後我々はそれを .pte ファイルとして Executorch 経由で保存します：

# 重みチェックポイントの state dict キーを ExecuTorch が期待する形式に変換
python -m executorch.examples.models.qwen3.convert_weights "phone_model" pytorch_model_converted.bin
# ExecuTorch リポジトリからモデル設定をダウンロード
curl -L -o 0.6B_config.json https://raw.githubusercontent.com/pytorch/executorch/main/examples/models/qwen3/config/0_6b_config.json
# ExecuTorch pte ファイルにエクスポート
python -m executorch.examples.models.llama.export_llama \
    --model "qwen3_0_6b" \
    --checkpoint pytorch_model_converted.bin \
    --params 0.6B_config.json \
    --output_name qwen3_0.6B_model.pte \
    -kv --use_sdpa_with_kv_cache -X --xnnpack-extended-ops \
    --max_context_length 1024 --max_seq_length 128 --dtype fp32 \
    --metadata '{"get_bos_id":199999, "get_eos_ids":[200020,199999]}'

🏁 トレーニング後のデプロイ

そして今、あなたの qwen3_0.6B_model.pte ファイル（サイズは約 472MB）を使ってデプロイできます！デバイスを選んですぐに始めましょう：

Run LLMs on your Phone – Xcode 経由（シミュレータまたはデバイス）
Run LLMs on your Phone – コマンドライン経由（Studio 不要）

iOS デプロイ

iOS 上でモデルを動かすためのチュートリアル（iPhone 16 Pro でテスト済みですが他の iPhone でも動作します）。Xcode 15 を実行できる物理的な macOS デバイスが必要です。

macOS 開発環境のセットアップ

Xcode とコマンドラインツールをインストール

Mac App Store から Xcode をインストール（バージョン 15 以降が必要）
ターミナルを開いてインストールを確認： xcode-select -p
コマンドラインツールをインストールしてライセンスに同意：
1. xcode-select --install
2. sudo xcodebuild -license accept
Xcode を初めて起動して、求められたら追加コンポーネントをインストールしてください
プラットフォーム選択を求められたら、iOS 18 を選んでシミュレータ用にダウンロードしてください

重要：最初の Xcode 起動は重要です！追加コンポーネントのインストールをスキップしないでください！詳しくはここおよびここ追加のヘルプをご参照ください。

すべてが動作するか確認： xcode-select -p

パスが表示されるはずです。表示されない場合はステップ 3 を繰り返してください。

Apple デベロッパーアカウントの設定

物理デバイス用のみ！

iOS シミュレータのみを使用する場合はこのセクション全体をスキップしてください。物理的な iPhone にデプロイするには有料のデベロッパーアカウントが必要です。

Apple ID を作成する

Apple ID を持っていませんか？ここでサインアップ.

アカウントを Xcode に追加する

Xcode を開く
Xcode → Settings → Accounts に移動
+ ボタンをクリックして Apple ID を選択
通常の Apple ID でサインイン

Apple Developer Program に登録する

ExecuTorch は increased-memory-limit 機能を必要とし、これは有料デベロッパーアカウントが必要です：

へアクセスしてください： developer.apple.com
Apple ID でサインイン
Apple Developer Program に登録する

ExecuTorch デモアプリのセットアップ

サンプルコードを取得：

# LLM サンプルアプリを直接ダウンロード
curl -L https://github.com/meta-pytorch/executorch-examples/archive/main.tar.gz | \
  tar -xz --strip-components=2 executorch-examples-main/llm/apple

Xcode で開く

を開く apple/etLLM.xcodeproj を Xcode で
上部ツールバーでターゲットデバイスとして iPhone 16 Pro シミュレータを選択
再生（▶️）を押してビルドと実行

🎉 成功！アプリがシミュレータで起動するはずです。まだ動作しません—モデルを追加する必要があります。

シミュレータへのデプロイ

デベロッパーアカウントは不要です。

モデルファイルを準備する

Xcode のシミュレータを停止（停止ボタンを押す）
HuggingFace Hub のリポジトリに移動（ローカルに保存していない場合）
次の 2 つのファイルをダウンロード：
1. qwen3_0.6B_model.pte （エクスポートしたモデル）
2. tokenizer.json（トークナイザ）

シミュレータ上に共有フォルダを作成する

シミュレータの仮想ホームボタンをクリック
Files アプリ → Browse → On My iPhone を開く
省略記号（•••）ボタンをタップして新しいフォルダを作成し、名前を Qwen3test

ターミナルを使ってファイルを転送する

# シミュレータの隠しフォルダを見つける
find ~/Library/Developer/CoreSimulator/Devices/ -type d -iname "*Qwen3test*"

フォルダが見つかったら次を実行：

cp tokenizer.json /path/to/Qwen3test/tokenizer.json
cp qwen3_0.6B_model.pte /path/to/Qwen3test/qwen3_model.pte

ロードしてチャット開始

シミュレータ上で etLLM アプリに戻り、起動するためにタップします。

Qwen3test フォルダからモデルとトークナイザをロード

ファインチューニング済みモデルでチャットを開始！ 🎉

物理 iPhone へのデプロイ

初期デバイスセットアップ

iPhone を USB 経由で Mac に接続
iPhone のロックを解除して「このデバイスを信頼」をタップ
Xcode で Window → Devices and Simulators に移動
デバイスが左側に表示されるまで待つ（しばらく「Preparing」と表示されることがあります）

Xcode の署名設定を構成

Apple アカウントを追加：Xcode → Settings → Accounts → +
プロジェクトナビゲータで etLLM プロジェクト（青いアイコン）をクリック
TARGETS の下で etLLM を選択
Signing & Capabilities タブに移動
「Automatically manage signing」をチェック
ドロップダウンから Team を選択

Bundle Identifier を一意のものに変更（例：com.yourname.etLLM）。これでプロビジョニングプロファイルのエラーの 99% が解決します

必要な機能を追加

Signing & Capabilities のまま、+ Capability をクリック
「Increased Memory Limit」を検索して追加

ビルドと実行

上部ツールバーでデバイスセレクタから物理 iPhone を選択
再生（▶️）を押すか Cmd + R を押す

デベロッパー証明書を信頼する

最初のビルドは失敗します—これは正常です！

iPhone で Settings → Privacy & Security → Developer Mode に進む
オンに切り替える
警告に同意して承諾する
デバイスを再起動し、Xcode に戻って再度再生を押す

デベロッパーモードにより Xcode が iPhone にアプリを実行・インストールできるようになります

モデルファイルを iPhone に転送

アプリが実行されたら、Mac で Finder を開く
サイドバーであなたの iPhone を選択
Files タブをクリック
etLLM を展開
.pte と tokenizer.json ファイルをこのフォルダに直接ドラッグ＆ドロップ
注意してください！これらのファイルは大きく数分かかる場合があります

ロードしてチャット開始

iPhone で etLLM アプリに切り替える

アプリインターフェースからモデルとトークナイザをロード

あなたのファインチューニング済み Qwen3 が今、iPhone 上でネイティブに動作しています！

Android デプロイ

このガイドは、Linux/Mac のコマンドライン環境を使用して ExecuTorch Llama デモアプリを Android デバイスにビルド・インストールする方法を説明します（Pixel 8 でテスト済みだが他の Android でも動作します）。この方法は依存関係を最小化し（Android Studio 不要）、重いビルド作業を PC に任せます。

必要条件

開発マシンに次がインストールされていることを確認してください：

Java 17（Java 21 がデフォルトの場合があるがビルド問題を引き起こすことがある）
Git
Wget / Curl
Android コマンドラインツール
のインストールガイドとセットアップ adb をあなたの Android とコンピュータに導入する

確認

Java バージョンが 17.x と一致するか確認：

# 出力は次のように表示されるはず： openjdk version "17.0.x"
java -version

一致しない場合は Ubuntu/Debian 経由でインストール：

sudo apt install openjdk-17-jdk

その後デフォルトに設定するか、以下をエクスポート JAVA_HOME:

export JAVA_HOME=/usr/lib/jvm/java-17-openjdk-amd64
export PATH=$JAVA_HOME/bin:$PATH

別の OS やディストリビューションを使用している場合は、このガイドに従うか、お気に入りの LLM にガイドを依頼してください。

ステップ 1: Android SDK と NDK のインストール

フルの Android Studio を使わずに最小限の Android SDK 環境を設定します。

1. SDK ディレクトリを作成：

mkdir -p ~/android-sdk/cmdline-tools
cd ~/android-sdk

Android コマンドラインツールをインストール

wget https://dl.google.com/android/repository/commandlinetools-linux-11076708_latest.zip
unzip commandlinetools-linux-*.zip -d cmdline-tools

# 重要：SDK 構造を満たすように再配置
mv cmdline-tools/cmdline-tools cmdline-tools/latest

ステップ 2: 環境変数を設定

次をあなたの ~/.bashrc または ~/.zshrc:

に追加します：
export ANDROID_HOME=$HOME/android-sdk
export PATH=$ANDROID_HOME/cmdline-tools/latest/bin:$PATH

export PATH=$ANDROID_HOME/platform-tools:$PATH

それらを再読み込み：

source ~/.zshrc # またはシェルに応じて ~/.bashrc

ステップ 3: SDK コンポーネントをインストール

ExecuTorch は特定の NDK バージョンを要求します。
# ライセンスに同意

yes | sdkmanager --licenses
# API 34 と NDK 25 をインストール

sdkmanager "platforms;android-34" "platform-tools" "build-tools;34.0.0" "ndk;25.0.8775105"

NDK 変数を設定：

export ANDROID_NDK=$ANDROID_HOME/ndk/25.0.8775105

ステップ 4: コードを取得 我々は executorch-examples

リポジトリを使用します。ここには更新された Llama デモが含まれています。
cd ~
git clone https://github.com/meta-pytorch/executorch-examples.git

cd executorch-examples

ステップ 5: 一般的なコンパイル問題を修正

現在のコードにこれらの問題はないことが多いですが、過去に遭遇した問題で役立つ場合があります：

"SDK Location not found" を修正： local.properties ファイルを作成して Gradle に SDK の場所を明示的に伝える：

echo "sdk.dir=$HOME/android-sdk" > llm/android/LlamaDemo/local.properties

次を修正： cannot find symbol エラー：

現在のコードは非推奨メソッド getDetailedError()を使用しています。

以下のコマンドでパッチを当てます：

sed -i 's/e.getDetailedError()/e.getMessage()/g' llm/android/LlamaDemo/app/src/main/java/com/example/executorchllamademo/MainActivity.java

ステップ 6: APK をビルド

このステップではアプリとネイティブライブラリをコンパイルします。
```
Android プロジェクトに移動：
```
cd llm/android/LlamaDemo JAVA_HOME Gradle でビルド（ツールチェーンエラーを避けるために明示的に
を 17 に設定）：
```
export JAVA_HOME=/usr/lib/jvm/java-17-openjdk-amd64
注意：最初の実行は数分かかります。
```

./gradlew :app:assembleDebug

生成された apk は次にあります：

app/build/outputs/apk/debug/app-debug.apk

ステップ 7: Android デバイスにインストール

アプリをインストールする方法は 2 つあります。

オプション A: ADB（有線/無線）を使用 adb 電話に

アクセスできる場合：

adb install -r app/build/outputs/apk/debug/app-debug.apk

オプション B: 直接ファイル転送

リモート VM 上にいる、またはケーブルがない場合：
app-debug.apk を電話でダウンロード可能な場所にアップロード
電話でダウンロード

タップしてインストール（促されたら「提供元不明のアプリのインストールを許可」を有効に）

ステップ 8: モデルファイルを転送

アプリは .pte モデルとトークナイザファイルを必要とします。
ファイルを転送：model.pte と tokenizer.bin（または tokenizer.model）を電話のストレージ（例：Downloads）に移動します。
LlamaDemo アプリを開く：電話でアプリを起動
モデルを選択
設定（歯車アイコン）またはファイルピッカーをタップ
Download フォルダに移動
.pte ファイルを選択

トークナイザファイルを選択

トラブルシューティング

完了！これでデバイス上で直接 LLM とチャットできます。
ビルドが失敗しますか？java -version を確認してください。必ず 17 である必要があります。 .pte モデルがロードされませんか？両方とも選択したことを確認してください： と.
トークナイザ .pte アプリがクラッシュしますか？有効な

ファイルは通常 CPU 用の XNNPACK バックエンドなど、ExecuTorch 用に特別にエクスポートされている必要があります。

モデルを電話に転送する 現在、 executorchllama

我々がビルドしたアプリは Android 上で特定のディレクトリからのみモデルをロードすることをサポートしており、そのディレクトリは通常のファイルマネージャからはアクセスできません。しかし adb を使えばそのディレクトリにモデルファイルを保存できます。

adb が正しく動作し接続されていることを確認してください

adb devices
無線デバッグで接続している場合、次のように表示されます：
または有線で接続している場合：

コンピュータが電話へアクセスする許可を与えていない場合は：

電話に表示される許可ダイアログを確認して（許可したい場合は許可してください） .pte および 準備ができたら、配置先の tokenizer.json

ファイル用のフォルダを作成します。

電話上の指定パスにディレクトリを作成します。
adb shell mkdir -p /data/local/tmp/llama

adb shell chmod 777 /data/local/tmp/llama

ディレクトリが正しく作成されたことを確認します。
adb shell ls -l /data/local/tmp/llama

total 0

内容をそのディレクトリにプッシュします。これには数分かかる場合があります。しばらく待ってください。
adb push <path_to_tokenizer.json on your computer> /data/local/tmp/llama

adb push <path_to_model.pte on your computer> /data/local/tmp/llama インストールした executorchllamademo
アプリを開き、右上の歯車アイコンをタップして設定を開きます。
Model の横の矢印をタップしてピッカーを開きモデルを選択します。ファイル名が表示されない空白の白いダイアログが出る場合は、ADB によるモデルのプッシュが失敗しています—その手順をやり直してください。初めは「モデル未選択」と表示されることがあります。

モデルを選択すると、アプリにモデルのファイル名が表示されるはずです。

次にトークナイザについても同じ操作を繰り返します。トークナイザ欄の横の矢印をクリックして対応するファイルを選択してください。

アップロードするモデルによってはモデルタイプを選択する必要がある場合があります。ここでは Qwen3 が選択されています。

両方のファイルを選択したら「Load Model」ボタンをクリックします。

チャットウィンドウのある元の画面に戻り、「model loading」と表示されることがあります。電話の RAM やストレージ速度によってはロードに数秒かかる場合があります。

📱「successfully loaded model」と表示されたら、モデルとチャットを開始できます。さあ、これで Android 電話上でネイティブに LLM が動作しています！

ExecuTorch ExecuTorch は数十億人を支えています数十億人向けのオンデバイス機械学習体験を支えます Instagram、WhatsApp、Messenger、Facebook 上で。Instagram Cutouts は写真から編集可能なステッカーを抽出するために ExecuTorch を使用しています。Messenger のような暗号化されたアプリでは、ExecuTorch がオンデバイスでのプライバシー配慮型の言語識別と翻訳を可能にします。ExecuTorch は Apple、Qualcomm、ARM などを含む十数のハードウェアバックエンドをサポートし、.

Meta の Quest 3 や Ray-Ban

その他のモデルサポートQwen3-0.6B, Qwen3-4B, すべての Qwen 3 デンスモデル（ Qwen3-32B
等）すべての Gemma 3 モデル（, Gemma3-270M, Gemma3-4B Qwen3-32B
Gemma3-27Bすべての Llama 3 モデル（, Llama 3.3 70B Instruct Qwen3-32B
Llama 3.1 8B

Qwen 2.5、Phi 4 Mini モデル、その他多数！ 無料のColabノートブック あなたは以下をカスタマイズできます：

Qwen3-0.6B 用にフォンデプロイを可能にするための設定は上記のどのモデルにも適用できます！

Google Colabcolab.research.google.com

Qwen3 0.6B のメインフォンデプロイノートブック

Google Colabcolab.research.google.com

Gemma 3 と互換

Google Colabcolab.research.google.com

Llama 3 と互換 Unsloth ノートブック他のすべてのノートブックは我々の

ページにあります！

🌵 Cactus を使った電話向けのデプロイ Cactus

はモバイルデバイス、Mac、Raspberry Pi のような ARM チップ向けのオープンソース推論エンジンです。 Qwen3-0.6B および INT8 で、Cactus は LFM2-1.2B を 60-70 toks/sec で iPhone 17 Pro 上で実行します、 13-18 toks/sec
は予算型 Pixel 6a 上での速度です。 タスク特化の INT8 チューンされた Gemma3-270m は 150 toks/sec を iPhone 17 Pro で達成し、 23 toks/sec

を Raspberry Pi で達成します。

クイックスタート

1. トレーニング（Google Colab / GPU）

from unsloth import FastLanguageModel

model, tokenizer = FastLanguageModel.from_pretrained(
    提供されたノートブックまたは自分の Unsloth トレーニングスクリプトを使用：
    model_name="unsloth/gemma-3-4b-it",
    max_seq_length=2048,
)

model = FastLanguageModel.get_peft_model(
    model,
    r=16,
    load_in_4bit=True,
                    target_modules=["q_proj", "k_proj", "v_proj", "o_proj",
    lora_alpha=16,
    lora_dropout=0,
    use_gradient_checkpointing="unsloth",
)

"gate_proj", "up_proj", "down_proj"],

# ... SFTTrainer でトレーニング ...
# アダプタを保存
model.save_pretrained("my-lora-adapter")

tokenizer.save_pretrained("my-lora-adapter")
# Hub にプッシュ（任意）

model.push_to_hub("username/my-lora-adapter")

2. Cactus をセットアップ

git clone https://github.com/cactus-compute/cactus && cd cactus && source ./setup

3. Cactus 用に変換
# ローカルアダプタから：正しいベースモデルを使用！ 

cactus convert Qwen/Qwen3-0.6B ./my-qwen3-0.6b --lora ./my-lora-adapter
# HuggingFace Hub から：正しいベースモデルを使用！

cactus convert Qwen/Qwen3-0.6B ./my-qwen3-0.6b --lora username/my-lora-adapter

4. 実行

Mac でモデルをテスト：

cactus run ./my-qwen3-0.6b

5. iOS/macOS アプリで使用

ネイティブライブラリをビルド：

cactus build --apple
ビルド完了！
合計時間：58 秒
  静的ライブラリ：
  Device: /Users/henry/Desktop/cactus/apple/libcactus-device.a
Simulator: /Users/henry/Desktop/cactus/apple/libcactus-simulator.a
  XCFrameworks：
  iOS: /Users/henry/Desktop/cactus/apple/cactus-ios.xcframework
macOS: /Users/henry/Desktop/cactus/apple/cactus-macos.xcframework
Apple ビルド完了！

リンク (venv) henry@Henrys-MacBook-Air cactus % cactus-ios.xcframework

を Xcode プロジェクトに追加し、次に：

import Foundation
// アプリバンドルからモデルを読み込む
let modelPath = Bundle.main.path(forResource: "my-model", ofType: nil)!

let model = cactus_init(modelPath, 2048, nil)
// 補完を実行
let messages = "[{\"role\":\"user\",\"content\":\"Hello!\"}]"
var response = [CChar](repeating: 0, count: 4096)
cactus_complete(model, messages, &response, response.count, nil, nil, nil, nil)

print(String(cString: response))
cactus_destroy(model)

以下のコードを使用してiOSアプリをビルドできますが、テスト中に任意のデバイスでのパフォーマンスを確認するには、iPhoneをMacに接続して次を実行してcactusテストを実行してください:

cactus test --<model-path-or-name> --ios

Cactusのデモアプリは最終的にカスタムのファインチューニングを利用するよう拡張されます。さらに、 cactus run は電話を接続できるようにし、対話セッションが電話のチップを使用するようにするため、アプリを完全に構築する前にテストできます。

6. Androidアプリでの使用

5. iOS/macOS アプリで使用

cactus build --android

cactus build --apple
共有ライブラリの場所: /Users/henry/Desktop/cactus/android/libcactus.so
静的ライブラリの場所: /Users/henry/Desktop/cactus/android/libcactus.a
Androidのビルドが完了しました！
Apple ビルド完了！

コピー libcactus.so から app/src/main/jniLibs/arm64-v8a/、その後:

class CactusWrapper {
    init { System.loadLibrary("cactus") }

    external fun init(modelPath: String, contextSize: Long, corpusDir: String?): Long
    external fun complete(model: Long, messagesJson: String, bufferSize: Int): String
    external fun destroy(model: Long)
}

// 使用例
val cactus = CactusWrapper()
val model = cactus.init("/data/local/tmp/my-model", 2048, null)
val response = cactus.complete(model, """[{"role":"user","content":"Hello!"}]""", 4096)
cactus.destroy(model)

以下のコードを使用してAndroidアプリをビルドできますが、テスト中に任意のデバイスでのパフォーマンスを確認するには、AndroidフォンをMacに接続して次を実行してcactusテストを実行してください:

cactus test --<model-path-or-name> --android

リソース

サポートされているベースモデル: Qwen3、Gemma3、LFM2、SmolLM2
完全なAPIリファレンス: Cactus エンジン
詳細とバグ報告: 🌵 Cactus を使った電話向けのデプロイ

前へQuantization-Aware Training 次へUnsloth Docker Guide

最終更新 1 か月前

役に立ちましたか？

hashtag🦥 モデルのトレーニング

hashtag🏁 トレーニング後のデプロイ

hashtagapple iOS デプロイ

hashtagmacOS 開発環境のセットアップ

hashtagApple デベロッパーアカウントの設定

hashtagアカウントを Xcode に追加する

hashtagApple Developer Program に登録する

hashtagExecuTorch デモアプリのセットアップ

hashtagシミュレータへのデプロイ

hashtag物理 iPhone へのデプロイ

hashtagandroid Android デプロイ

hashtag必要条件

hashtag確認

hashtagステップ 1: Android SDK と NDK のインストール

hashtagステップ 2: 環境変数を設定

hashtagsource ~/.zshrc # またはシェルに応じて ~/.bashrc

hashtagexport ANDROID_NDK=$ANDROID_HOME/ndk/25.0.8775105

hashtagcd executorch-examples

hashtagsed -i 's/e.getDetailedError()/e.getMessage()/g' llm/android/LlamaDemo/app/src/main/java/com/example/executorchllamademo/MainActivity.java

hashtagapp/build/outputs/apk/debug/app-debug.apk

hashtagアプリをインストールする方法は 2 つあります。

hashtagadb install -r app/build/outputs/apk/debug/app-debug.apk

hashtagタップしてインストール（促されたら「提供元不明のアプリのインストールを許可」を有効に）

hashtagトラブルシューティング

hashtagファイルは通常 CPU 用の XNNPACK バックエンドなど、ExecuTorch 用に特別にエクスポートされている必要があります。

hashtag📱「successfully loaded model」と表示されたら、モデルとチャットを開始できます。 さあ、これで Android 電話上でネイティブに LLM が動作しています！

hashtagMeta の Quest 3 や Ray-Ban

hashtagページにあります！

hashtagを Raspberry Pi で達成します。

hashtagクイックスタート

hashtagmodel.push_to_hub("username/my-lora-adapter")

hashtaggit clone https://github.com/cactus-compute/cactus && cd cactus && source ./setup

hashtagcactus convert Qwen/Qwen3-0.6B ./my-qwen3-0.6b --lora username/my-lora-adapter

hashtagcactus run ./my-qwen3-0.6b

hashtag6. Androidアプリでの使用

hashtagリソース

🦥 モデルのトレーニング

🏁 トレーニング後のデプロイ

iOS デプロイ

macOS 開発環境のセットアップ

Apple デベロッパーアカウントの設定

アカウントを Xcode に追加する

Apple Developer Program に登録する

ExecuTorch デモアプリのセットアップ

シミュレータへのデプロイ

物理 iPhone へのデプロイ

Android デプロイ

必要条件

確認

ステップ 1: Android SDK と NDK のインストール

ステップ 2: 環境変数を設定

source ~/.zshrc # またはシェルに応じて ~/.bashrc

export ANDROID_NDK=$ANDROID_HOME/ndk/25.0.8775105

cd executorch-examples

sed -i 's/e.getDetailedError()/e.getMessage()/g' llm/android/LlamaDemo/app/src/main/java/com/example/executorchllamademo/MainActivity.java

app/build/outputs/apk/debug/app-debug.apk

アプリをインストールする方法は 2 つあります。

adb install -r app/build/outputs/apk/debug/app-debug.apk

タップしてインストール（促されたら「提供元不明のアプリのインストールを許可」を有効に）

トラブルシューティング

ファイルは通常 CPU 用の XNNPACK バックエンドなど、ExecuTorch 用に特別にエクスポートされている必要があります。

📱「successfully loaded model」と表示されたら、モデルとチャットを開始できます。さあ、これで Android 電話上でネイティブに LLM が動作しています！

Meta の Quest 3 や Ray-Ban

ページにあります！

を Raspberry Pi で達成します。

クイックスタート

model.push_to_hub("username/my-lora-adapter")

git clone https://github.com/cactus-compute/cactus && cd cactus && source ./setup

cactus convert Qwen/Qwen3-0.6B ./my-qwen3-0.6b --lora username/my-lora-adapter

cactus run ./my-qwen3-0.6b

6. Androidアプリでの使用

リソース