Chrome内蔵AI(Prompt API)
Chrome 148に搭載されたGemini Nanoを使い、インストール不要・サーバー不要でブラウザ内ローカルAI推論を体験
Chrome Prompt API とは
Gemini Nano 内蔵
Chrome 148以降にGemini Nanoモデル(約4GB)が組み込まれています。ダウンロード後はオフラインでも推論可能。
ゼロレイテンシ
ネットワーク往復なし。プロンプト送信から応答開始まで数ミリ秒。従来のクラウドAPIでは不可能な即時性。
完全ローカル処理
入力テキストはブラウザの外に出ません。個人情報・機密データを含むテキストも安全に処理可能。
API費用ゼロ
OpenAI APIやGemini API Pro等と異なり、従量課金なし。何度でも無料で推論を実行できます。
インストール不要
npm installもサーバー構築も不要。ブラウザのJavaScript APIを呼ぶだけで即座にLLM推論が可能。
ストリーミング対応
promptStreaming APIでトークン生成をリアルタイムに受信。チャットUIの逐次表示に最適。
実装コード例
// 1. 利用可能性チェック
const availability = await window.ai.languageModel.availability();
// "available" | "downloadable" | "downloading" | "unavailable"
// 2. セッション作成
const session = await window.ai.languageModel.create({
systemPrompt: "あなたは親切なアシスタントです",
temperature: 0.7,
topK: 40,
});
// 3a. 一括生成
const result = await session.prompt("エッジAIとは?");
// 3b. ストリーミング生成
const stream = session.promptStreaming("エッジAIとは?");
for await (const chunk of stream) {
console.log(chunk); // 全文が逐次更新される
}※ Prompt APIはChrome 148以降のデスクトップ版で利用可能。APIの仕様は変更される可能性があります。
Prompt API vs クラウドAPI vs ブラウザLLM 比較
| 比較項目 | Prompt API(本デモ) | クラウドAPI | ブラウザLLM |
|---|---|---|---|
| 初期コスト | 0円(Chrome内蔵) | 0円〜(API登録必要) | 0円(OSSモデル) |
| ランニングコスト | 0円 | 従量課金(数円〜/1K tokens) | 0円 |
| セットアップ | 不要 | APIキー取得・認証設定 | モデルDL(数百MB) |
| プライバシー | 完全ローカル | サーバーに送信 | 完全ローカル |
| レイテンシ | 極低(数ms) | 高(数百ms〜数秒) | 低〜中(モデルDL後) |
| モデル品質 | 中(Gemini Nano) | 高(GPT-4o / Gemini Pro等) | 低〜中(1B〜3Bモデル) |
| 日本語品質 | 中程度 | 高品質 | モデル依存 |
| ブラウザ互換 | Chrome 148+のみ | 全ブラウザ | WebGPU対応ブラウザ |
| オフライン | 対応(DL後) | 不可 | 対応(DL後) |
※ 「ブラウザLLM」は WebLLM / Transformers.js 等でOSSモデルをブラウザ内実行する方式を指します。 当サイトのブラウザチャットAIデモやQwen 3.5デモが該当します。
Prompt API の活用事例
フォーム入力補助
お問い合わせフォームや申請書の入力内容をリアルタイムで校正・補完。プライバシーを保ちつつユーザー体験を向上。
テキスト自動分類
カスタマーレビュー・問い合わせ内容をポジティブ/ネガティブ/カテゴリに自動分類。サーバー負荷ゼロで即時フィードバック。
文章要約・リライト
長文記事やニュースの要約、文体変換をブラウザ内で完結。コンテンツサイトでの「要約で読む」機能に。
リアルタイム翻訳
Webページ内のテキストをインラインで翻訳。サーバーAPIへの依存なしで多言語対応サイトを実現。
コンテンツモデレーション
ユーザー投稿内容の一次スクリーニングをブラウザ側で実行。サーバーに到達する前に不適切コンテンツを検出。
インタラクティブNPC
Webゲーム内のNPCキャラクターにローカルLLMで会話能力を付与。通信不要で自然な対話を実現。
Prompt API を使いこなすコツ
プロンプトを短くする
Gemini Nanoは小型モデルのため、長いプロンプトより簡潔で明確な指示の方が高品質な出力を得やすいです。
タスクを限定する
「何でもできるアシスタント」より「分類」「要約」「抽出」など単一タスクに特化させると精度が向上します。
temperatureを調整
事実確認には temperature: 0(確定的)、創作には 0.7〜1.0(創造的)を使い分けましょう。
Few-shot例を含める
期待する入出力の例を2〜3個プロンプトに含めることで、出力形式を安定させることができます。
セッション再利用
LanguageModel.create() で作成したセッションを再利用すると、会話の文脈を維持できます。
フォールバック設計
Prompt APIは Chrome 148 以降限定。非対応ブラウザ向けにクラウドAPI等のフォールバックを必ず実装しましょう。
Chrome AI のアーキテクチャ
Chrome内蔵AIの仕組みと、エッジAIとしてのポジションを解説します。
モデル配信(初回のみ)
Googleのサーバーからgemini-nano モデル(約4GB)がバックグラウンドでダウンロードされ、ローカルストレージに保存されます。 一度ダウンロードすればオフラインでも利用可能です。
推論エンジン
Chromeのレンダラープロセス内でGPU加速推論を実行。WebGPUとは異なる独自の推論パスでネイティブに近い性能を実現。 Webアプリケーションからは window.ai JavaScript APIでアクセスします。
サンドボックス分離
推論処理はChromeのサンドボックス内で実行され、モデルの重みやユーザーの入力データは外部に漏洩しません。 他のタブやサイトからもアクセスできない安全な設計です。
エッジAIシステムの導入相談
Chrome内蔵AIからサーバーサイドLLM、Jetson/Raspberry Piまで、用途に最適なエッジAI構成をご提案します。 プライバシー要件・精度要件・コスト制約に合わせたアーキテクチャ設計を行います。
エッジAI推論に最適な機材
ブラウザ内蔵AIから一歩進んで、本格的なエッジAIシステムを構築するための推奨機材です。
※ 上記リンクはアフィリエイトリンクです。購入により当サイトに収益が発生する場合があります。