エッジAIラボ
エッジAIラボ
🌐

Chrome内蔵AI(Prompt API)

Chrome 148に搭載されたGemini Nanoを使い、インストール不要・サーバー不要でブラウザ内ローカルAI推論を体験

ブラウザ内で完結 — データ送信なし🟢 📦 内蔵(約4GB・自動DL)🤖 Gemini Nano (Chrome内蔵)⚖️ Chrome利用規約

Chrome Prompt API とは

🧠

Gemini Nano 内蔵

Chrome 148以降にGemini Nanoモデル(約4GB)が組み込まれています。ダウンロード後はオフラインでも推論可能。

ゼロレイテンシ

ネットワーク往復なし。プロンプト送信から応答開始まで数ミリ秒。従来のクラウドAPIでは不可能な即時性。

🔒

完全ローカル処理

入力テキストはブラウザの外に出ません。個人情報・機密データを含むテキストも安全に処理可能。

💰

API費用ゼロ

OpenAI APIやGemini API Pro等と異なり、従量課金なし。何度でも無料で推論を実行できます。

📦

インストール不要

npm installもサーバー構築も不要。ブラウザのJavaScript APIを呼ぶだけで即座にLLM推論が可能。

🔄

ストリーミング対応

promptStreaming APIでトークン生成をリアルタイムに受信。チャットUIの逐次表示に最適。

実装コード例

// 1. 利用可能性チェック
const availability = await window.ai.languageModel.availability();
// "available" | "downloadable" | "downloading" | "unavailable"

// 2. セッション作成
const session = await window.ai.languageModel.create({
  systemPrompt: "あなたは親切なアシスタントです",
  temperature: 0.7,
  topK: 40,
});

// 3a. 一括生成
const result = await session.prompt("エッジAIとは?");

// 3b. ストリーミング生成
const stream = session.promptStreaming("エッジAIとは?");
for await (const chunk of stream) {
  console.log(chunk); // 全文が逐次更新される
}

※ Prompt APIはChrome 148以降のデスクトップ版で利用可能。APIの仕様は変更される可能性があります。

Prompt API vs クラウドAPI vs ブラウザLLM 比較

比較項目Prompt API(本デモ)クラウドAPIブラウザLLM
初期コスト0円(Chrome内蔵)0円〜(API登録必要)0円(OSSモデル)
ランニングコスト0円従量課金(数円〜/1K tokens)0円
セットアップ不要APIキー取得・認証設定モデルDL(数百MB)
プライバシー完全ローカルサーバーに送信完全ローカル
レイテンシ極低(数ms)高(数百ms〜数秒)低〜中(モデルDL後)
モデル品質中(Gemini Nano)高(GPT-4o / Gemini Pro等)低〜中(1B〜3Bモデル)
日本語品質中程度高品質モデル依存
ブラウザ互換Chrome 148+のみ全ブラウザWebGPU対応ブラウザ
オフライン対応(DL後)不可対応(DL後)

※ 「ブラウザLLM」は WebLLM / Transformers.js 等でOSSモデルをブラウザ内実行する方式を指します。 当サイトのブラウザチャットAIデモQwen 3.5デモが該当します。

Prompt API の活用事例

📋

フォーム入力補助

お問い合わせフォームや申請書の入力内容をリアルタイムで校正・補完。プライバシーを保ちつつユーザー体験を向上。

🏷️

テキスト自動分類

カスタマーレビュー・問い合わせ内容をポジティブ/ネガティブ/カテゴリに自動分類。サーバー負荷ゼロで即時フィードバック。

📝

文章要約・リライト

長文記事やニュースの要約、文体変換をブラウザ内で完結。コンテンツサイトでの「要約で読む」機能に。

🌐

リアルタイム翻訳

Webページ内のテキストをインラインで翻訳。サーバーAPIへの依存なしで多言語対応サイトを実現。

🛡️

コンテンツモデレーション

ユーザー投稿内容の一次スクリーニングをブラウザ側で実行。サーバーに到達する前に不適切コンテンツを検出。

🎮

インタラクティブNPC

Webゲーム内のNPCキャラクターにローカルLLMで会話能力を付与。通信不要で自然な対話を実現。

Prompt API を使いこなすコツ

📏

プロンプトを短くする

Gemini Nanoは小型モデルのため、長いプロンプトより簡潔で明確な指示の方が高品質な出力を得やすいです。

🎯

タスクを限定する

「何でもできるアシスタント」より「分類」「要約」「抽出」など単一タスクに特化させると精度が向上します。

🌡️

temperatureを調整

事実確認には temperature: 0(確定的)、創作には 0.7〜1.0(創造的)を使い分けましょう。

📋

Few-shot例を含める

期待する入出力の例を2〜3個プロンプトに含めることで、出力形式を安定させることができます。

🔄

セッション再利用

LanguageModel.create() で作成したセッションを再利用すると、会話の文脈を維持できます。

⚠️

フォールバック設計

Prompt APIは Chrome 148 以降限定。非対応ブラウザ向けにクラウドAPI等のフォールバックを必ず実装しましょう。

Chrome AI のアーキテクチャ

Chrome内蔵AIの仕組みと、エッジAIとしてのポジションを解説します。

1

モデル配信(初回のみ)

Googleのサーバーからgemini-nano モデル(約4GB)がバックグラウンドでダウンロードされ、ローカルストレージに保存されます。 一度ダウンロードすればオフラインでも利用可能です。

2

推論エンジン

Chromeのレンダラープロセス内でGPU加速推論を実行。WebGPUとは異なる独自の推論パスでネイティブに近い性能を実現。 Webアプリケーションからは window.ai JavaScript APIでアクセスします。

3

サンドボックス分離

推論処理はChromeのサンドボックス内で実行され、モデルの重みやユーザーの入力データは外部に漏洩しません。 他のタブやサイトからもアクセスできない安全な設計です。

エッジAIシステムの導入相談

Chrome内蔵AIからサーバーサイドLLM、Jetson/Raspberry Piまで、用途に最適なエッジAI構成をご提案します。 プライバシー要件・精度要件・コスト制約に合わせたアーキテクチャ設計を行います。

お問い合わせ

エッジAI推論に最適な機材

ブラウザ内蔵AIから一歩進んで、本格的なエッジAIシステムを構築するための推奨機材です。

🖥️定番

Raspberry Pi 5

エッジAIの定番ボード。8GB RAMモデルでAI推論からカメラ制御まで幅広く対応。

高性能

NVIDIA Jetson Orin Nano

最大67 TOPSのAI性能。複数カメラの同時処理や高精度モデルの実行に最適なエッジAIボード。

🧠高性能

Hailo-8L AIアクセラレータ

13 TOPSのAI推論性能。Raspberry Pi 5のM.2スロットに装着してAI処理を高速化。

🖥️

7インチ タッチディスプレイ

Raspberry Pi公式タッチディスプレイ。エッジデバイスの操作画面や結果表示に最適。

※ 上記リンクはアフィリエイトリンクです。購入により当サイトに収益が発生する場合があります。

シェア: