2025年5月号
Qwen3-0.6B、MedPsy-1.7B など超軽量LLMが続々登場。Gemma 4 Browser ExtensionでブラウザAIエージェントも現実に。
ピックアップ
2025年5月号で特に注目のエッジAI動向
Qwen3-0.6B
思考/非思考モード切替が可能な超軽量LLM。100言語対応で月間1,870万DLを突破。ブラウザやRaspberry Piでも動作。
MedPsy-1.7B
2.4倍大きいMedGemma-4Bを上回る医療特化エッジLLM。量子化で1.28GBに収まりRaspberry Piで動作。
Gemma 4 Browser Extension
Chrome拡張でGemma 4をフルエージェント動作。Transformers.js + WebGPUで完全ローカル実行。
Qualcomm Snapdragon X (45 TOPS)
AI Hub上に209の最適化モデル。WindowsノートPCでローカルAI推論を実現。
🤗注目のエッジAIモデル
2025年5月号時点のモデルカタログ
Qwen3-0.6B
Alibaba
思考/非思考モード切替の超軽量LLM。100言語対応、月間1,870万DL。
何に使える?
動作する機材
MedPsy-1.7B
QVAC
医療特化エッジLLM。2.4倍大きいMedGemma-4Bを+11.42pt上回る驚異的コスパ。
何に使える?
動作する機材
DeepSeek-R1-Distill-Qwen-1.5B
DeepSeek
671Bの推論能力を蒸留。MATH 83.9%の高精度を1.5Bで実現。月間46万DL。
何に使える?
動作する機材
SmolLM2-135M / 360M / 1.7B
HuggingFace
HuggingFace公式の超軽量LLMファミリー。135Mはスマホ・マイコンでも動作。
何に使える?
動作する機材
Phi-4-mini
Microsoft
128Kコンテキスト。GSM8K 88.6%の高精度。22言語対応、ONNX形式公開。
何に使える?
動作する機材
Gemma 3-1B
テキスト+画像のマルチモーダル。140言語対応。月間61万DL。
何に使える?
動作する機材
Whisper Tiny / Small
OpenAI
99言語の音声認識。Tinyは39MBでブラウザ動作可。月間80万DL。日本語対応。
何に使える?
動作する機材
YOLOv10n / YOLOv9
onnx-community
超高速物体検出。ONNX最適化でブラウザ・モバイル・Raspberry Piで動作。
何に使える?
動作する機材
ONNX Community (1,136モデル)
onnx-community
1,136以上のONNX最適化モデル群。ブラウザ・モバイル・エッジで高速推論。
何に使える?
動作する機材
⭐注目のGitHubプロジェクト
2025年5月号時点の注目プロジェクト
llama.cpp
LLMの超高効率C++推論エンジン。GGUF量子化でモデルサイズを大幅削減。
こんな用途に使える
- ›Raspberry Pi上でオフラインチャットボット構築
- ›社内文書Q&Aシステムをローカルサーバーで運用
- ›IoTゲートウェイでの音声コマンド処理
MediaPipe
Googleのオンデバイス推論FW。顔・手・ポーズ・セグメンテーション等をリアルタイム処理。
こんな用途に使える
- ›店舗カメラで来客数・動線をリアルタイム分析
- ›リハビリ用のポーズ判定アプリ開発
- ›ジェスチャーで操作するキオスク端末
TensorFlow.js
ブラウザ・Node.jsでML。WebGL/WebGPU加速でトレーニングも推論も可能。
こんな用途に使える
- ›Webアプリに画像認識機能を組み込み
- ›ブラウザ上で独自モデルを転移学習
- ›教育向けAI体験サイトの構築
WebLLM
WebGPUでLLMをブラウザ実行。Llama, Qwen, Phi, Gemma等に対応。OpenAI互換API。
こんな用途に使える
- ›社内チャットAIをサーバーレスで提供
- ›プライバシー重視の相談チャットボット
- ›オフライン環境での技術文書検索アシスタント
Transformers.js
HuggingFaceモデルをブラウザで直接実行。100以上のアーキテクチャ、WebGPU加速。
こんな用途に使える
- ›ブラウザ完結の音声文字起こしツール
- ›クライアントサイドで動くテキスト感情分析
- ›画像自動タグ付けのWebアプリ
ONNX Runtime
クロスプラットフォーム推論エンジン。WebGPU/WASM/WebNN対応。int4量子化で5-12倍高速化。
こんな用途に使える
- ›Windowsアプリに DirectML推論を組み込み
- ›React NativeアプリでオンデバイスAI
- ›ブラウザとサーバーで同じモデルを共有運用
Gemma 4 Browser Extension
Chrome拡張でGemma 4をフルエージェント動作。Transformers.js + WebGPUで完全ローカル。
こんな用途に使える
- ›ブラウジング中にAIアシスタントをローカル実行
- ›Webページ要約をプライバシー保護しながら実行
- ›Chrome拡張ベースの社内ツールに応用
SmolLM
HuggingFace公式の小型モデルファミリー。トレーニングコード・データセットを完全公開。
こんな用途に使える
- ›独自ドメインの小型LLMをファインチューン
- ›ESP32やRaspberry Piに載る超軽量AIアシスタント開発
- ›エッジAIの学習教材として活用
Whisper.cpp
OpenAI WhisperのC/C++移植。Raspberry Piやスマホでリアルタイム音声認識が可能。
こんな用途に使える
- ›Raspberry Piで常時稼働の議事録ボット
- ›オフラインで動く多言語字幕生成システム
- ›スマートスピーカー自作キットのASRエンジン
Ultralytics (YOLOv8/v11)
最新YOLO。検出・セグメンテーション・ポーズ推定・分類をワンパッケージで。TFLite/ONNX export可。
こんな用途に使える
- ›工場ラインの製品検査を低コストで自動化
- ›農業用ドローンの害虫・病害検出
- ›駐車場の空き状況リアルタイムモニタリング