エッジAIラボ

🟡 中量モデル

中量モデル（50〜200MB）

Wi-Fi推奨。初回ロード長めですが、2回目以降はIndexedDBキャッシュで高速起動します。

公開中 9件

🟡50〜200MB — Wi-Fi推奨・初回ロード長め

Wi-Fi推奨：初回ロードに時間がかかります。2回目以降はIndexedDBキャッシュで高速起動します。

公開中デモ

🎙️ 音声・言語AI

申し送り音声→介護記録

口頭の申し送りをブラウザ内Whisperで文字起こし→ブラウザAIで介護記録の様式に整形。音声は端末から出ない介護DX

モデル: Whisper Small + ブラウザ内LLM

⚖️ Apache 2.0

介護音声プライバシー

デモを試す

🎙️ 音声・言語AI

AI音声合成

Kokoro AIモデルで高品質な音声を生成。88音声×9言語対応

モデル: Kokoro multilingual

⚖️ Apache 2.0

音声日本語対応

デモを試す

👁️ コンピュータビジョン

奥行き推定

Depth Anything V2で画像・カメラ映像からリアルタイムに深度マップを生成

モデル: Depth Anything V2 Small

⚖️ Apache 2.0

カメラアップロード

デモを試す

🏗️ 建設DX

距離・寸法推定

写真から奥行き推定し、基準寸法を基に2点間の距離を計測。施工管理に

モデル: Depth Anything V2 Small

⚖️ Apache 2.0

アップロード建設DX

デモを試す

👁️ コンピュータビジョン

AI画像セグメンテーション

SAM 3 Trackerで画像のインタラクティブセグメンテーション。クリックで物体を選択

モデル: SAM 3 Tracker

⚖️ Apache 2.0

アップロードインタラクティブ

デモを試す

👁️ コンピュータビジョン

画像理解AI

Florence-2でキャプション生成・物体検出・OCRなどマルチタスク画像理解

モデル: Florence-2-base

マルチタスクマルチモーダル

デモを試す

🎙️ 音声・言語AI

ブラウザチャットAI

軽量LLM（LFM2-350M）をブラウザ内実行。ストリーミング応答

モデル: LFM2-350M

⚖️ LFM Open v1.0

デモを試す

🎙️ 音声・言語AI

環境音AI検出

Audio Spectrogram Transformer (AST) で527種類の環境音をリアルタイム分類。マイクの音をAIが即座に判定

モデル: AST (MIT)

マイクリアルタイム

デモを試す

🎙️ 音声・言語AI

リアルタイム映像字幕AI

カメラ映像にWhisperベースのAI字幕をリアルタイム重畳。会議・講演・バリアフリー対応に

モデル: Moonshine-tiny + Canvas重畳

⚖️ MIT / 自作

カメラマイクリアルタイム字幕

デモを試す

デモ一覧に戻る