🟡 中量モデル
中量モデル(50〜200MB)
Wi-Fi推奨。初回ロード長めですが、2回目以降はIndexedDBキャッシュで高速起動します。
公開中 9件
🟡50〜200MB — Wi-Fi推奨・初回ロード長め
Wi-Fi推奨:初回ロードに時間がかかります。2回目以降はIndexedDBキャッシュで高速起動します。
公開中デモ
🗣️🟡 約250MB
NEW
🎙️ 音声・言語AI
申し送り音声→介護記録
口頭の申し送りをブラウザ内Whisperで文字起こし→ブラウザAIで介護記録の様式に整形。音声は端末から出ない介護DX
モデル: Whisper Small + ブラウザ内LLM
⚖️ Apache 2.0
介護音声プライバシー
デモを試す
🔊🟡 約80MB
🎙️ 音声・言語AI
AI音声合成
Kokoro AIモデルで高品質な音声を生成。88音声×9言語対応
モデル: Kokoro multilingual
⚖️ Apache 2.0
音声日本語対応
デモを試す
🗺️🟡 約50MB
👁️ コンピュータビジョン
奥行き推定
Depth Anything V2で画像・カメラ映像からリアルタイムに深度マップを生成
モデル: Depth Anything V2 Small
⚖️ Apache 2.0
カメラアップロード
デモを試す
📏🟡 約50MB
🏗️ 建設DX
距離・寸法推定
写真から奥行き推定し、基準寸法を基に2点間の距離を計測。施工管理に
モデル: Depth Anything V2 Small
⚖️ Apache 2.0
アップロード建設DX
デモを試す
✨🟡 約150MB
👁️ コンピュータビジョン
AI画像セグメンテーション
SAM 3 Trackerで画像のインタラクティブセグメンテーション。クリックで物体を選択
モデル: SAM 3 Tracker
⚖️ Apache 2.0
アップロードインタラクティブ
デモを試す
🧠🟡 約120MB
👁️ コンピュータビジョン
画像理解AI
Florence-2でキャプション生成・物体検出・OCRなどマルチタスク画像理解
モデル: Florence-2-base
⚖️ MIT
マルチタスクマルチモーダル
デモを試す
💬🟡 約100MB
人気No.3
🎙️ 音声・言語AI
ブラウザチャットAI
軽量LLM(LFM2-350M)をブラウザ内実行。ストリーミング応答
モデル: LFM2-350M
⚖️ LFM Open v1.0
WebGPULLM
デモを試す
🔉🟡 約85MB
NEW
🎙️ 音声・言語AI
環境音AI検出
Audio Spectrogram Transformer (AST) で527種類の環境音をリアルタイム分類。マイクの音をAIが即座に判定
モデル: AST (MIT)
⚖️ BSD-3
マイクリアルタイム
デモを試す
📺🟡 約40MB
NEW
🎙️ 音声・言語AI
リアルタイム映像字幕AI
カメラ映像にWhisperベースのAI字幕をリアルタイム重畳。会議・講演・バリアフリー対応に
モデル: Moonshine-tiny + Canvas重畳
⚖️ MIT / 自作
カメラマイクリアルタイム字幕
デモを試す