🏷️

画像分類

カメラや画像から被写体を分類。Top-5の予測結果を日本語で表示します。

ブラウザ内で完結 — データ送信なし🟢 📦 約8MB🤖 MobileNet v2⚖️ Apache 2.0

認識可能なカテゴリ（ImageNet 1000クラス）

MobileNet v2はImageNetデータセットで学習された1000クラスの画像分類モデルです。動物・乗り物・食べ物・日用品など幅広いカテゴリに対応しています。

動物

犬（120犬種）猫（数十種）鳥類魚類昆虫爬虫類霊長類熊馬象サメ

乗り物

乗用車バストラックバイク自転車飛行機ボート電車消防車スクールバス

食べ物

ピザチーズバーガーホットドッグアイスクリームチョコレート寿司味噌汁エスプレッソフルーツ各種

日用品

ノートPCスマホキーボードマウスリモコン時計眼鏡傘バッグ靴

家具・建物

椅子テーブルソファベッド本棚教会城灯台橋噴水

楽器・スポーツ

ギターピアノバイオリンドラムテニスボールサッカーボールゴルフボールバスケットボール

※ 上記は代表的なカテゴリの一部です。実際にはImageNetの1000クラスすべてに対応しています。

画像分類の活用事例

🏭

製造ライン品質管理

良品/不良品の自動分類。外観検査を自動化し、人的コストを削減。

🌾

農業・植物診断

作物の病気や害虫被害をカメラで撮影するだけで分類。早期発見で収穫量を改善。

🏥

医療画像スクリーニング

X線・皮膚写真などの一次スクリーニング。エッジで処理することでプライバシーも保護。

🛒

商品認識・レジ自動化

バーコードなしで商品を画像から特定。セルフレジや在庫管理を効率化。

🗑️

ゴミ分別支援

カメラにかざすだけで可燃/不燃/資源ゴミを判定。自治体のルールに合わせたカスタマイズも可能。

🐾

野生動物モニタリング

トレイルカメラに画像分類AIを搭載。動物の種類を自動識別して生態調査を効率化。

画像分類の精度を上げるコツ

🎯

被写体を中央に大きく

分類したい対象をフレームの中央に、できるだけ大きく映すと精度が向上します。

💡

十分な明るさを確保

暗い環境ではノイズが増え、分類精度が低下します。自然光または明るいLED照明が最適です。

🖼️

シンプルな背景

ごちゃごちゃした背景は誤分類の原因になります。白い紙やテーブルの上で撮影すると効果的です。

📐

正面からの撮影

極端な角度からの撮影は精度を下げます。被写体の正面〜やや斜めが最も認識率が高くなります。

🔍

1つの被写体に絞る

画像分類は「この画像は何か」を1つ答えるタスクです。複数のものが混在すると結果が不安定になります。

📱

ブレを防ぐ

手ブレのある画像は特徴量が劣化します。静止画アップロードモードなら安定した結果が得られます。

画像分類モデルの比較

用途に応じて最適なモデルは異なります。エッジデバイスでは軽量モデルが重要です。

モデル	Top-1精度	サイズ	特徴
MobileNet v2 （本デモ）	71.8%	14MB	軽量・高速。エッジデバイス向けの代表格
EfficientNet-Lite	75.1%	19MB	MobileNetより高精度。モバイル向けに最適化
ResNet-50	76.1%	98MB	高精度だがサイズ大。サーバー向け
Vision Transformer (ViT)	81.3%	330MB	最高精度。GPU必須・エッジには不向き

独自の画像分類モデルを構築する

ImageNetの1000クラスにない独自のカテゴリ（製品の種類、不良品の分類など）を認識させるにはカスタム学習が必要です。

画像データ収集

分類したいカテゴリごとに画像を収集。1カテゴリあたり100〜1000枚が目安。多いほど精度が向上します。

データ前処理・拡張

リサイズ・正規化に加え、回転・反転・色調変更などのData Augmentationでデータ量を増やして過学習を防止。

Transfer Learning（転移学習）

MobileNet v2やEfficientNetの学習済み重みをベースに、最終層のみを独自データで再学習。少ないデータでも高精度に。

評価・最適化

混同行列・F1スコアで各クラスの精度を確認。誤分類が多いクラスのデータを追加して改善。

エッジデバイスへのデプロイ

TFLite / ONNX / TensorFlow.js形式に変換。量子化（INT8）で2〜4倍の高速化＆モデルサイズ1/4に。

継続的な精度改善サイクル

誤分類データを収集→ラベル修正・追加→再学習・評価→デプロイ→繰り返し

学習環境と費用の比較（実績ベース）

画像分類モデル（EfficientNet）のファインチューニング：カスタムデータセット1万枚・50エポックの場合

学習環境	VRAM	時間単価	学習時間	1回の学習費用
GCP A100（東京）	40GB	約628円/時	1〜3時間	628〜1,884円
さくら高火力 H100	80GB	約1,008円/時	0.5〜1.5時間	504〜1,512円
当社 RTX PRO 6000	96GB	固定費のみ	2.5〜6時間	追加費用なし
RTX 4090（個人）	24GB	—	1.5〜3.5時間	電気代のみ（VRAM 24GB制限）

注意：クラウドGPUは「1回の学習」で上記費用ですが、実際のAI開発ではハイパーパラメータ調整・データ追加・再学習を10〜50回以上繰り返します。 10回の試行でクラウド費用は5,000〜15,000円以上に膨れ上がります。当社環境なら何度でも追加費用なしで試行錯誤が可能です。

※ 価格はGCP東京リージョン・さくらインターネット高火力DOKの2025年公表価格に基づく。為替レート155円/USDで換算。

カスタム画像分類システムの開発

製品検査、農作物診断、廃棄物分類など、業界特化の画像分類AIを構築できます。当社のNVIDIA RTX PRO 6000 Blackwell環境を活用することで、クラウド高火力のような従量課金なしにカスタムモデルの学習・構築をお手伝いします。試行錯誤を重ねるほどクラウドとのコスト差が開きます。

活用事例を見る

画像分類に最適なエッジAI機材

ブラウザでのデモ体験後、本格的にエッジAI画像分類システムを構築するための推奨機材です。

📷おすすめ

Raspberry Pi AI Camera（IMX500）

Sony IMX500搭載のAI処理内蔵カメラ。カメラ側でAI推論を実行し、ホストの負荷が極めて低い。

楽天 Amazon

🖥️定番

Raspberry Pi 5

エッジAIの定番ボード。8GB RAMモデルでAI推論からカメラ制御まで幅広く対応。

楽天 Amazon

⚡高性能

NVIDIA Jetson Orin Nano

最大67 TOPSのAI性能。複数カメラの同時処理や高精度モデルの実行に最適なエッジAIボード。

楽天 Amazon

🔌

Google Coral USB Accelerator

既存のPCやRaspberry PiにUSB接続するだけでAI推論を高速化。4 TOPSのEdge TPU搭載。

楽天 Amazon

🎥

4K Webカメラ（AI対応）

高解像度のWebカメラでAI認識の精度が向上。オートフォーカス・広角対応モデルがおすすめ。

楽天 Amazon

📸

Raspberry Pi カメラモジュール V3

12MPセンサー搭載の公式カメラモジュール。HDR対応・オートフォーカスで高品質な映像入力が可能。

楽天 Amazon

※ 上記リンクはアフィリエイトリンクです。購入により当サイトに収益が発生する場合があります。

画像分類

認識可能なカテゴリ（ImageNet 1000クラス）

動物

乗り物

食べ物

日用品

家具・建物

楽器・スポーツ

画像分類の活用事例

製造ライン品質管理

農業・植物診断

医療画像スクリーニング

商品認識・レジ自動化

ゴミ分別支援

野生動物モニタリング

画像分類の精度を上げるコツ

被写体を中央に大きく

十分な明るさを確保

シンプルな背景

正面からの撮影

1つの被写体に絞る

ブレを防ぐ

画像分類モデルの比較

独自の画像分類モデルを構築する

画像データ収集

データ前処理・拡張

Transfer Learning（転移学習）

評価・最適化

エッジデバイスへのデプロイ

継続的な精度改善サイクル

学習環境と費用の比較（実績ベース）

カスタム画像分類システムの開発

画像分類に最適なエッジAI機材

Raspberry Pi AI Camera（IMX500）

Raspberry Pi 5

NVIDIA Jetson Orin Nano

Google Coral USB Accelerator

4K Webカメラ（AI対応）

Raspberry Pi カメラモジュール V3

関連記事 — 詳しくはこちら

関連デモ