2023.08.10 08:30

40万ラベル学習済み、「ワインエチケットを読む」画像推論AIとは

Forbes JAPAN 編集部

著者フォロー

記事を保存

著者フォロー

記事を保存

ワインAIでワインのラベル（エチケット）を読み取る

TensorFlow Hubからダウンロードした学習済みモデルをGravioで利用

先ほどインストールしたアプリGravio Studioを立ち上げます。まずは、Gravio Hubとカメラを接続します。

続いて、TensorFlow Hubのサイトを開き、今回使用する学習モデル「popular_wine_V1」をダウンロードします。このモデルは、すでに40万種類（！）のワインのラベルを学習済みとのこと。このモデルをGravioで使います。

つまり、カメラ（目）を備えたGravio（脳）に、ワインラベルのAI画像推論モデルという“知識”をインプットしてあげるようなイメージです。

再びGravio Studioに戻り、ダウンロードした学習モデルをインポートします。ポイントは「信頼度の閾（しきい）値」のところ。この閾値を初期値の0.5から下げると、画像認識の判定基準が甘くなります。逆に上げてやると判定基準が厳しくなるというわけです。ただ、実際に判定してみなければ、適切な閾値はわからないので、ひとまず初期値のままでいきましょう。

これで、学習モデルをGravioに取り込めました。次に、カメラとの接続を行います。

そのために、「エリア」「レイヤー」「論理デバイス」という3つの要素を設定してやります。

「エリア」はデバイスの設置場所を表しています。

「レイヤー」は、その設置場所にどのタイプのデバイスを置くのかを指定します。最後に「論理デバイス」で、具体的なデバイスを指定します。今回はカメラですね。

このように、「エリア」と「レイヤー」と「論理デバイス」を組み合わせることで、「リビングに設置したカメラで、ワインラベルを読み取る学習モデルを使用する」という一連の流れを実行するAIが完成しました。この3つの要素をさらに追加すれば、他にもさまざまなAIを同時に走らせられるというわけですね。

いや、しかし、本当にコードなど一切書かないままAIが完成してしまった…これはすごいですね。