AI

2023.08.10 08:30

40万ラベル学習済み、「ワインエチケットを読む」画像推論AIとは


TensorFlow Hubからダウンロードした学習済みモデルをGravioで利用




先ほどインストールしたアプリGravio Studioを立ち上げます。まずは、Gravio Hubとカメラを接続します。



続いて、TensorFlow Hubのサイトを開き、今回使用する学習モデル「popular_wine_V1」をダウンロードします。このモデルは、すでに40万種類(!)のワインのラベルを学習済みとのこと。このモデルをGravioで使います。

つまり、カメラ(目)を備えたGravio(脳)に、ワインラベルのAI画像推論モデルという“知識”をインプットしてあげるようなイメージです。


再びGravio Studioに戻り、ダウンロードした学習モデルをインポートします。ポイントは「信頼度の閾(しきい)値」のところ。この閾値を初期値の0.5から下げると、画像認識の判定基準が甘くなります。逆に上げてやると判定基準が厳しくなるというわけです。ただ、実際に判定してみなければ、適切な閾値はわからないので、ひとまず初期値のままでいきましょう。

これで、学習モデルをGravioに取り込めました。次に、カメラとの接続を行います。

そのために、「エリア」「レイヤー」「論理デバイス」という3つの要素を設定してやります。


「エリア」はデバイスの設置場所を表しています。



「レイヤー」は、その設置場所にどのタイプのデバイスを置くのかを指定します。最後に「論理デバイス」で、具体的なデバイスを指定します。今回はカメラですね。

このように、「エリア」と「レイヤー」と「論理デバイス」を組み合わせることで、「リビングに設置したカメラで、ワインラベルを読み取る学習モデルを使用する」という一連の流れを実行するAIが完成しました。この3つの要素をさらに追加すれば、他にもさまざまなAIを同時に走らせられるというわけですね。

いや、しかし、本当にコードなど一切書かないままAIが完成してしまった…これはすごいですね。

はたしてワインのラベルは読み取れるのか?


それではさっそく、ワインのラベルを読み取ってみましょう。






おお、すごい。合っています!

学習モデルの都合上、ヴィンテージ(年号)表記までは読み取れないようです。ただ、年号はラベルを見ればわかるので、わざわざAIに判別してもらわなくても問題ないでしょう。
次ページ > もう1つ、試してみましょう─。

文=山田井○○ 編集=石井節子

ForbesBrandVoice

人気記事