大牟田市の市民交流施設「えるる」にて、9月の交流会を開催しました。今回は、画像認識や音声認識を活用した多様なサービスを試していきました。

Wp 22

近年、深層学習の登場により、画像認識の実用性が飛躍的に高まりました。また、Amazon EchoGoogle Homeといった、音声認識の活躍の場を広げるデバイスも登場してきています。

Wp 4

会の前半では、Google翻訳のアプリを使った認識技術の利用について学んでいきました。音声認識を用いることで、2つの言語を相互に通訳してくれます。また、画像認識を用いることで、カメラで撮影した外国語の新聞記事が日本語訳されます。予め辞書データをダウンロードしておけばインターネット回線が無くとも利用できるため、海外に旅行する際には、非常に頼れるサービスになりそうです。

Wp 10

後半では、手書き文字の認識を試していきました。難読漢字を題材に、入力した手書き文字をテキストに変換し、検索して意味を調べるという一連の操作を試していきました。

Wp 19

また、Shazamを使った音楽の認識も試してみました。マイクを介してスマートフォンに曲を聴かせることで、曲名を知ることができます。併せてミュージックビデオや購入サイトへのリンクも表示されるため、気に入った曲は後からじっくり聴くこともできますね。

Wp 25

今回使用したアプリ

Google翻訳

手書き漢字認識辞書

Shazam