おもしろ モノ 学び 技術 日々

Google Homeで音声プログラミングをしようとして調べたこと(2)

投稿日:

色々誤解があった

昨日、Googleでの音声プログラミングについて調べたことを記事にしたが、そのあと紹介したライブラリについて紹介ビデオなどを見て誤解があることがわかったのでそのことを書こうと思う。

Google Homeで音声プログラミングをしようとして調べたこと(1)

事の始まり 最近このことをよく書いているが、今一番興味のあることなので仕方がない。Google Homeのことだ。 とりあえず音楽プレーヤーとか、テレビのON/OFFとかに便利に使っているのだが、僕の ...

続きを見る

Converse.AI

紹介されたビデオを見てみたら、これはどうもチャット風の入力フォーム的なものを作るプラットフォームのようだ。ビデオを見ただけなので断定はできないのだが、紹介されているのはそんな感じ。

あとで述べるGoogle Cloud Speech APIと組み合わせると結構面白そうなことができそうだ。

ただ、Converse.AI自体もなにか人工知能的なものが含まれているのかもしれないし、今は含まれていなくても将来的に含まれるのかもしれない。

今のところ僕がやりたいこととはちょっと違うので静観することにした。

ただ、プログラミングのインタフェースはなかなかすごい。いずれはこういうふうにプログラミングするようになるんだろうなって感じ。

Dialogflow

僕がやりたいことにとりあえず使えそうな感じ。音声を認識・解析してテキストに変換したり、たぶんそのときになにか処理を加えたりできるのではないかと思われる。紹介ビデオはここ

各言語に対応しているようだ。簡単な処理ならIFTTTで作れるが、他のAPIを組み合わせたりして複雑な処理をしようとしたらこのライブラリを使うのが良さそうだ。

紹介ビデオではコードはJavaScriptで書いている。JavaScriptは地位的に次世代のC++って感じがになりそうな気が最近している。

Google Cloud Speech API

これはGoogle謹製のAPI。音声をテキストにするならこのAPIを使うのが良さそうだ。有料のAPIであるということもGoogleの自信の現れだろう。

使ってみないと精度はわからないが、Google Homeがある程度正確に音声を認識していることを考えると結構使えるのではないだろうか。ぜひ使ってみたいAPIである。

Google Cloud Natural Language API

色々探していて興味深いというか、より人工知能らしいと思ったのがこのAPI。文章を構文解析したり、内容の感情を分析したりできると言う。顧客満足度の分析などに使えると書いてあるが、たぶんキーワードやその関係を表すグラフなどが取り出せるのではないかと思われる。

アプリケーションとしてはこのAPIで得られるデータをもとにさらに分析をしてなにか独自の情報を創り出すのに使うのだろう。どんなものが出てくるのかぜひ見てみたいAPIである。

Action on Google

Google Homeというか、Google Assistantで何かやろうと思ったら入り口はここだった。JSONでコーディングしてGoogle Assistantの動作を作ることができる。

ここで定義したキーワードで任意のAPIを呼び出したりして、自分の意図する処理を行った上でその結果を使ってGoogle Assistantのレスポンスを作ったりできるというわけだ。

僕がやろうとしていることはまずここからだった。

まとめ

ちょっと遠回りしたけど、だいぶアプリケーションの組み立て方がわかってきた。まだ集めなければならない材料があるけど、プロジェクトを始めることができそうな気がしてきた。

さて、始めようか。

 







書いた人

nyao

nyao

本を読むのが大好きです。積読本が多数。システムエンジニア経験あり。プログラミング言語はRubyが好きだけどPHPとJavaばかり書いている。最近はJavaScriptも好きになってきた。クラウド使ったお仕事募集中。

プロフィールを表示 →

-おもしろ, モノ, 学び, 技術, 日々
-

Copyright© NyaoPress 読書と日常 , 2018 All Rights Reserved.