音声認識で家電を操作するフューチャーホームコントローラーについて


http://rti-giken.jp/

一年ぐらいの研究を経て、
ハンズフリー音声認識で家電を操作する、未来的ガジェットのフューチャーホームコントローラーをリリースしました。
最初のロットの出荷が終わり、現在、2次出荷ロットの募集中です。

フューチャーホームコントローラーって何?

ハンズフリー音声認識でさまざまな家電を操作できるガジェットです。
2001年宇宙の旅とか、RPGとかにある魔法を現実のものに出来ます。

温度センサーや光センサーを搭載したり、スマホで操作できたり、
V8 engineを搭載しているので、 javascriptでの操作もできます。
ついでに、webapi機能もあるので、外部アプリとの連携もできます。
おまけに、実機はlinuxなので、ssh経由でrootアカウントを開放していますので、ハックし放題です。

万能すぎるデバイスです。
ここからオーダーすることができます。
http://rti-giken.jp/

どうやって作っているの?

C++11でガリガリ書いて作っています。
音声認識には、 julius をベースに独自に研究開発した誤認識フィルタを使っています。

メインボードがPCとして見た時に性能が低すぎるため、
それ上で、音声認識を現実的な速度で動かすのが非常に大変でした。

webの画面はHTML5+css3とかでガリガリ書いてます。
FHCは独自のhttpdを実装しています。
ただ、C++だとテンプレート部分が弱いので、 json+ajaxをベースにしています。

なんで、音声認識googleとか使わないの?

ハンズフリー音声認識で、
音声認識googleとかを使ってしまうと、
部屋の中のいろいろな音、会話をすべてgoogleとかに投げなければならず、
盗聴器っぽくなってしまうためです。
それは嫌なので、すべてをローカルで処理しています。

また、googleとかに送信する速度とかも、ローカルでやったほうが1秒~2秒ほど早く結果が返せます。

ココらへんが、googleに音声を投げるだけの音声認識エンジンとの違いだと思います。

何人で作っているの?

一部で流行っているらしい一人メーカーです。
お金ないので、いろいろ大変です。
毎日、ご飯とベーコンorシーチキンで生きてます。

開発はどーやっているの?

windowslinuxのクロス開発を行なっています。
VisualStudio大好きっこなので、開発とデバッグwindowsでやって、
最後に実機で確認しています。


次回から、技術的な解説を少しづつ書いて行きたいと思います。