カクテルパーティー効果ってご存知でしょうか?

例えば飲み会やパーティー等、周りがガヤガヤと賑やかな状態でも、会話をしている相手の声は聞こえますし、遠くからでも自分の名前を呼ばれたらすぐに気付くっていうあれですね。

人間の脳って本当に優秀だと思います。

さて、そんなカクテルパーティー効果を、ディープラーニングによって再現できるそうです。

参考:
http://www.itmedia.co.jp/news/articles/1804/16/news060.html


こちらの記事で紹介されている技術は映像が重要だそうです。
映像を基に、誰が話しているか特定し、その人の声だけを抽出するということをやっているようです。

これも凄い技術だなと思いますし、活用の幅も広そうですね。


このカクテルパーティー効果ですが、
我が社の技術を応用すれば、映像なしでも再現できる可能性もあります。
声から話者を特定することができれば、その人の話している声だけを抽出することもできるはず。

そうすると、本当に人間の耳と脳で勝手にやっていることが、機械にもできるようになるかもしれません。

音声分野は、まだまだAI技術の活用の可能性が大きくて楽しみですね!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp