YouTubeに字幕機能がついているのをご存知でしょうか?

音声を認識して自動で字幕をつけてくれるのですが、Googleの音声認識はさらに進化しています。

なんと!話者識別までやってくれるそうです。

参考:
https://www.gizmodo.jp/2018/05/google-io18_voice.html


実はこの話者識別、めちゃめちゃニーズがあります。

先日のAI・業務自動化展でも質問が多かった一つです。

記事にも書かれていますが、議事録を自動化できるようになると、もはや会議の後に議事録を纏めるなんて作業が必要なくなるわけです。
大きな会社だとかなりの工数が削減できそうですね。

既に議事録システムは世の中に存在していますが、かなり限定的な条件下でしか、話者識別はできていません。

会議等の場面では多人数になることが多いので、自由な環境で実用化されるのはまだ先になるかもしれませんが、我が社も音声技術の専門として、この話者識別にも取り組んでいきます。

音声技術を通して、便利な世の中を創っていくことに貢献していけたらと思います。


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp