株式会社voiceware 社長Blog

株式会社voiceware CEO田村のブログです。 会社のこと、技術のこと、日々のこと等、雑多に更新していきます。

カテゴリ: 音声技術

2019年、一発目の投稿となります。
本年もどうぞよろしくお願い致します!


さて、近年はテクノロジーに犯罪対策は付きものとなっています。
音声分野も例外ではなく、自動音声を利用した詐欺なんかも発生しているようです。

参考:
https://jp.techcrunch.com/2019/01/05/2019-01-04-new-apple-voice-phishing-scam-looks-just-like-a-real-support-call/


声質変換技術の説明をした際に、一番良く言われることは、
「オレオレ詐欺が蔓延りそう」です。

ちなみに、2018年の振り込め詐欺(いわゆるオレオレ詐欺以外も含む)の被害件数は、なんと13,000件にのぼるそうです。
被害額だと、286億円。
認知件数だけでこの数字なので、気付かれていないものも含めると、その数倍になりそうですね。
改めて、凄い数字だと思います。

参考:
https://www.npa.go.jp/safetylife/seianki31/higaijoukyou.html


たしかに、声質変換技術で声色を真似することができるようになると、簡単に息子や娘の真似ができるようになるかもしれません。
ただ、オレオレ詐欺に利用するためには、本人の声データを取得する必要があります。
ここからは個人的な見解ですが、数打ちゃ当たる戦法のオレオレ詐欺には、声質変換は向かないと思います。
現状の技術レベルでは、不自然さが増しますし、声を変える手間も増えます。技術レベルが向上したとしても、せいぜい今までのボイスチェンジャーより自然に声が変えられるという程度ででしょうか。

逆に、声質変換の基となる音声技術を利用して、オレオレ詐欺を見破ることに利用できるかもしれません。
特有の喋り方、抑揚の付け方、声色の使い方等で詐欺を検知できるようになると、被害撲滅につながるのではないでしょうか。


声質変換で気をつけるべきは、イタズラ等に利用されることかと思います。
海外で、声質変換技術を利用してオバマ大統領が話しているかのような動画が制作されていました。
このように、本人が知らないところで好き勝手に声を利用されてフェイクニュースが増えるかもしれません。

当社としても、もちろん対策は考えています。
GoogleのDuplexでも、あまりに自然なので、「人工知能と名乗らせろ」という声が挙がりましたが、声質変換も同様に、変換された声であることがわかるような仕組みは検討中です。


どんなテクノロジーでも同じですが、ある程度は使う側の良心に依存してしまうものかなと思います。
包丁も同じで、使う人によっては凶器となり得ます。
もちろん提供する側として最大限の対策はしますが、テクノロジーが正しく利用される世の中であって欲しいものです。


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  

久々の更新になってしまいました。
年末は飲み会も多く、バタバタと過ごしていますが、新しい出逢いもたくさんあり、とても刺激的な毎日を過ごせています。
新しくビジネスに繋がりそうな方とも知り合えたので、今後が楽しみです!
いろいろな出逢いの機会をくださってた方々には、感謝ですね!!


さて、近年では音声技術もかなり注目されるようになってきており、その進歩もめざましいものがあります。
最近のニュースで個人的に衝撃的だったのは、歌声合成ですね!

参考:
http://ainow.ai/2018/12/14/158579/

もはや機械とは思えないクオリティ!
何も言われなければ、人が歌っていると勘違いしてしまいそうです。
以前にも紹介しましたが、GoogleのDuplexに代表されるようにもちろん歌声以外も人とほとんど区別がつきません。

参考:
https://wired.jp/2018/11/05/google-duplex-pixel-smartphone/


こうなってくると、「歌手や声優・ナレーターは仕事がなくなるのではないか?」という意見もありますが、個人的にはまだ数十年は先かなと思っています。
やはり生の人の声には、数値では測れないようなパワーのようなものがあると感じます。
雑談しかしていないのに何故かこの人と話すと元気なる、というような人っていますよね?
その辺りも解明できると面白そうではあります。

とはいえ、歌手や声優の働き方が変わってくるのは事実だと思います。
本当に表現力・スキルのある人以外は淘汰されるかもしれませんね。
その一方で、声色そのものに魅力がある方だと、声だけを売るなんてことも可能になってきます。
どの業界も同じだと思いますが、テクノロジーによって、デジタルもアナログも本当に良いものに洗練されていくのでしょうね。

当社の技術もそんな未来に貢献できるように、日々磨いていきます!!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  

朝、布団から抜け出しにくい季節になってきましたね。
皆さんは、朝の目覚めは良い方でしょうか?

私自身、たまに二度寝をしてしまい、急いで準備をするハメになってしまうことがあります。

そんな朝に弱い方にとっては有益かもしれない研究結果が発表されました。


なんと!

アラームより母親の声のほうが、目を覚ましやすいそうです!!

参考:
http://news.livedoor.com/article/detail/15578741/

具体的には、アラーム音では約50%の子しか目を覚めさなかったのに対し、母親の声では90%が目を覚ましました。また、母親の声を聞いた子どもは、30秒以内に部屋から出ました。これに対し、アラーム音で起こされた子どもたちは、5分近くかかりました。

声質変換に携わる身としては非常に興味深い研究結果です。
単に、音声合成の声が家族の声になると親近感が湧く等の理由で、ニーズがあるだろうと考えていましたが、こんな観点もありましたか。

目覚まし以外にも、寝る前とか試験前や大事な試合の前等、状況に合った声がありそうですね。
Aという場合においては恋人の声が良い、Bという場合は子供の声が良い等々。

その辺も分析して、声質変換とセットにすることで、日常生活のパフォーマンスを上げることも可能になるかもしれません。

いろいろと試したくなってきました!
個人的には、音声の可能性がまた広がった気がしてワクワクしています!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp 

以前にAIアナウンサーについてブログを書きました。
http://voiceware.blog.jp/archives/11311803.html

中国では、なんとAIニュースキャスターが誕生したそうです!!

https://gigazine.net/news/20181109-first-ai-news-anchor/

若干の違和感はあるものの非常にクオリティが高くて、まるで本物のキャスターのようです。
感情表現もできるようになると、もっといろいろなニュースも発信できそうですし、
24時間365日休みなくニュースを発信できるので、かなりコストも削減できそうですね。

国営通信社が実施しているということも興味深いです。
日本でも、NHKがバーチャルYouTuberを起用しているということもありましたし、固いイメージがあるところも新技術にチャレンジをしているというのは良いですね。


それにしても、二次元キャラクターをアナウンサーに起用するというのは、やはり日本の文化なのでしょうか?
海外だと、より人間に近い姿が受け入れられやすいのかもしれませんね。
個人的には、新たな発見でした!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  

皆さんは、オーディオブックを利用したことがあるでしょうか?

ナレーターや声優が読み上げた本を「聴く」ことができ、読む必要が無くなるというモノなのですが、
Writoneというサービスがリリースされて、少し楽しみ方も変わりそうです。

https://jp.techcrunch.com/2018/10/02/writone/


「好きな声優が読み上げているのなら聴いてみよう」なんてニーズも産まれそうですね!

作家さんとしても、「この本はこの人に読んでもらいたい!」という想いはあるはずなので、とても面白いサービスだと思います。
声優さんとしても、新しい収入源になるので、まさに、Win-Win-Winですね!


当社の声質変換技術とも相性が良さそうで、組み合わせるともっと楽しみ方も増えそうに思います。

話し方の表現はこの人が良いけど、声質はこの人が良い、なんて選び方ができるかもしれません。

我々のビジョンは、「声を自由にデザインできるようにする!」ですが、
発する側だけではなく、聴く側が、「声を自由に選ぶようになる」と声の多様性もさらに広がっていきそうで楽しみです!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp

このページのトップヘ