voiceware

株式会社voiceware 社長Blog

株式会社voiceware CEO田村のブログです。 会社のこと、技術のこと、日々のこと等、雑多に更新していきます。

声質変換技術

6 Feb

声をアップデートせよ

NewsPicks風にタイトルつけてみました(笑)


さて、声質変換技術の目標は、他人の声になりきることですが、最近、他の利用方法もあるのではないかなと考えています。

以前、ブログにも書きましたが、状況によって最適な声というのが存在します。
http://voiceware.blog.jp/archives/13462445.html

例えば、学校の先生なんかを思い出してみてください。
同じような内容を話しているのに、何故か説得力のある声の先生や眠くなる声の先生、聞いているだけで元気になる声の先生等がいますよね?
あるいは、声が大きいわけではないのに、通りやすく聞き取りやすい声の方もいます。
もちろん話すテンポや抑揚の付け方も大きな要素とは思いますが、声質そのものの特性も影響していると思うのです。

そこで、状況に応じて微妙に自分の声を変化させることで、自分の声と認識されつつも、効果的な声にすることができるのではないかと考えています。
営業に最適な声、面接に最適な声、モテる声...etc.
最適な声を出すことができると、コミュニケーションも円滑になるのではないでしょうか?

まさに、声のアップデートをしたいということですね。


まだまだ構想中の段階ではありますが、もし興味のある企業様がいましたら、お気軽にご連絡ください。


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp   
6 Jan

声質変換でオレオレ詐欺は増える?

2019年、一発目の投稿となります。
本年もどうぞよろしくお願い致します!


さて、近年はテクノロジーに犯罪対策は付きものとなっています。
音声分野も例外ではなく、自動音声を利用した詐欺なんかも発生しているようです。

参考:
https://jp.techcrunch.com/2019/01/05/2019-01-04-new-apple-voice-phishing-scam-looks-just-like-a-real-support-call/


声質変換技術の説明をした際に、一番良く言われることは、
「オレオレ詐欺が蔓延りそう」です。

ちなみに、2018年の振り込め詐欺(いわゆるオレオレ詐欺以外も含む)の被害件数は、なんと13,000件にのぼるそうです。
被害額だと、286億円。
認知件数だけでこの数字なので、気付かれていないものも含めると、その数倍になりそうですね。
改めて、凄い数字だと思います。

参考:
https://www.npa.go.jp/safetylife/seianki31/higaijoukyou.html


たしかに、声質変換技術で声色を真似することができるようになると、簡単に息子や娘の真似ができるようになるかもしれません。
ただ、オレオレ詐欺に利用するためには、本人の声データを取得する必要があります。
ここからは個人的な見解ですが、数打ちゃ当たる戦法のオレオレ詐欺には、声質変換は向かないと思います。
現状の技術レベルでは、不自然さが増しますし、声を変える手間も増えます。技術レベルが向上したとしても、せいぜい今までのボイスチェンジャーより自然に声が変えられるという程度ででしょうか。

逆に、声質変換の基となる音声技術を利用して、オレオレ詐欺を見破ることに利用できるかもしれません。
特有の喋り方、抑揚の付け方、声色の使い方等で詐欺を検知できるようになると、被害撲滅につながるのではないでしょうか。


声質変換で気をつけるべきは、イタズラ等に利用されることかと思います。
海外で、声質変換技術を利用してオバマ大統領が話しているかのような動画が制作されていました。
このように、本人が知らないところで好き勝手に声を利用されてフェイクニュースが増えるかもしれません。

当社としても、もちろん対策は考えています。
GoogleのDuplexでも、あまりに自然なので、「人工知能と名乗らせろ」という声が挙がりましたが、声質変換も同様に、変換された声であることがわかるような仕組みは検討中です。


どんなテクノロジーでも同じですが、ある程度は使う側の良心に依存してしまうものかなと思います。
包丁も同じで、使う人によっては凶器となり得ます。
もちろん提供する側として最大限の対策はしますが、テクノロジーが正しく利用される世の中であって欲しいものです。


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  
15 Nov

朝の目覚ましアラームに最適な声とは!?

朝、布団から抜け出しにくい季節になってきましたね。
皆さんは、朝の目覚めは良い方でしょうか?

私自身、たまに二度寝をしてしまい、急いで準備をするハメになってしまうことがあります。

そんな朝に弱い方にとっては有益かもしれない研究結果が発表されました。


なんと!

アラームより母親の声のほうが、目を覚ましやすいそうです!!

参考:
http://news.livedoor.com/article/detail/15578741/

具体的には、アラーム音では約50%の子しか目を覚めさなかったのに対し、母親の声では90%が目を覚ましました。また、母親の声を聞いた子どもは、30秒以内に部屋から出ました。これに対し、アラーム音で起こされた子どもたちは、5分近くかかりました。

声質変換に携わる身としては非常に興味深い研究結果です。
単に、音声合成の声が家族の声になると親近感が湧く等の理由で、ニーズがあるだろうと考えていましたが、こんな観点もありましたか。

目覚まし以外にも、寝る前とか試験前や大事な試合の前等、状況に合った声がありそうですね。
Aという場合においては恋人の声が良い、Bという場合は子供の声が良い等々。

その辺も分析して、声質変換とセットにすることで、日常生活のパフォーマンスを上げることも可能になるかもしれません。

いろいろと試したくなってきました!
個人的には、音声の可能性がまた広がった気がしてワクワクしています!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp 
7 Oct

好きな声で本を読んでもらえるようになる!

皆さんは、オーディオブックを利用したことがあるでしょうか?

ナレーターや声優が読み上げた本を「聴く」ことができ、読む必要が無くなるというモノなのですが、
Writoneというサービスがリリースされて、少し楽しみ方も変わりそうです。

https://jp.techcrunch.com/2018/10/02/writone/


「好きな声優が読み上げているのなら聴いてみよう」なんてニーズも産まれそうですね!

作家さんとしても、「この本はこの人に読んでもらいたい!」という想いはあるはずなので、とても面白いサービスだと思います。
声優さんとしても、新しい収入源になるので、まさに、Win-Win-Winですね!


当社の声質変換技術とも相性が良さそうで、組み合わせるともっと楽しみ方も増えそうに思います。

話し方の表現はこの人が良いけど、声質はこの人が良い、なんて選び方ができるかもしれません。

我々のビジョンは、「声を自由にデザインできるようにする!」ですが、
発する側だけではなく、聴く側が、「声を自由に選ぶようになる」と声の多様性もさらに広がっていきそうで楽しみです!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp
16 Sep

失った声を復活させられることが可能に。

AIで声を失ったラジオ記者の声を復活させるという事があるそうです。
ラジオ記者のように、音源が大量に残っている場合は、すでに実現が可能なようですね。

https://www.bbc.com/japanese/features-and-analysis-44492095


自分の声で発信することは非常に重要なことなのですね。
特に、音声がインターフェースとして注目されている昨今は、さらに声のニーズも高まっていると感じます。


当社の声質変換技術も音声合成技術と組み合わせることで、失った声を取り戻すことも可能になります。

さらに、当社の技術では音声のサンプル数を
もっと少なくすることが可能です。
30秒程度の音声が残っていれば、再現できるので、ラジオ記者のような方でなくとも、普通の方でも声を取り戻すことも可能になります。

もちろん、研究段階の技術なので、品質はまだまだですが、将来的には本来の声にかなり近い声や話し方も再現できるようになるはずです。

これは声帯摘出された方にとっては、かなり希望になるんじゃないでしょうか。
声質変換は、医療分野でも活躍する場がありそうですね。


株式会社voiceware

代表取締役社長 田村一起
http://voiceware.co.jp
ギャラリー
  • 大学で講演をしてきました!
  • voiceware設立から1年を振り返って
  • 会社紹介パンフレット!
  • 音声は未来のインターフェースとなるか!?
  • 声質変換ってなにもの??