voiceware

株式会社voiceware 社長Blog

株式会社voiceware CEO田村のブログです。 会社のこと、技術のこと、日々のこと等、雑多に更新していきます。

音声技術

9 Mar

音響学会に参加してきました

3月5日~7日に電気通信大学で開催されていた、日本音響学会に参加してきました。


学会というものに参加するのは、大学生以来なので、8年振りくらいでしょうか。

社会人になってからは、全く参加する機会がなかったので新鮮でしたね。


学会というと馴染みのない方も多いかと思いますが、大学や企業の研究者がテーマに沿って発表を行い、それを聴講するというスタイルです。

正直、技術的な部分はさっぱり理解できなかったのですが、最新技術のトレンドもわかるし、最先端のレベルも知れる、「こんなこともやってるの?」という発見もあり、非常に興味深かったですね。


何よりも、音声界隈の研究者の方と繋がりがもてたのが一番の収穫でした。

お話させていただいた方は、皆さん、こういう世界を実現したいという想いやプランがあり、未来についてワクワクするような話できる楽しい時間でした。



大学生の時は、自分の発表のためだけに学会に参加していて、自分の出番以外にはあまり興味がもてなかったのですが、興味のある分野、事業に関わる分野だと、こんなにも自らの姿勢が変わるのが驚きでした。

研究者の方が、いろんな学会に参加したいと言っている理由がわかりましたね。


これからは、積極的にそういった場にも参加して、最新研究の動向に触れるようにしていきます!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp    
6 Feb

声をアップデートせよ

NewsPicks風にタイトルつけてみました(笑)


さて、声質変換技術の目標は、他人の声になりきることですが、最近、他の利用方法もあるのではないかなと考えています。

以前、ブログにも書きましたが、状況によって最適な声というのが存在します。
http://voiceware.blog.jp/archives/13462445.html

例えば、学校の先生なんかを思い出してみてください。
同じような内容を話しているのに、何故か説得力のある声の先生や眠くなる声の先生、聞いているだけで元気になる声の先生等がいますよね?
あるいは、声が大きいわけではないのに、通りやすく聞き取りやすい声の方もいます。
もちろん話すテンポや抑揚の付け方も大きな要素とは思いますが、声質そのものの特性も影響していると思うのです。

そこで、状況に応じて微妙に自分の声を変化させることで、自分の声と認識されつつも、効果的な声にすることができるのではないかと考えています。
営業に最適な声、面接に最適な声、モテる声...etc.
最適な声を出すことができると、コミュニケーションも円滑になるのではないでしょうか?

まさに、声のアップデートをしたいということですね。


まだまだ構想中の段階ではありますが、もし興味のある企業様がいましたら、お気軽にご連絡ください。


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp   
25 Jan

スマートスピーカーのメリット

音声関係の事業をやっていることもあり、VUI(Voice User Interface)にもっと普及してほしいなと思っています。
あまり馴染みのない方もいるかもしれませんが、今一番身近になりつつあるのは、スマートスピーカーでしょうか。

アメリカでは既に4人に1人が保有しているそうですが、日本での普及率はまだ3%程度だそうです。
私自身も昨年購入し、使い続けていますが、「何が嬉しいの?」とよく聞かれます。

そこで、個人的に「ココが良い!」というポイントをお伝えできればなと思います。
あくまで個人としての主観なので、他にもっと良い使い方や、共感できないこともあるかもしれませんが、少しでも参考になれば嬉しいです。


【よく使う機能】

1.音楽ストリーミング
「アレクサ、音楽かけて」これだけで再生できるので操作がめちゃくちゃ楽。
家で作業しているときは大体音楽を流していますね。
少しずつ自分の好みも学習してくれるのも嬉しい。

2.フラッシュニュース
朝の情報収集はこれですね。
以前はTVで情報収集をしていましたが、TVの情報は偏りがある印象です。
ヘッドラインだけ聞けるので、満遍なくざっくり知るにはちょうど良いです。
私は、IT系、国際系、国内ニュースのスキルを登録しています。
自分の興味のある分野に特化できるのもありがたい。

3.タイマー(目覚まし)
アラームを止めるために声を張らなければいけないので、目が覚めます(笑)

4.スケジュールの確認
毎朝、その日の予定と次の日の予定を確認するのに使ってます。

ネタ系もいくつか使ってみましたが、長く使い続けられるのはやっぱり実用的なスキルですね。


【スマートスピーカーのメリット】
1.手放しで操作できるので楽
音楽を聴く機会も増えましたね。
朝の支度をしながらでも全く支障がありません。

2.時間を有効活用できる
1.にも繋がりますが、圧倒的に操作の時間が短縮できます。
また、ながら作業をやりやすいというメリットもあります。
TVで情報収集していると、ついついぼんやり眺めてしまいがちですが、音声だとメリハリがつきます。

3.話のネタになる
なんだかんだでこれが一番かもしれません(笑)
食い付きは良いですし、確実に盛り上がります!!


こんなところでしょうか。
スマートスピーカーというと、高価な印象をもっている方が多いみたいですが、安いものだと3,000円代から購入できるし、前の世代のものだと2000円を切る場合もあります。
少しでも興味のある方は、まず買ってみるのをオススメします!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  
6 Jan

声質変換でオレオレ詐欺は増える?

2019年、一発目の投稿となります。
本年もどうぞよろしくお願い致します!


さて、近年はテクノロジーに犯罪対策は付きものとなっています。
音声分野も例外ではなく、自動音声を利用した詐欺なんかも発生しているようです。

参考:
https://jp.techcrunch.com/2019/01/05/2019-01-04-new-apple-voice-phishing-scam-looks-just-like-a-real-support-call/


声質変換技術の説明をした際に、一番良く言われることは、
「オレオレ詐欺が蔓延りそう」です。

ちなみに、2018年の振り込め詐欺(いわゆるオレオレ詐欺以外も含む)の被害件数は、なんと13,000件にのぼるそうです。
被害額だと、286億円。
認知件数だけでこの数字なので、気付かれていないものも含めると、その数倍になりそうですね。
改めて、凄い数字だと思います。

参考:
https://www.npa.go.jp/safetylife/seianki31/higaijoukyou.html


たしかに、声質変換技術で声色を真似することができるようになると、簡単に息子や娘の真似ができるようになるかもしれません。
ただ、オレオレ詐欺に利用するためには、本人の声データを取得する必要があります。
ここからは個人的な見解ですが、数打ちゃ当たる戦法のオレオレ詐欺には、声質変換は向かないと思います。
現状の技術レベルでは、不自然さが増しますし、声を変える手間も増えます。技術レベルが向上したとしても、せいぜい今までのボイスチェンジャーより自然に声が変えられるという程度ででしょうか。

逆に、声質変換の基となる音声技術を利用して、オレオレ詐欺を見破ることに利用できるかもしれません。
特有の喋り方、抑揚の付け方、声色の使い方等で詐欺を検知できるようになると、被害撲滅につながるのではないでしょうか。


声質変換で気をつけるべきは、イタズラ等に利用されることかと思います。
海外で、声質変換技術を利用してオバマ大統領が話しているかのような動画が制作されていました。
このように、本人が知らないところで好き勝手に声を利用されてフェイクニュースが増えるかもしれません。

当社としても、もちろん対策は考えています。
GoogleのDuplexでも、あまりに自然なので、「人工知能と名乗らせろ」という声が挙がりましたが、声質変換も同様に、変換された声であることがわかるような仕組みは検討中です。


どんなテクノロジーでも同じですが、ある程度は使う側の良心に依存してしまうものかなと思います。
包丁も同じで、使う人によっては凶器となり得ます。
もちろん提供する側として最大限の対策はしますが、テクノロジーが正しく利用される世の中であって欲しいものです。


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  
23 Dec

AIによって歌手や声優はいなくなる??

久々の更新になってしまいました。
年末は飲み会も多く、バタバタと過ごしていますが、新しい出逢いもたくさんあり、とても刺激的な毎日を過ごせています。
新しくビジネスに繋がりそうな方とも知り合えたので、今後が楽しみです!
いろいろな出逢いの機会をくださってた方々には、感謝ですね!!


さて、近年では音声技術もかなり注目されるようになってきており、その進歩もめざましいものがあります。
最近のニュースで個人的に衝撃的だったのは、歌声合成ですね!

参考:
http://ainow.ai/2018/12/14/158579/

もはや機械とは思えないクオリティ!
何も言われなければ、人が歌っていると勘違いしてしまいそうです。
以前にも紹介しましたが、GoogleのDuplexに代表されるようにもちろん歌声以外も人とほとんど区別がつきません。

参考:
https://wired.jp/2018/11/05/google-duplex-pixel-smartphone/


こうなってくると、「歌手や声優・ナレーターは仕事がなくなるのではないか?」という意見もありますが、個人的にはまだ数十年は先かなと思っています。
やはり生の人の声には、数値では測れないようなパワーのようなものがあると感じます。
雑談しかしていないのに何故かこの人と話すと元気なる、というような人っていますよね?
その辺りも解明できると面白そうではあります。

とはいえ、歌手や声優の働き方が変わってくるのは事実だと思います。
本当に表現力・スキルのある人以外は淘汰されるかもしれませんね。
その一方で、声色そのものに魅力がある方だと、声だけを売るなんてことも可能になってきます。
どの業界も同じだと思いますが、テクノロジーによって、デジタルもアナログも本当に良いものに洗練されていくのでしょうね。

当社の技術もそんな未来に貢献できるように、日々磨いていきます!!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  
ギャラリー
  • 大学で講演をしてきました!
  • voiceware設立から1年を振り返って
  • 会社紹介パンフレット!
  • 音声は未来のインターフェースとなるか!?
  • 声質変換ってなにもの??