株式会社voiceware 社長Blog

株式会社voiceware CEO田村のブログです。 会社のこと、技術のこと、日々のこと等、雑多に更新していきます。

タグ:音声

2019年も早くも半分が終わりましたね。
振り返ってみると、すごく中身の濃い半年間だったなと思います。


さて、7月から株式会社voicewareも3年目に突入しました!

この1年で売上も大きく伸び、また共に働く仲間も増えました。
他のスタートアップと比較するとかなりゆっくりではありますが、順調に進んでいると思います。
でも、想い描いた実績には遠く及ばないので、まだまだ努力あるのみです!


起業して2年と考えると、「もうそんなに経つのか〜」という感じです。
2年前と比較すると、私自身もかなり成長したんじゃないでしょうか?
初めてのアポでめちゃくちゃ緊張していたことが懐かしいです(笑)

最初の1年は、とにかく手探りな状態でしたね。
いろんな人にデモをしながら、意見をいただく日々でした。
元々は声質変換技術を世の中に出したくて立ち上げた会社でしたが、世間に受け入れられるためには、まずはクオリティを上げることが必要だと気付かされました。
この辺は見切り発車で会社を立ち上げてしまった反省点ですね。。。

2年目に入って、音声AI関連の受託開発・研究の仕事を取れるようになり、売上的には安定してきました。
採用活動にはかなり力を入れていましたが、音声研究者は母数も少ないので、なかなか良い人材が見つからずやきもきしていましたね。
その甲斐もあって、優秀な研究者とも出逢え、研究もかなり進んできました。
そして、ようやくプロダクト開発にも着手できました。
このプロダクトによって社会がどう変わっていくのかを考えると、今からワクワクしてきます!
皆さんも是非、楽しみにしていてください!


結果的に、この2年間は、voicewareにとって準備期間となってしまいましたが、これからは本気で仕掛けていきます!!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp/ 

音声関係の事業をやっていることもあり、VUI(Voice User Interface)にもっと普及してほしいなと思っています。
あまり馴染みのない方もいるかもしれませんが、今一番身近になりつつあるのは、スマートスピーカーでしょうか。

アメリカでは既に4人に1人が保有しているそうですが、日本での普及率はまだ3%程度だそうです。
私自身も昨年購入し、使い続けていますが、「何が嬉しいの?」とよく聞かれます。

そこで、個人的に「ココが良い!」というポイントをお伝えできればなと思います。
あくまで個人としての主観なので、他にもっと良い使い方や、共感できないこともあるかもしれませんが、少しでも参考になれば嬉しいです。


【よく使う機能】

1.音楽ストリーミング
「アレクサ、音楽かけて」これだけで再生できるので操作がめちゃくちゃ楽。
家で作業しているときは大体音楽を流していますね。
少しずつ自分の好みも学習してくれるのも嬉しい。

2.フラッシュニュース
朝の情報収集はこれですね。
以前はTVで情報収集をしていましたが、TVの情報は偏りがある印象です。
ヘッドラインだけ聞けるので、満遍なくざっくり知るにはちょうど良いです。
私は、IT系、国際系、国内ニュースのスキルを登録しています。
自分の興味のある分野に特化できるのもありがたい。

3.タイマー(目覚まし)
アラームを止めるために声を張らなければいけないので、目が覚めます(笑)

4.スケジュールの確認
毎朝、その日の予定と次の日の予定を確認するのに使ってます。

ネタ系もいくつか使ってみましたが、長く使い続けられるのはやっぱり実用的なスキルですね。


【スマートスピーカーのメリット】
1.手放しで操作できるので楽
音楽を聴く機会も増えましたね。
朝の支度をしながらでも全く支障がありません。

2.時間を有効活用できる
1.にも繋がりますが、圧倒的に操作の時間が短縮できます。
また、ながら作業をやりやすいというメリットもあります。
TVで情報収集していると、ついついぼんやり眺めてしまいがちですが、音声だとメリハリがつきます。

3.話のネタになる
なんだかんだでこれが一番かもしれません(笑)
食い付きは良いですし、確実に盛り上がります!!


こんなところでしょうか。
スマートスピーカーというと、高価な印象をもっている方が多いみたいですが、安いものだと3,000円代から購入できるし、前の世代のものだと2000円を切る場合もあります。
少しでも興味のある方は、まず買ってみるのをオススメします!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  

2019年、一発目の投稿となります。
本年もどうぞよろしくお願い致します!


さて、近年はテクノロジーに犯罪対策は付きものとなっています。
音声分野も例外ではなく、自動音声を利用した詐欺なんかも発生しているようです。

参考:
https://jp.techcrunch.com/2019/01/05/2019-01-04-new-apple-voice-phishing-scam-looks-just-like-a-real-support-call/


声質変換技術の説明をした際に、一番良く言われることは、
「オレオレ詐欺が蔓延りそう」です。

ちなみに、2018年の振り込め詐欺(いわゆるオレオレ詐欺以外も含む)の被害件数は、なんと13,000件にのぼるそうです。
被害額だと、286億円。
認知件数だけでこの数字なので、気付かれていないものも含めると、その数倍になりそうですね。
改めて、凄い数字だと思います。

参考:
https://www.npa.go.jp/safetylife/seianki31/higaijoukyou.html


たしかに、声質変換技術で声色を真似することができるようになると、簡単に息子や娘の真似ができるようになるかもしれません。
ただ、オレオレ詐欺に利用するためには、本人の声データを取得する必要があります。
ここからは個人的な見解ですが、数打ちゃ当たる戦法のオレオレ詐欺には、声質変換は向かないと思います。
現状の技術レベルでは、不自然さが増しますし、声を変える手間も増えます。技術レベルが向上したとしても、せいぜい今までのボイスチェンジャーより自然に声が変えられるという程度ででしょうか。

逆に、声質変換の基となる音声技術を利用して、オレオレ詐欺を見破ることに利用できるかもしれません。
特有の喋り方、抑揚の付け方、声色の使い方等で詐欺を検知できるようになると、被害撲滅につながるのではないでしょうか。


声質変換で気をつけるべきは、イタズラ等に利用されることかと思います。
海外で、声質変換技術を利用してオバマ大統領が話しているかのような動画が制作されていました。
このように、本人が知らないところで好き勝手に声を利用されてフェイクニュースが増えるかもしれません。

当社としても、もちろん対策は考えています。
GoogleのDuplexでも、あまりに自然なので、「人工知能と名乗らせろ」という声が挙がりましたが、声質変換も同様に、変換された声であることがわかるような仕組みは検討中です。


どんなテクノロジーでも同じですが、ある程度は使う側の良心に依存してしまうものかなと思います。
包丁も同じで、使う人によっては凶器となり得ます。
もちろん提供する側として最大限の対策はしますが、テクノロジーが正しく利用される世の中であって欲しいものです。


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  

今年も本ブログ共々、お世話になりました。
普段はあまり新年だからといった事は意識しないのですが、久々にゆっくりできる時間が取れたので、1年感を振り返ってみました。


1年前と比べると、音声分野を取り巻く環境は大きく変わってきました。
スマートスピーカーの普及と共に音声ユーザーインターフェース(VUI)もかなり注目されるようになってきています。
これからの1年間はさらに加速度的に変化していくのだと思います。
そんな状況もあってか、voicewareとしても声質変換以外にも音声関連のいろんな仕事をいただくようになりました。
ご相談をいただく分野は、音声認識、音声合成、感情分析、声質分析等様々です。
音声×AIを扱えることは、改めて、当社の強みだと思うようになりました。

voicewareとしては、2期目に突入し、取引先も増えましたし、一緒に仕事をする仲間も増えました。
1年前は声質変換技術の研究・開発しかしておらず、売上げを出せるようになるのは、もう1、2年先になるだろうと想定していたので、大きな変化といえます。
売上げも堅調に伸びており、協力いただいている仲間には本当に感謝です。

私自身も1年前は経営者として全く未熟でしたが、この1年で本当にいろんなことを経験させてもらいました。
voiceware代表として、メディアに出演する機会やイベントで登壇する機会もいただきました。
改めて振り返ると、濃い1年間だったなぁと思います。
私もvoicewareも、まだまだ発展途上ではありますが、確実に進歩していると実感しています。

今はまだ研究が中心ですが、来年中には、何らかの形でサービスを社会に出していくことが目標です!
そのためにも、これまで以上に様々な事に挑戦していきます!

来年もvoicewareをよろしくお願いします!!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp  

朝、布団から抜け出しにくい季節になってきましたね。
皆さんは、朝の目覚めは良い方でしょうか?

私自身、たまに二度寝をしてしまい、急いで準備をするハメになってしまうことがあります。

そんな朝に弱い方にとっては有益かもしれない研究結果が発表されました。


なんと!

アラームより母親の声のほうが、目を覚ましやすいそうです!!

参考:
http://news.livedoor.com/article/detail/15578741/

具体的には、アラーム音では約50%の子しか目を覚めさなかったのに対し、母親の声では90%が目を覚ましました。また、母親の声を聞いた子どもは、30秒以内に部屋から出ました。これに対し、アラーム音で起こされた子どもたちは、5分近くかかりました。

声質変換に携わる身としては非常に興味深い研究結果です。
単に、音声合成の声が家族の声になると親近感が湧く等の理由で、ニーズがあるだろうと考えていましたが、こんな観点もありましたか。

目覚まし以外にも、寝る前とか試験前や大事な試合の前等、状況に合った声がありそうですね。
Aという場合においては恋人の声が良い、Bという場合は子供の声が良い等々。

その辺も分析して、声質変換とセットにすることで、日常生活のパフォーマンスを上げることも可能になるかもしれません。

いろいろと試したくなってきました!
個人的には、音声の可能性がまた広がった気がしてワクワクしています!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp 

このページのトップヘ