株式会社voiceware 社長Blog

株式会社voiceware CEO田村のブログです。 会社のこと、技術のこと、日々のこと等、雑多に更新していきます。

何かと話題になっているスマートスピーカーですが、普及率って知ってますか?

日本が、2%に対して、
アメリカでは、16%だそうです。
成人に限定すると5人に1人は持っているという状況のようですね。

あまりにも違いがあるので、少し驚きました。

かく言う私も、まだスマートスピーカーは持っていないのですが。。(笑)

参考:
https://robotstart.info/2018/01/30/monitas-smart-speaker-report-201801.html 
https://forbesjapan.com/articles/detail/19330


情報の拡散スピードが早くなっているとはいえ、やはりアメリカと日本では、新しい技術が普及するスピードにはかなり差がありますね。

でも、逆に言えば、日本でもいずれは普及率が上がっていくのが見えているので、これってビジネスチャンスですよね!?

我が社の声質変換技術も、スマートスピーカーに導入できるようにして、チャンスを逃すことが無いようにしていきます!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp

NHKの番組でAIアナウンサーがニュースを読むそうです。

他局では、しばしば音声合成によるナレーションが登場していましたが、ついにNHKも乗り出しましたか。


参考:


音声合成技術が発達していくと、人間の出番も減るかもしれませんね。
夜中の緊急ニュースはAIが対応するとか。

ただし、ネックとなるのは、やはり音声のバリエーションでしょうか。

前回のブログでもかきましたが、音声合成で一つのモデルを作成するのには、かなりのコストがかかるようです。

当社技術でいろんなキャラクターがどんどん誕生するようになると面白いですね!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp

以前、声質変換技術について記事は書いたものの、当社技術の特徴については触れていませんでした。
今回は、voicewareの声質変換技術の特徴について書きたいと思います。

当社技術の特徴は、なんと言っても手軽さ。

例えば、
従来の音声合成技術では、ある人の音声モデルを作成するのに莫大なコストがかかっていました。
まず、声優さんの音声の収録に数日。
そして、その音声を基に、音声モデルを作成するのに数カ月。
そのため、1人の音声モデルを作成するのに、数百万単位のお金がかかっていたそうです。

それに対して、当社技術では、
音声の収録は、30秒。
学習時間は、1分で可能です。
さらに、収録する音声の内容は何でもOKです。
従って、極端な話、既に亡くなっている方でも、音声データさえあれば、音声モデルの作成が可能となります。
さらにさらに、テキストデータを介さずに、その人の声の特徴だけを捉えることが可能なので、多言語対応が容易となります。

実際、中国語、フランス語でも試してみましたが、十分に聞き取れるレベルで変換することができました。

改めて書き上げてみると、我ながら凄い技術だと思います。
まだまだ十分な品質とは言えないですが、品質が向上するとあらゆる分野で活用ができます。

音声合成技術への適用も1年後には、サービス化する予定です。


今週、デモの様子を撮影して頂く予定なので、近々、実際に声質変換する様子の動画も公開できるかと思います。

お楽しみに!!


株式会社voiceware
代表取締役社長 田村一起
http://voiceware.co.jp

このページのトップヘ