
【DTM】「VOCALOIDは人間の代用以上を目指す」 開発者語る(48)
- 1 恋しちゃってるBOYφ ★ sage 2010/03/12(金) 04:42:01 ID:???
- 「VOCALOIDは人間の歌手の単なる代用以上のものでないといけない」――ヤマハのVOCALOID
開発者・剣持秀紀さんは3月10日、東京大学で開かれた情報処理学会の講演で、こんな思いを打
ち明けた。歌ってくれる人が身近にいないから仕方なく使うのではなく、「VOCALOIDの方がいい」と
積極的に選んでもらえるようにし、ユーザー層や利用シーンを広げていきたいという。
VOCALOIDの開発がスタートしたのは2000年3月。今からちょうど10年前だが、歌声合成の歴史は
さらに前、1961年、ベル研究所でのIBM 7094が歌った「Daisy Bell」にさかのぼり、この50年でさま
ざまな研究が重ねられてきたという。
歌声合成のアプローチを剣持さんは、大きく3種類に分ける。(1)純物理モデル「フィジカルモデル」、
(2)物理的な機構にとらわれず、歌声をそのまま扱う「スペクトラルモデル」、(3)(1)と(2)の中間的
なモデル――だ。VOCALOIDはフィジカルモデルとスペクトラルモデルの「いいとこ取り」。世界の
音声合成研究の成果を取り入れて開発したと、剣持さんは話す。
「初音ミク」などVOCALOIDソフトがヒットしたのは、人間の声の代わりに便利、という理由だけでは
ない。「ミクなら音程を外さず、思い通りに歌ってくれる」「ミクが好きだから」「ミクを使うと注目を浴び、
聴いてもらえるから」――など、人間にはできない、“VOCALOIDだからこそ”の機能が人気を引っ張った。
VOCALOIDが目指す未来の姿として、剣持さんはデジタルのメトロノームを挙げる。メトロノームは以前は、
アナログが主流。デジタル製品はアナログの代用として登場したが、「正確」「持ち運びやすい」「チューナー
機能を備えたものもある」などアナログにない機能が魅力となり、現在はデジタルが主流になっているという。
メトロノームのように歌声も、デジタルが主流となる日が来るだろうか。「15年後には、あの歌手は合成
じゃなくて生で歌ってるんだって。イマドキ珍しいよね、という世界がくるのでは」――剣持さんはそんな
未来を目指している。
VOCALOIDは今後、声のバリエーションや利用場面、ユーザー層の拡大を目指していく。
声のバリエーションでは現在、スペイン語版を研究中で、スペイン語の歌をうたわせたデモ(未公開の歌声
データベースを使用)も披露した。「世界の言語にトライしたい」と剣持さんは意気込む。しゃべる音声を合成
できる「VOCALOID-flex」も開発。歌声と読み上げ音声の中間的な発声に対応したソフトは、「意外と手つかず
の分野」という(「テキストの音声化ではない」 しゃべるVOCALOID「flex」が狙う市場)。
VOCALOIDの利用場面は、今は楽曲制作やニコニコ動画での公開などに限られているが、合成エンジンを
リアルタイム操作に対応させ、ライブコンサートなどでも使えるようにする――といった未来も描く。
初音ミクのヒットにより、専門的なスキルがない人も楽曲制作に興味を持ち始めており、初心者向けの楽曲制作
マニュアルや、VOCALOID用VSQファイル販売サイトも登場している。誰もが簡単に作ったり、みんなで共同制作
したりといった環境が整っていくことで、ユーザー層も広がっていくと剣持さんはみている。具体的にプロジェクト
が動いているわけではないものの、VSQフォーマットをWiki形式で共同で編集していくというアイデアも語った。
ソース
http://www.itmedia.co.jp/news/articles/1003/11/news053.html
総レス数 48
■ このスレッドは過去ログ倉庫に格納されています
IE等普通のブラウザで見る場合 http://tubo.80.kg/tubo_and_maru.html
専用のブラウザで見る場合 http://www.monazilla.org/
2ちゃんねる Viewerを使うと、すぐに読めます。 http://2ch.tora3.net/
この Viewer(通称●) の売上で、2ちゃんねるは設備を増強しています。
●が売れたら、新しいサーバを投入できるという事です。
よくわからない場合はソフトウェア板へGo http://hibari.2ch.net/software/
モリタポを持っていれば、50モリタポで表示できます。
read.cgi@hanako ver 2011/01/22
FOX ★ DSO(Dynamic Shared Object)