No.332
知財図鑑関連アワード受賞知財
2021.05.20
人を楽しませる音声合成の研究
落語音声合成
概要
(「落語音声合成」は、「卒論OPEN AWARD 2021」の優秀賞受賞論文の関連知財です。)
本研究は落語を演じる音声合成を構築することで、「人を楽しませる」音声合成の実現を考察したものである。従来の音声合成は、限られた条件下においては人間と同等の自然性を持つ音声が合成可能となっているが、話芸のような人を楽しませる水準の機能は十分に再現されているとは言い難い。本研究では、先例がない落語を演じる音声合成を研究することで、音声合成が単なる情報伝達の範疇に収まらない、芸の進歩や新たなエンターテイメントの創出、機械と人間のコミュニケーションの変革に寄与することを目指した。
なにがすごいのか?
音声合成研究の主流である情報伝達とは別の「人と楽しませる」機能への着目
伝統芸能である落語と最新の機械学習を組み合わせた、先例のない研究
プロの落語家の演じた落語音声の録音およびアノテーションを行い、大規模な音声合成用落語音声データベースを構築
人間の話芸の水準を目指した音声落語合成の「面白さ」の改善
なぜ生まれたのか?
音声合成が世の中で使われる場面は近年増え続け、その品質は特に深層学習の登場により急激に向上した。2017年には限られた条件下ではあるものの、音声合成研究者が長年目標としていた人間と同等の自然性を持つ音声合成を達成した。伝統的な音声合成研究においては音声の持つ情報伝達としての機能を高度に再現することが重視されてきたが、本知財の研究者は情報伝達以外の「人を楽しませる」機能の再現を目指し研究に着手した。
相性のいい産業分野
- AI
アメリカのスタンダップコメディやロシアのアネクドートなど固有の文化風土に根付いたユーモアをAIで解析
- アート・エンターテインメント
伝説的な噺家たちの特徴を全て再現し凝縮した「超・落語名人」による音声プレイリスト
- 教育・人材
名人の落語音声をデータ解析し若手の噺家や漫才師への教材化
- ロボティクス
常にユーモラスなジョークを明るく話し続けてくれるトーキング・ロボット
- メディア・コミュニケーション
人を楽しませ惹きつける話芸に特化した「AIナレーター」や「AIラジオDJ」