株式会社ディー・エヌ・エー / AI技術開発部
日本語 End-to-End 音声合成における話者適応の検討
100文規模から2,000文規模の音声データを用いて、単一話者での日本語End-to-End音声合成システムの開発を目指します。 提案法では、fine-tuningにより小中規模データセットでの話者適応を用いることで実現しました。 主観評価実験の結果、提案法を用いて合成される音声は、単一話者のみを用いた場合と比べ、音質に関して有意であること確認しました。
Discover companies you will love
株式会社ディー・エヌ・エー / AI技術開発部
2017年大学2年生時に東大猿渡研究室に研究インターンとして所属し、日本語コーパスJSUTの作成や軽度認知症を音声から判別するモデルの開発に従事し、それぞれの結果で論文投稿を行いました。
今後は音声に限らずAI技術全般でエンジニアやPjM/PdMや大学院で研究していた量子領域で活動したいと考えています。
音声合成・音声変換の研究開発に従事。音声変換では社外に向けてのプロジェクトを展開し、社外との交渉やプロジェクトマネージャーとして管理業務を行なっています
計算化学、量子コンピュータを用いた化学ダイナミズムのシミュレーション
JSUTコーパスの作成、音声による認知症診断モデルの開発
View Ryosuke Sonobe's
Full Profile
This information is visible only to Wantedly users or the user’s connections
View past posts
View mutual connections
View Ryosuke Sonobe's full profile
株式会社ディー・エヌ・エー / AI技術開発部
100文規模から2,000文規模の音声データを用いて、単一話者での日本語End-to-End音声合成システムの開発を目指します。 提案法では、fine-tuningにより小中規模データセットでの話者適応を用いることで実現しました。 主観評価実験の結果、提案法を用いて合成される音声は、単一話者のみを用いた場合と比べ、音質に関して有意であること確認しました。