落語音声合成
世界初の、人を楽しませる音声合成としての落語音声合成。
Business social network with 4M professionals
株式会社RevComm / シニアリサーチエンジニア
Available to logged-in users only
🚀 音声合成の内製化 ・日本語音声合成を独自に開発。要件定義・話者選定・原稿作成・録音・アノテーション・G2Pの改善・モデルの訓練&評価・デプロイを一気通貫で担当。
View Shuhei Kato's
Full Profile
This information is visible only to Wantedly users or the user’s connections
View past posts
View mutual connections
View Shuhei Kato's full profile
・CosyVoice 2のようなLLMベースの音声合成にはテキストフロントエンドを持たないものが少なくなく、発音の修正がほぼ不可能。 ・そのようなモデルでも音素レベルの発音・アクセント修正を可能とするLoRAアダプターを開発 ・成果をプレプリントのほか、オープンソースで公開(コード・モデル)
世界初の、人を楽しませる音声合成としての落語音声合成。