株式会社CASTALKでは、最先端のAI技術を駆使して
"圧倒的人間感"をもつAIアバターを開発しています。
"圧倒的人間感"の特徴として、3つのセクションに注力しています。
<Video:VideoGen技術による生身のような外見>
OpenAI社の動画生成AI(sora)にも使用される
CNN (Convolutional Neural Network)を活用した外見を生成します。
弊社独自開発(世界初!)のReal-Time Lip Sync Video Generation技術による
まるで人間のモーションのような唇の動きを創り出します。
さらに、GAN (Geverative Adversarial Network)技術によりCNN生成モーションを補正しています。
<Talk:LLM(Large Language Models)生成AIによる当意即妙な会話>
RAG(Retrieval Augment Generation)システムにより、会話内容の劇的な品質向上を進めます。
ChatGPTの生成AIエンジンに対して、自社開発エンジン・ユーザーごとのデータベースによる会話内容のカスタマイズを実施しています。
これにより、その人だけの親友・恋人のような会話を実現できます。
<Voice:TTS(text to speech)技術による本人そっくりの会話>
一般流通しているGoogle Cloud TTS, Microsoft Azure TTS等のテキスト音声化技術をベースに、
弊社独自の技術で改良を実施しています。
大規模言語モデル・GAN技術を活用して感情表現・トーン・リズムを持つ、人間の音声表現に忠実な声を生成し、滑らかさを追加しています。
各セクションにおける優秀なエンジニアのもと、
まるで人間と錯覚するような高品質なAIアバターと
リアルタイムテレビ電話、ビデオチャット、テキストチャットができる
エンドユーザー向けiOS・Androidのスマホアプリの開発を進めています。
各セクションで高い技術や品質を実現するだけでなく、
虚偽の情報や風評被害などAIが抱えるリスクを抑制するプロテクションも備えている
次世代AIアバターであると自負しています。