- 採用人事
- フルスタックエンジニア
- テクニカルサポート
- Other occupations (21)
- Development
- Business
- Other
出会いと興味を辿ってきたらJamRoll開発にたどり着いた、社会人学生カトウさんのストーリー:河東 宗祐さん(ML Engineer)インタビュー
プロフィール
河東 宗祐 Engineer
早稲田大学在学中にプログラミングを始める。研究室において、情報検索、自然言語処理、対話システム等の分野の研究に携わり、修士修了後は助手として研究を継続。その後Empathにインターンとしてジョインする傍ら、フリーエンジニアとして活動。2022年4月に社員として入社し、JamRollの開発に携わる。愛犬2匹と生活中。
研究分野との出会い
私は大学の学部に5年間在学していました。色々なことに興味があったので、早稲田大学の起業家養成講座を受講したり、Microsoft Student Partnersに参画したりと忙しくしていました。もともとビジネスアイディアを考えるのは得意ではなかったものの、プログラミングスキルを活かしてそれを実現することは楽しいと感じていて、課外活動に勤しんでいたので授業をおろそかにしてしまい…。
同級生と同じ4年生進級のタイミングでは研究室に入れない予定だったのですが、「3年生でも同級生と一緒に研究して良いよ」と言ってくれる教授に出会い、留年はしたもののこちらの研究室で一緒に活動をするようになりました。こんな風に柔軟に受け入れてくれて、かつ4年生と同じように熱心に時間を割いて指導してくださる教授は珍しかったので、楽しく研究をすることができ、進級時も流れに乗り継続する形でこちらに所属したんです。この研究室で、情報検索、自然言語処理、対話システムといったテーマに出会いました。もともと特別に興味があったわけではないのですが、結果的にEmpathでの仕事に繋がっていく分野になります。
この教授はとても優しくて積極的な方だったので、早く卒業できるよう、国際論文の執筆をサポートしてくれて、修士を半年早く卒業し、博士課程に進学しました。博士課程では3年間助手として契約することができたので、お給料をもらいながら、学部1・2年生の学習をサポートしたり、単位外のセミナーを開催したり、自分の研究を進めるという生活をしていました。ただ、この3年間は思いのほか忙しく、博士論文が書けなかったので、学費を稼ごうと思い、博士課程を休学して働くことにしました。
EmpathとJamRoll
働き方としては、フリーでエンジニアをしながら、どこか会社での仕事もできたらと思っていた頃にWantedlyでEmapthと出会いました。インターンとして雇ってもらえたので、当時はコールセンター事業に関わっていたのですが、正直、インターンはフリーエンジニアのようには稼げなくて(笑)続けるかどうか迷っていたところ、JamRollの新規開発の話が出てきて、自分の博士論文にも活かせそうだと思い本格的にEmapathに関わることを決め、社員になりました。
実は、今年(2022年)の10月に復学をしたので、今は社会人と学生の両方の身分です。在学可能なのは残り2年なので(早稲田大学博士課程の在学可能期間は6年間)、論文を書きたいのですが…開発が忙しくて、どうなるかまだ分かりません。それでも、自分は開発だけやっていたいとか研究だけしていたいとか、そういう気持ちはなく、色々なことができていて楽しいと感じているし、全方面の知識を身に付けられたほうが良いと考えています。とりわけ工学分野の研究は、「実社会に応用されてこそ意味がある」と思っているので、産学連携に近い形で実データに触れる価値を日々感じられていることは、とても意義深いです。
現在の業務としては、AIモデルを作るための環境を整えたり、AIモデルの組込をしたりしています。音声認識より自然言語処理の部分ですね。以前、ストーリーでも紹介されている松本さんをはじめ、山岡さんや他の方も一緒に仕事をしています。AIモデル開発のほかにも、AWSのコスト検討、インフラの管理など、様々なタスクがありますが、ベストだと思うリソース配分を自分で決めて実行しています。自由にやらせてもらっていて、私にはやりやすいです。ベンチャーあるあるだと思いますが、色んな方面を勉強でき、興味の範囲が広い人には良い環境だと思います。
これからの夢
将来、「人の価値観を定量的に可視化したり、共有できたりする何か」を作りたいと思っています。私達は、長い付き合いのある相手であったとしても、その人の逆鱗に気が付くことが出来なかったりします。また、初対面の人が大事にしている事・重きを置いている事、それがプロフィールを見たら分かるような何かがあったら良いなと。なるべく網羅的に、その人の価値観の定量を表示するようなものですね。私自身が「察する」ことが苦手なので、対話せずともぱっとわかる、そういうものがあったらいいな、と思います。
そのような価値観を分析する一つのツールとして、自然言語処理や対話分析が使えると考えています。現在の技術では「この人はこういう好みがある」というレベルまでしか分析できませんが、もっと抽象度の高いところまで分析ができるようになり、相手の価値観を考慮した対応ができたら理想です。
測り方の一つとしては、インプットされた情報とアウトプットされた感情のペアを分析すれば、何に重きを置いているのかがわかりそうだなと思っています。私は感情についてはそこまで詳しくないですが、Empathには感情が得意分野の方が多いですし、自分の自然言語処理の知識を活かす形で協業して実現出来たら、幅広く応用できそうな技術だと思います。
JamRollで実現したいことで言うと、対話エージェントを作りたいと思っています。ミーティング中にJamRollのBotが会話を拾い、必要な情報を提供してくれるというような対話エージェントです。このエージェントは、技術を分解すると、音声認識・キーワード抽出・検索システム(優良情報の抽出)という機能が必要になります。
私たちはもはや、Googleなどで検索して出てくることをわざわざ記憶しないので、いかに欲しい情報にアクセスしやすくするかが重要だと思います。そのアクセスにおいて大事なのが検索エンジンなので、良い対話エージェントを実現するには、良い音声認識エンジンと、入力に対して有用な情報を取ってくることのできる、抽象度の高い言語理解を有した検索システムが無ければなりません。具体的には、会議の中で「先週の定例でなんて言ってたっけ?」とぼそっと言うと、JamRoll Botが先週の動画の必要箇所を切り出して提示してくれる。そんな世界線を実現したいと思っています。
-
河東さん、幅広いお話を聞かせてくださり、ありがとうございました!