1
/
5

経営判断できるAIを。画像・動画認識AIの研究者が語る、RCRが見据える未来。

こんにちは、RevComm(レブコム)採用広報担当です。今回は2022年9月に入社し、RevCommの研究開発部門であるRCR(RevComm Research)にて、画像・動画認識AIを専門として研究する春日宥一郎のインタビューをお届けします。北海道大学で博士課程に在籍していた春日が、大学を去ってまでRevCommへ入社した理由、そして最新のAIモデルが次々に話題となる中、RCRの研究開発環境や見据えている未来について話を聞きました。

現在RevComm Research(以下、RCR)で担当している業務について教えてください。

RevCommの研究開発部門であるRCRは、リサーチ部門とディベロップ部門の2つに分かれており、私はリサーチ部門で研究活動をしています。リサーチ部門では、主に音声認識AIの性能改善や、最近では画像・動画認識AIの技術検証を行っています。私は、北海道大学在籍中に画像・動画認識AIを専門として研究していました。当時の研究をそのまま応用する形で、RCRでの技術検証や、最新の学会等で出ている研究や論文が自社のプロダクトで使えるかどうかの検証をしています。

入社前、北海道大学ではどんな研究をしていたんですか?

札幌にある円山動物園で飼育されている動物の健康状態や行動解析を人工知能で管理する産学官連携プロジェクトで、私は技術面を担当しました。チンパンジーやシロクマを対象に、監視カメラの映像から動物の画像を切り抜いて、人工知能に個体認識を学習させ、どこに居るのかをトラッキングするための研究をしていました。

とても興味深いですね。動物や人工知能にはずっと興味があったのですか?

動物行動学や動物心理学にも興味はありましたが、動物そのものというより、人間の脳の進化やその過程に昔から興味がありました。同時に人工知能やロボットなどにも興味がありました。「ロボットに人間らしい感情や、生き物らしい知覚を搭載するにはどうしたらいいのか?」を探求していく中で、動物の進化の過程に注目することでヒントが得られることに気づいたんです。

2022年9月に大学院を辞め、RevComm入社したのは、どのようなきっかけからでしょうか?

2022年の春頃、博士課程在籍中に就職活動を始め、就活サイトやWantedlyに自分の経歴や論文をまとめました。まもなく、リサーチディレクターの橋本から連絡を受けました。カジュアル面談で、RevCommのプロダクト開発の経緯や、私の専門分野や興味を活かして働くことができるという話を聞き、強く惹かれました。そのまま選考に進み、数ヶ月後に入社しました。

かなり奇跡的な出会いですね。他社との比較はしなかったのですか?

はい。奇跡的なマッチングだったので、他社との比較はしていません。衝動的な部分もあるかもしれませんが、結果的に入社して良かったと思っています。
RevCommについて調べていると、会社単位で、学会での対外発表や研究の成果をしっかりと報告していることに、とても驚きました。一般的に、ベンチャーやスタートアップでは、研究成果をここまでオープンにしません。RevCommが研究活動に対して、いい加減な会社ではないことがわかりました。

▼RCRが発表している研究論文
https://www.revcomm.co.jp/rcr/research/#research-paper

博士課程を辞めることも大きな決断だったと思いますが…

RevCommに出会った当時は、博士4年目だったので、休学して修了年限を延長するか、すっぱり諦めて別の形で自分の研究をするか、悩んでいた時期でした。コロナ禍で、動物園との共同プロジェクトに多少影響が出たり、大学でもゼミや研究活動が全てリモートになったり、研究スタイル自体も大きく変化したことがきっかけです。

そんな中、RevCommはフルリモート・フルフレックスで研究活動を行なっています。RevCommだったら「就業しても自分の研究が続けられる」と思えたので、大学を辞めて、入社しても良いと思えました。博士号を取得することよりも、自分としては「研究がしたい」という気持ちが一番強かったので…。

RCRの魅力や他社にない強みを教えてください。

RevCommはお客様のご協力のもと、たくさんのデータを社内に抱えています。そんな大量のデータを持っているのは、海外の企業ですと、GoogleやMetaなど大企業しかありません。人工知能の研究は、何事もデータがないことには始まりません。使えるデータを自社で大量に抱えているというのは、何よりも魅力です。

また、RevCommの場合、スタートアップでありながらリサーチ部門へのバックアップがしっかりとしています。入社当初は200名に満たない規模でしたが、RCRには合計10名ほどのメンバーが所属しており、全体に対して結構な人員を研究部門に割いていました。研究者としては、窓際で研究活動“っぽい”ことをするのではなく、ちゃんとしたバックアップのもと研究できるということは、とても魅力的です。

研究者にとって最適な条件が揃っているのですね。大学とRCRを比べると、研究活動にどのような違いがありますか?

一概には言えませんが、博士課程での研究活動は、自分の研究だけではなく、後輩の指導がかなり大きな比重としてあり、研究に関係のない雑務も時々発生します。研究に集中しにくい環境だったり、時間の使い方が上手くいかないこともありました。
その点、RCRでは自分の仕事に集中できる環境があります。メンバーそれぞれが、自分の専門性を発揮しながら議論を深め、お互いに助け合おうという精神が強い環境だと感じます。

RCRには、どんなメンバーがいるのですか?

皆、専門性が高く、様々なバックグラウンドをもったメンバーが揃っています。そのため、音声や人工知能に限らず、様々な分野に対応することができます。お互いに専門性や考えを補完できるチームで、研究面ですごく頼りにしています。

研究ができるというだけではなく、会話をしていて面白く、人間的にも信頼できるメンバーばかりです。新社会人として未熟な私に対しても、お互いの専門性を尊重しながら接してくれ、とてもありがたいです。

業務はどのように進めているのですか?

研究活動や業務内容をドキュメント化して共有し、相互レビューしながら進めることが多いです。その際に、とても深いレビューをもらったり、ミーティングを設定して研究について相談したり、積極的に議論を深めようと各々が活動しています。
最近は、Slackのハドルミーティング機能*を活用して、集まって話すことも多いです。業務で困っているポイントを持ち寄りながら、アドバイスしあったりしています。
お互いの仕事を関係ないものと切り離さず、一緒に仕事を共有しているという意識がすごく高いです。RCRのメンバーは、私を含め皆国内外に点々と住んでいますが、仕事をする上であまり孤独を感じませんね。

*Slackにあるワークスペースのメンバー同士が簡単に音声会話できる機能のこと

現在、札幌からフルリモートで勤務していますが、業務を進める上で工夫していることはありますか?

他のメンバーとコミュニケーションがとりやすい環境を、自ら作ることが大切だと思っています。困ったことがあったらすぐに聞いたり、オンラインもくもく会をしてみたり。
RevCommの場合、話したい人とすぐにミーティングを設定するカルチャーが根付いています。相談があれば、Googleカレンダーで30分ミーティングを入れて時間をとってもらう。そういったことが当たり前の環境です。

RCRが描いている未来について、教えてください。

実際に使っている方もいると思いますが、現在、ChatGPTなどで使われている大規模言語モデル(LLM)の発展がとにかく凄まじいですよね。GPT-4など最新のモデルですと、チャットbotとしての機能のみならず、今後は画像認識なども可能になるなど様々な情報が取り込めるようになり、ビジネス面での多様な活用に対応してきています。

RCRは元々、音声認識AIの開発から始まりましたが、今では私を始め、画像・動画認識や言語処理を専門に研究しているメンバーなど、各分野の専門家がリサーチ部門に揃っています。また、RCRのディベロップ部門やエンジニアチームにも実力・スキルを兼ね備えたメンバーが多数います。どんな最新技術にも専門的な知識や研究を以て対応し、すぐに活用できる形にアウトプットできるチーム編成なんです。

だからこそ、「コミュニケーションを再発明する」プロダクトをどんどん作っていくことができるはず…。ミッション実現に向けて、最新技術や我々独自の研究を続けていけたらと思っています。

RCRで今後取り組んでみたいことを教えてください。

営業シーンでの動画を処理していると、やはり人の表情やそれに伴う話し方の中に、相手の気持ちや本音が、ある程度現れてくると思っています。MiiTelにも音声感情認識という機能がありますが、今後は動画と音声の情報を合わせて、人の気持ちや考えていることを判断できるようなAIを作りたいです。その上で、ChatGPT-4や最新の技術モデルにキャッチアップし、自分の専門だけではなく、他のRCRメンバーの専門性と掛け合わせながら、発展させていきたいですね。

具体的には、動画から情報を抽出して、お客様に見やすい形で可視化できるようにしたいです。RCRは設立当初から音声認識の研究に非常に力を入れていますが、音声だけだとやはり限界があります。よりリッチに動画から情報を抽出し、それをLLMに入力しやすい形に整えて、自動的に更に高度な分析をできるように落とし込みたいです。そういったプロダクトを作ることができれば、代表の會田が話している「経営判断ができるAIを作りたい」という目標に、少し近づくのではないかなと思っています。何よりもまずは画像や動画から情報を抽出する過程を大切に、研究を続けていきたいですね。

RevCommの魅力は何ですか?

RCRに限らず、RevCommは職場として風通しが良いです。他部署のメンバーと協力して業務を行うこともありますが、入社時期や年齢に関係なく、お互いにリスペクトをもって、同じ目標に向かって仕事ができる環境だと思います。
また、個人の事情に対する支援・理解もあるところも魅力だと思います。リサーチ部門にも小さいお子さんがいるメンバーがいますが、家庭の事情で突然休むことがあっても、皆、本当に快く受け入れてくれます。仕事に対しても同じ目標ですし、自分の家族に対しても、会社が支援や理解を示してくれる。非常に安心して働ける職場というのが、何よりもRevCommの魅力であり、だからこそ生まれるイノベーションがあると思っています。

今後、どんな方にRevCommへ入社してほしいですか?

RCRで働いてると、様々な専門性・バックグラウンドを持っているメンバーがいて、日々話していると触発されて、すごくワクワクします。自分の殻に閉じこもるのではなく、多種多様な人と交わり、一緒にワクワクできる人と働けたら…と思います。また、私もそんな方たちとたくさんお話してみたいと思っていますので、是非RevCommへお気軽にご応募ください。

撮影 矢野拓実
記事 栗林杏子

採用広報担当より

今回は、RCRリサーチ部門の春日のインタビューをお届けしました。最後までご覧いただきありがとうございます。
RCRがいかに先進的な取り組みをしているか、また専門性が多様かつハイレベルなメンバーが揃っていることが、とても良く分かるお話でした。これからのRCRの研究活動が非常に楽しみです。
RevCommには、研究者やエンジニアなど専門性の高いメンバーが安心して活躍できる環境があります。ご興味のある方は、ぜひお気軽にご連絡ください!

Invitation from 株式会社RevComm
If this story triggered your interest, have a chat with the team?
株式会社RevComm's job postings
14 Likes
14 Likes

AI

Weekly ranking

Show other rankings
Like 採用担当's Story
Let 採用担当's company know you're interested in their content