こんにちは、採用広報の新崎です。ちゅらデータでは、進化が著しいLLM(大規模言語モデル)や生成AI技術を活用したプロジェクトも増えてきています。その流れを受けて、ちゅらデータでは、2024年6月より新たに「機械学習エンジニア」職の求人を公開しました。
これまでにも機械学習エンジニアリングの技術を要する場面は多数あり、これまではデータサイエンティスト、データエンジニア、システムエンジニアといった、機械学習エンジニアと重なるスキル領域を持つ各職種の技術者の中から、課題に合ったスキルを有するメンバーがその役割を担っていました。
今回は、ちゅらデータで機械学習エンジニアリングに携われた皆様にお話を伺い、ちゅらデータの機械学習エンジニア像を掘り下げていきます。
機械学習エンジニアは具体的にどんなお仕事をする役割なんでしょうか? awashima: 最近では LLM(大規模言語モデル) を活用したプロジェクトが増えています。 例えば、規模の大きな企業になってくると、社内向けアンケートの回答数だけでも膨大な情報量になり、それを分類してなにか知見を得ようにもかなりの時間を要してしまいます。そこで、アンケート回答文の文脈からカテゴリを分類し、タグ付けまでを自動で行うシステムを開発することで、 省力化 によってお客様が本来の目的に集中することができます。 また、Chatbotなどの AIアシスタントにより生産性向上を目指す システムも需要が高いです。社内に蓄積されたドキュメント等の情報資産をナレッジとして社員に活用していただくような用途で、インタラクティブなAIアシスタントが重宝されます。そのようなプロジェクトには、 RAG(Retrieval Augmented Generation) の技術が用いられます。
nakaken : わかりやすい例を挙げますと、Web広告を出稿する際、その裏側の広告配信システムでは入札によるオークションが行われています。これまで、入札に必要なユーザー属性のトラッキングには、サードパーティクッキーが使われてきました。しかしこれが将来廃止されていきそうなので、機械学習を使ってユーザー属性に相当する情報を導き出して、入札の判定を行えないかどうか調査しています。 入札の判定を行うためのアルゴリズム部分はデータサイエンティストが担いますが、オークションは ミリ秒単位というわずかな時間の中で膨大なリクエストを処理 しなければならないため、 パフォーマンスを上げるためのチューニング が必要です。その部分に特化した業務を機械学習エンジニアが担うことで、本番環境に耐えうるシステムにすることができます。
データサイエンティスト1に対して機械学習エンジニア1 という、機械学習プロジェクトの最小構成をイメージしたしたときに、最もわかりやすい例かと思います。
kura : 推論の仕組みは作って終わりではなく、 精度が落ちていないか定期的に検証 を行い品質を一定に保つ必要があります。そのため、ちゅらデータが扱う多くの機械学習プロジェクトでは、 開発〜分析〜運用を効率化 するための概念、いわゆる「 MLOps 」が求められることがあります。
なるほど。 具体的な例を見ると、機械学習エンジニアが、データサイエンティストやデータエンジニアといった職種と技術領域が重なる部分が多いというのも頷けます。 ところで皆さんが感じる機械学習エンジニアリングの「やりがい」ってどんなところにありますか?
yamachaaan : これは機械学習エンジニアリングというか、AI技術全般に言えることかもしれませんが、「 今までできなかったことができる 」に立ち会えるのが最大の魅力じゃないでしょうか。そういった進化の只中にある先端技術を提案に組み込み、お客様に貢献できるのがいちばんのやりがいじゃないかと思います。
nakaken : 新規性 という意味では、ちゅらデータという会社自体が、新しい課題に我先にと挑戦していく企業なので(笑)ゼロイチというか、 PoC(概念実証)フェーズから携われるプロジェクトに参画できるチャンスが多い んじゃないでしょうか。「俺が考える最強のMLOps」をやれちゃいますね(笑)
kura: nakakenさんが仰るように新規性も特徴的ですけど、ちゅらデータは取り扱う業界の幅が広いことでも有名でして(笑)。一定の得意分野にだけに留まっているような会社じゃありませんので、不確実性の高い課題に出くわすこともままあります。そんな中でもよりその傾向が顕著なプロジェクトを担当する機会が多いポジションなのかなと(笑)。正直大変だとは思いますが、それだけに課題を乗り越えた時の達成感は他では味わえないものがあるんじゃないでしょうか。
ここまでの話を踏まえて、ちゅらデータで求められている機械学習エンジニアとして、どんな人が向いていそうでしょうか?
kura: まずは データサイエンティストの能力を最大限に引き出せる人 じゃないですかね。 弊社には優秀なデータサイエンティストがたくさんいますから、彼らの能力との掛け算ができれば素晴らしいのかなと。 あと欲を言わせていただくと、システムを作るだけじゃなくてオペレーション・ MLOpsの構築経験 があればすごくアドバンテージになると思います。継続的にモデルを作り直せるようになりますと、システムの精度を維持して運用し続けることができるため、お客様も含めて皆が幸せになれます。
nakaken : ちゅらデータの機械学習エンジニアの役割って、一般的な定義と比べて広いのかもしれません。 機械学習における最低限の知見があったうえで、よりデータエンジニアリングの領域だったり、データサイエンティストの領域にはみ出している人が輝けるイメージがあります。 あと、他のシステム開発に比べれば コストを意識 する場面が多いことも特徴の一つかなと思います。同じアルゴリズムを使う場合でも、別のフレームワークで運用することでコスト改善が図れたりしますので、そういった部分に敏感な方は向いているのかもしれません。
進化が著しく日々キャッチアップが必要な領域ですが、皆さんがこの先注目している技術などあればお伺いしたいです。
kura: 私が気になっているのは画像や動画の生成技術で、今年Open AIが発表した「 Sora 」には注目しています。今までの常識やプロセスが一気にガラリと変わってしまうという意味でも目が離せない技術です。
nakaken : 私としては、Googleの「 Vertex AI 」ですね。機械学習の開発、運用に役立つ様々なツールがオールインワンで扱える使い勝手の良さは既に多くの方が体験されていると思いますが、日々進化を続けていてどんどん便利になってきていますよね。この先どこまで使い勝手が良くなっていくのか注目しています。
awashima : 個人的には、LLMの評価ツールに興味があります。やはり定量的に評価することが難しい領域なので、そういったものに対してしっかり評価していかなければ、案件での説明責任を果たせないという危機感があります。
yamachaaan : やはりLLM (大規模言語モデル)や生成AI 領域ですね。特に、冒頭でAIアシスタントの話がありましたが、検索やナレッジ管理のあり方が大きく変わっていく領域だと認識しています。クライアントから要求されるリアルなユースケースを実装しながら様々に役立つ機能を構築していきたいと思います。
皆様ありがとうございました。
最後に ちゅらデータで活躍するメンバーは皆、主体的で能動的な人ばかり。そのうえで、失敗を恐れず未知なる世界に果敢に挑戦できる「ファーストペンギン」マインドを持っている人にとって、とても魅力的な環境だと思います。
今回皆さんのお話を伺って、機械学習エンジニアは「最もちゅらデータっぽい」人という印象を受けました。記事を読まれて少しでもご興味のある方がいらっしゃいましたら、まずはカジュアル面談からでもお申し込みいただけると幸いです。
この記事は、AI文章校正ツール「ちゅらいと」で校正されています。