強化学習技術を社会実装するためにリサーチエンジニアを募集しています

株式会社サイバーエージェント

リサーチエンジニア

Mid-career

on 2024-09-02

690 views

12 requested to visit

強化学習技術を社会実装するためにリサーチエンジニアを募集しています

株式会社サイバーエージェント

Mid-career

Expanding business abroad

Mid-career

Expanding business abroad

Share this post via...

AI事業本部

北村駿

株式会社サイバーエージェントのAI事業本部で研究者、データサイエンティスト、MLエンジニアのスペシャリスト人材採用をしております。

北村駿

AI事業本部

株式会社サイバーエージェントのAI事業本部で研究者、データサイエンティスト、MLエンジニアのスペシャリスト人材採用をしております。

What we do

■ 研究組織「AI Lab」株式会社サイバーエージェントでは、インターネット広告、対話システム、ロボットサービス等のサービスの核となる人工知能技術研究を行うための組織「AI Lab（エーアイ・ラボ）」を保有しています。 AI Labは5領域13チームで構成され、幅広い分野を専門とする研究者が所属しています。また、高度なAI研究技術を持ち、実用化に積極的な大学・学術機関との産学連携を強化し、ビジネス課題の解決だけでなく学術的貢献を目指し研究開発に取り組んでいます。 ■強化学習チーム 13チームのうちの一つである、強化学習チームでは以下の研究開発に取り組んでいます。（一部抜粋） - 強化学習/バンディット問題に関する研究意思決定戦略を自動で最適化するアルゴリズムの研究開発 https://www.cyberagent.co.jp/news/detail/id=28705 - 言語モデルの強化学習教師データに対する尤度だけでなく、クリック率や広告効果などビジネスで関心のある指標を最大化でき、また教師データから外れた文章の生成にも頑健なアルゴリズムの研究開発 https://arxiv.org/abs/2206.01011 - 大規模言語モデルのファインチューニング「より優れた文章を生成するためにはどのように言語生成モデルを利用すれば良いか？」という問題について研究を行い、自社開発LLM CALM2をファインチューニングする研究開発　 https://huggingface.co/cyberagent/calm2-7b-chat-dpo-experimental その他にも様々なプロジェクトに取り組んでいます。 https://cyberagent.ai/ailab/research/reinforcement-learning/

What we do

Why we do

強化学習チームは、「強化学習の実応用」を目指し、理論的な研究から実世界の問題解決まで、幅広い取り組みを行っています。 https://www.cyberagent.co.jp/way/list/detail/id=27420 この取り組みは、論文発表だけにとどまらず、実用的な価値の創出をも目指しており、特に生成AI分野での強化学習に注力しています。この分野において、Large Language Models (LLM)や、Reinforcement Learning from Human Feedback (RLHF)の開発と実験を中心に行っています。

How we do

他専門領域研究者とのコラボレーション AI Labには幅広い領域の研究者が集まっています。また各領域の研究者が独立した研究をしているわけではありません。距離感も近いことから様々な領域を掛け合わせた研究をしていることが特徴です。強化学習チームの研究プロジェクトにおいても、経済学や、NLPを始めとした、領域横断的なプロジェクトが多くあります。幅広いアプローチで研究開発に取り組み、実問題の解決に取り組んでいます。

As a new team member

リサーチエンジニア（強化学習）は、リサーチサイエンティストと協力し、アルゴリズムの開発から実装に至るプロセス全体にわたって活躍し、プロジェクトのエンジニアリング面での重要な役割を担っていただくポジションです。具体的なタスク・スキルは以下を想定しています。 ■主なタスク - 言語モデルの性能向上のための強化学習・RLHF技術の研究開発 - アルゴリズムの実装、実験、および結果分析 - データ収集、前処理、データセットの構築 - デモやプロトタイプの作成 ■求めるスキル - 強化学習または言語生成AIに関する深い理解と実践的な経験 - Pythonを用いたプログラミング能力【あれば尚良】 - 言語生成モデルを用いた実験やアプリケーション開発の経験 - Huggingface Transformersライブラリの使用経験 -コンテナ技術（Dockerなど）を用いた開発経験 - 実証実験の設計および実施経験【求める人物像】 - 強化学習と言語生成AIの社会実装に情熱を持ち、その実用化に貢献したい方 - データ分析に基づいて、試行錯誤により問題解決ができる自走力を持つ方 - 他のメンバーと積極的に議論し、連携して継続的に実験や実装を改善できる方

0 recommendations