実務レベルの英語ができるデータサイエンティストです。まだジュニアレベルですが、特に時系列予測の問題の強い知識と経験があります。元は物理学の研究者を目指してドイツに行きましたが、その後データサイエンスに興味を持ち、現地のスタートアップで働きました。
データサイエンスの力で人の助けになるような便利なサービスを生み出すプロジェクトに参加したい。いつでも参加したいと思ったプロジェクトに参加できるようになるには、まず優れたデータサイエンティストになる必要がある。そのために今は勉強を続け、経験を積みたいと思っています。
画期的な新サービスの収益化を目指す。アルゴリズムが鍵。
データサイエンティストとしてビジネスオペレーションの効率化のために働きました。Flinkはドイツ発のQ-commerceスタートアップで、そのサービスはデリバリースーパーマーケットと呼ぶことができます。Flinkのアプリで食材などを注文すると15分以内で電動自転車を使って指定の住所まで届けられます。
Flinkでは配達員がアプリの操作により配達完了時刻などを記録し、そのデータに基づいて平均配達所要時間などの評価を行います。ここから一人当たり時間あたりの配達数の目安が計算され(UTR: Rider Utilization Rate)、さらにこの指標がモデルによる注文数の予測から適切な配達員数を推定する際に用いられます。そのためこうした時刻データは非常に重要ですが、ハブによっては配達員達がマネージャーから目標の時間以内に配達するようプレッシャーをかけられて、実際に配達を終える前に完了のタイムスタンプを押してしまうことが頻発していました。これはUTRの過大評価につながり、配達員の不足を招きます。また逆に配達員が完了のタイムスタンプを押し忘れて配達所要時間が過大評価されていることもあります。このプロジェクトでは、こうした不審なデータをGPSによる配達員の各時刻の位置情報を使って発見し、Google Mapsの推定所要時間を使ったLinear Regressionによる推定によって置き換えました。これにより目標UTRが修正され、いくつかのハブのパフォーマンスが改善されました。
需要予測のモデルはAirflowを通して毎日自動で新しい予測を行います。このパイプラインは次第に多くのエラーを出すようになり、デバッグを行ううちに一から書き直す必要があると認識されるようになりました。このプロジェクトを担当した機械学習エンジニアについてサポートのような形での参加でしたが、パイプラインデザインについて多くを学ぶことができました。
インターンとして、言語AIを作るエンジニアをサポート。収集するデータのクオリティを向上させることが大きなチャレンジでした。
企業のデータを集めるため、年次報告書をpythonでスクレイプしました。実験的なプロジェクト。
最大の問題がデータのクオリティであり、まずはどのようなクオリティ上の問題があるか明らかにするためRedashを使ってダッシュボードを作成しました。
異文化への関心と英語をより磨きたい思いから、ドイツで修士課程に入学し、卒業しました。
量子エレクトロニクスの世界で主要な役割を果たす量子ポイントコンタクト(Quantum Point Contact)と呼ばれるデバイスがあります。量子測定器の中で最も単純な構造と原理で動作するこの測定器は、その単純さのため、測定される対象と合わせて一つの量子系とみなして量子マスター方程式を適用することができます。このアプローチで計算した結果、通常のマルコフ近似の範囲内では実験結果を再現できず、これはこの方程式の適用条件はそれまでに理解されていたよりも複雑であることがわかりました。
小学生から高校生までを担当し、主に国語、数学、英語を教えました。