pdpcli
Pythonのデータフレームライブラリであるpandasを使ってCSVなどの表形式のデータを処理するためのライブラリを公開しました. YAMLやJsonnet形式の設定ファイルで処理のパイプラインを定義する仕組みを提供し,再現性の高い実験管理を実現します.
Discover companies you will love
クックパッド株式会社 / エンジニア
2021年にクックパッド株式会社に新卒で入社しエンジニアとして働き始めました. 自然言語処理や機械学習を専門にしています. 趣味ではPython, Go, Rustなどを使ってツールやWebアプリなどを作っています.
AWS SageMakerで機械学習モデルの学習とデプロイを行うためのPythonライブラリを公開しました.
CVDDと呼ばれるテキスト向け異常検知の手法をAllenNLPを用いて実装しました.
自然言語処理のためのニューラルネットフレームワークであるAllenNLPの拡張機能を開発しています. xallennlpはMLflowを使った実験管理の仕組みやOptunaを使ったハイパーパラメータ最適化のための仕組みを提供します.
Pythonのデータフレームライブラリであるpandasを使ってCSVなどの表形式のデータを処理するためのライブラリを公開しました. YAMLやJsonnet形式の設定ファイルで処理のパイプラインを定義する仕組みを提供し,再現性の高い実験管理を実現します.
QueueryというRedshiftにアクセスする仕組みを利用するためのPythonクライアントを公開しました.
研究開発部にて自然言語処理を用いた業務を行いました.
自然言語処理,特に学術論文からの情報抽出について研究を行いました. 言語処理学会第26回年次大会 (NLP2020) 「学術論文からのポリマー・溶媒の固有表現および溶解性の自動抽出」 言語処理学会第27回年次大会 (NLP2021)「ラベルの不均衡を考慮したEnd-to-End情報抽出モデルの学習」
機械学習を用いて,メールをその内容から要件ごとに分類するシステムの開発を行いました. また、この分類システムを応用し類似の問い合わせを検索するシステムの開発を行いました.
Pythonのデータフレームライブラリであるpandasを使ってCSVなどの表形式のデータを処理するためのライブラリを公開しました. YAMLやJsonnet形式の設定ファイルで処理のパイプラインを定義する仕組みを提供し,再現性の高い実験管理を実現します.