株式会社レトリバ / YOSHINA事業部
株式会社レトリバ / YOSHINA事業部
株式会社レトリバ / YOSHINA事業部
現在、研究室ではシソーラスによる文書分類を最終目標としたキーワード抽出の研究をしています。 文書中に出現するキーワードの間の階層構造を捉えることで、 個々人が今欲しいと言語化できる情報にアクセスするのではなく、 物事を俯瞰して必要な情報を選択できることを目指しています。
未来
未来
- 個々人の偏見に抗える、知識を用いた、情報組織化 - 個々人の偏見を踏まえた、受容可能で俯瞰を可能にする情報推薦 - 技術がいかにして社会へと広がるかを理解すること
2022年4月 -
2019年4月 -
2019年4月 - 2022年3月
シソーラスによる文書分類を目的とした固有表現抽出
Co-teachingを用いた疑似データからのノイズ除去
既知の語句の出現文脈を用いて疑似データを作成し、その疑似データに基づくキーワード抽出を行う課題に取り組んだ。 Co-teachingと呼ばれるノイズ除去の手法を用いた。 まず文脈情報と語句内部の情報の二つに分けたキーワード検出器で互いに教え合うことでノイズを除去しようとした。しかし、文脈情報に基づくキーワード検出器の精度の低さがネックとなりうまく行かなかった。 次に生物科学ドメインと科学ドメインのそれぞれで学習された二つの事前学習モデルに基づきノイズ除去を試みた。このとき、精度の改善はみられたものの先行研究に匹敵するものとはならなかった。
2019年12月 - 2020年5月
2022年9月
2020年12月
2020年9月
2020年3月
2019年12月 - 2020年5月
アプリをインストールして、知り合いの最新の活躍をフォローしよう