東京電機大学 / システムデザイン工学部情報システム工学科
16位/159 MUFG Data Science Champion Ship 2023
勾配ブースティング木を用いてクレジットカードの不正利用を検知するモデルを構築し、その精度を競いました。 ーーーーーーーー取り組み方ーーーーーー 私は趣味でデータ分析コンペティションに取り組んでいる。概要は与えられたデータを元にカードの不正利用を予測する機械学習モデルを作り、そのモデルの精度を競うものだ。私はそこでは結果に対して「なぜ?」、原因はどこにあるのかと考えながら取り組んだ。例えば、不正利用データの利用額はなぜか0~25ドル付近に多く分布していた。私は大きな金額をカードで払おうとしカードのセキュリティに止められたことがある。その知識から不正利用もセキュリティに引っかからないようにしている利用しているのか?と仮説を立てた。そのことを検証すべく利用額と取引不成立の関係を見てみると利用額が上がるにつれ不成立の件数が増えていることが分かった。そこから不成立の合計回数をモデルに与え精度を上げることができた。 このようになぜ?と考え、仮説、検証のプロセスで臨んだ結果16/159位で終えることができました。