ミュラーPythonで実践するデータサイエンス 第2版 - 株式会社東京化学同人
課題設定からデータ収集・整形,機械学習による分析,可視化まで.コードを実行しながら一通り学べる入門書.最初のステップに最適. J.P.Mueller 著
https://www.tkd-pbl.com/book/b10032594.html
2020年から原著の翻訳に携わり,ようやく出版するまでにこぎつけることができて,非常に感慨深いものがありました.翻訳し始めた頃は,編集者の友達から「超入門」「サルでもわかる」ように本にしたい!と言われたけど,「いやいや,どう考えてもそのレベルじゃないなあ」と感じながら作業を進めていたことを今でも覚えています.さらに,想定するターゲットに合わせた翻訳がどんなに大変だったのか,貴重な経験もすることができました.アカデミックに長く在籍していたこともあり,直訳で専門用語の羅列で,どうしても頭でっかちの固い文章になってしまって,何度も手直ししていたことがとても懐かしく感じます.
想定するターゲットに合わせて翻訳するために,近くの書店に何度も足を運んだ記憶があります.それはなぜかというと,今まで読んできたデータサイエンスとちょっと質が違うなあと原著を読みながら感じていたからです.たとえば,第1章の概論・導入から,「データサイエンスパイプライン」という聞きなれない用語が出てきます.この用語は,海外ではよく使われているようですが,日本ではあまり使われていません.恐らく,日本と海外とで考え方がちょっと違っているからで,海外では,まず全体を概観したり,目的やゴールを設定してから,より具体的なものに落とし込むために分析手法について言及する傾向があるようです.一方,日本では,全体を概観したり,目的やゴールを設定する前に,いきなり具体的な分析手法から入る傾向があるようです.僕も,結構,手法から入ってプロジェクトを組み立ててしまう傾向があったので,「データサイエンスパイプライン」の概念(下図のデータサイエンスの流れ)に基づくプロジェクトの組み立ては目から鱗でした.
そんな翻訳中の体験談はさておき,データサイエンスの専門性の高さは残しつつも,高度な数学・高度なプログラミングスキルがなくても自学習できるものに仕上げています.なので,データサイエンス・AI開発プロジェクトに関わっているけど,技術的なことはよく分からずちょっとついていけないマネージャークラスの人が,データサイエンス・AI開発プロジェクトの一連の流れをさわり程度知っておくにはお勧めの書籍です!もちろん,データサイエンスを勉強し始めた人,データサイエンスに興味があるけどどこから手をつけていいか分からない人,そんな人にもお勧めです.
書店に立ち寄って,ざっと目を通して頂けるでも幸いです.先日,近所の書店に足を運んで陳列棚を眺めていたら,東大のデータサイエンスの横に並べて頂いてあったのを発見しました.訳者として少し嬉しい気分になりました!
https://www.tkd-pbl.com/book/b10032594.html