書籍紹介: Pythonによるあたらしいデータ分析の教科書
プロローグ
PyHack というもくもく会に出入りしているご縁で以下の書籍のレビューに参加し、書籍を献本して頂いたので紹介します。こちらも前回 紹介した Pythonで理解する統計解析の基礎 (PYTHON×MATH SERIES) と同じく PyConJP 2018 の前にリリースされた本です。
Pythonによるあたらしいデータ分析の教科書 (AI&TECHNOLOGY)
- 作者: 寺田学,辻真吾,鈴木たかのり,福島真太朗
- 出版社/メーカー: 翔泳社
- 発売日: 2018/09/19
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
内容
第1章 データ分析とは
第2章 Pythonと環境
第3章 数学の基礎
第4章 ツールの基礎
第5章 応用:データ収集と加工
本書は「教科書」とありますが、実際、一般社団法人Pythonエンジニア育成推進協会がおこなうPython検定の教科書となることを目指して書かれています。
一般社団法人Pythonエンジニア育成推進協会 の 認定教材・参考教材のページ にもPython3エンジニア認定データ分析試験の主教材として本書が挙げられています。
本書の対象読者は「データ分析エンジニアを目指している方」、「Pythonをある程度理解しているエンジニア(=Python公式のチュートリアルを読み理解できるレベルにあること)」(iiiページ)です。
1章ではデータ分析を取り巻く状況についての解説からはじまり、データ分析とPythonについて、データサイエンティストとデータ分析エンジニアの違い、データ分析エンジニアが持つべき技術や知識について述べたうえで、機械学習の位置づけと流れ、データ分析に使う主要パッケージについて説明されています。
2章はPythonの実行環境構築について、Pythonの文法・基本構文について、Jupyter Notebookについての解説、3章は数学の基礎についての解説で、4章の分析の実践の前の準備と基礎知識の解説に充てられています。
4章は実際に手を動かして分析を実践する章です。本書のメインパートといってもよいと思います。NumPy, pandas, Matplotlib, scikit-learnを使った分析の流れについて詳述されています。
5章は実際のデータ分析に先立ち必要とされることも多い技術として、スクレイピング、自然言語処理、画像データ処理について実例を使いながら解説しています。
感想
本書は「データ分析の教科書」ですが、データ分析自体の教科書というよりは、データ分析エンジニアとして要求される技術を網羅的に書いた「データ分析エンジニアになるための教科書」という印象です。
本書において、データ分析エンジニアにとって機械学習の技術は「付加的に持つべき技術」(006ページ)であるとしていますが、続く007ページからは機械学習の位置づけと流れについて詳述されており、実際のところ、データ分析エンジニアにとって機械学習の知識は不可欠ということなのでしょう。
同じく、スクレイピング、自然言語処理、画像データ処理についてもページが多く割かれていることから、これらも基本技術として持っておく必要があるということなんですね。
データサイエンティストとデータ分析エンジニアの違いもわからなかった門外漢としては、データ分析エンジニアとはどのような職業か、どのようなスキルが要求されるのかについて、だいぶ理解が進んだように思います。
こんな方にオススメ
本書の対象読者は「データ分析エンジニアを目指している方」、「Pythonをある程度理解しているエンジニア(=Python公式のチュートリアルを読み理解できるレベルにあること)」(iiiページ)となっていますが、一読したところ、以下のような人には特に適していると思います。
Pythonの基礎知識があって、データ分析エンジニアになりたい方
Pythonの基礎知識があって、データ分析エンジニアという職業に興味がある方はまさに本書の対象読者だと思います。1章を読み、必要に応じて2-3章をチェックし、4-5章は写経する、という流れで学習すればデータ分析エンジニアとしての基本が身につくのではないかと思います。
ある程度プログラミングをしたことがある人
Pythonのインストール法、基本文法についても詳述されていることから(2章 Pythonと環境)、ある程度プログラミングをしたことがある人で、Pythonでデータ分析をしたい・Pythonを学んでデータ分析エンジニアになりたいという方には最初の1冊としてよいかと思います。
エピローグ
今回はじめてPython本の書籍のレビューをさせていただいたのですが、読みながら、どこまでコメントすべきか、悩むところがありました。
研究機関の研究職という仕事柄、論文の査読はかなりしているのですが、それとは違う難しさで、よい経験になりました。
個人的事情によりレビュー途中で失速し、全ての章を読むことができませんでしたが、機会があればまた書籍レビューに参加したいです。