YutaKa Notebook | Enjoy Python!

Python の文法やモジュール、Python関連のAPIについて画像・ソースコード付きで徹底解説!

「Pythonによるデータ分析入門」徹底レビュー!!:機械学習のためのデータ前処理スキルを高める!

f:id:YutaKa:20191207230103p:plain

オライリージャパンの有名な本である「Pythonによるデータ分析入門」の前半部分を読んだ感想をまとめました。

この本を読んでできるようになったことも紹介しています。

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

  • 作者: Wes McKinney,瀬戸山雅人,小林儀匡,滝口開資
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2018/07/26
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る
 

はじめに

機械学習では多くの場合、人の手によるデータの前処理が必要になります。

実際に機械学習をする際には、機械学習全体を100とすると、データ前処理に80の労力をかける!・・なんてこともあるようです(;'∀')

ということは、実践的な意味で機械学習のスキルを習得するためには、データの前処理のスキルも必要になります

「Pythonによるデータ分析入門」は、データ前処理スキル向上のためにおススメしたい本です。

Pythonによるデータ分析入門はどんな本?

一言で言うと、pandasの参考書です。

padansは、pythonのための非常に強力なデータ分析ツールです。

そのため、pandasを使いこなすことで、データの前処理スキルが上昇すると言えます。

しかも、著者はpandasの開発者です!!細かなオプションまで詳細に解説してありました。

こんな人におススメ

★基本的なpythonの操作は理解している人
★機械学習やAIに手を出そうかな?と考えている人
★データの前処理にうんざりしている人

この本でデータ処理のスキルが身につけば、その後のわずらわしいデータ処理もすんなりとできるようになるはずです。

この本の第一章はpythonの基本ですが、初心者のためというよりは、経験者のための総復習といった感じです。

入門 Python 3

入門 Python 3

 

どんな内容が書いてある?

前半はpandas入門に向けた基礎事項

pandas入門に必要な基礎事項がかなり丁寧に解説されています。

今まで、私はpandasだけでなく、jupyter notebookもNumpyも使ったことがありませんでした。。。

しかし、この本の導入部分のおかげで、難なくpandasに入門することができました!!

1章から3章までは次のような内容がまとまっています。

★Pythonの基礎
★Numpyの基礎
★Jupyter Notebookの使い方
★pandasの基本的なデータ型

実践例:pandasを使ってみる 

★データフレームの作成
★欠損値の処理
★統計値の出力 

pandasでは、ひとつの表をデータフレームオブジェクトとして持てます。

例として、太郎君と次郎君のテストの点数をデータフレームにしてみます。

続いて、データフレームのメソッドで平均点も出してみましょう!

まずは辞書型とデータフレームの出力を比較してみてください!

データフレームは整形されていて、見やすくなっていますね。

次に、この例では、太郎君は社会の点数がありません。

しかし、pandasでは欠損値を自動で除外して計算できることがわかります。

pandasには、こういったデータ前処理に便利なメソッドが充実しているわけです!

この本では、pandasの重要なメソッドを体系的に学ぶことができます。

よくまとまっているので、読み終わった後には、pandasの辞書代わりにしようと思っています。

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

  • 作者:Wes McKinney
  • 出版社/メーカー: オライリージャパン
  • 発売日: 2018/07/26
  • メディア: 単行本(ソフトカバー)
 

まとめ

この本の前半を読んだ私の感想をまとめると…

★pandasを用いた、データ前処理スキルを身につけられる!
★勉強が終わった後には、pandasの辞書代わりになる!

まさに名前の通り、pythonによるデータ分析入門にぴったりの一冊でした!

後半、またレビューしたいと思います!!