YutaKaのPython教室

Python の文法やライブラリ、API、環境構築について画像・動画・ソースコード付きで徹底解説!

pandas

データ分析の必須モジュールpandasの解説記事一覧です。

pandas DataFrameをCSVに変換|to_csvをわかりやすく解説

この記事では、PandasのDataFrame, Seriesをto_csv()メソッドで簡単にCSV形式で出力する方法について、図解、表を使って詳しく解説しています。CSVは様々なソフトウェアで使いやすいフォーマットなので、CSVで出力できるのはとても便利です。しかし、CSV出力…

pandas DataFrameを文字列に変換|to_stringをわかりやすく解説

pandasでは、DataFrameやSeries内の重複行を簡単に抽出、削除することができます。しかし、実際に重複処理をしようとしても、次のような問題に直面することも…。①そもそも重複行を抽出する方法は?②重複行を削除することはできるの?③特定の列が重複している…

pandas 重複行の抽出と削除【図解で解決!】

pandasでは、DataFrameやSeries内の重複行を簡単に抽出、削除することができます。しかし、実際に重複処理をしようとしても、次のような問題に直面することも…。①そもそも重複行を抽出する方法は?②重複行を削除することはできるの?③特定の列が重複している…

図解で解決!pandasデータ結合総まとめ(concat, merge, join)

pandasには、データの連結、結合を行うための便利な関数、メソッドがたくさん用意されています。しかし、実際にデータの結合を行おうとすると、次のような問題に直面することも…①結合関係の関数が多すぎてよくわからない!②concat, merge, joinってどれ使え…

pandas Multiindexのデータ抽出まとめ|.locからxs()まで

pandasでは、インデックス列を階層構造にしてMultiindexとして扱うことができます。MultiindexのDataFrame, Seriesはデータの構造化には便利なのですが…。使い慣れたシングルインデックスと異なり、データ抽出で次のような次のような問題に直面することも…①M…

pandas Multiindex図解で解説|基本構造・変更・追加・解除・並べ替え

MultiindexのDataFrame, Seriesはデータの階層構造が視覚的にも把握しやすく、データの集計・分析が効率的に行えます。一方で、Multiindexでは次のような問題に直面することも…①普段使わないからMultiindexの中身がよくわからない②どうやっMultiindexを設定…

図解で解決!pandasの欠損値NaNをdropnaで除去する方法

pandasのDataFrame, Seriesでは、.dropna()メソッドを使うと簡単に欠損値NaNを含む行・列を削除できます。しかし、実際に欠損値除去する際には次のような疑問を抱くことも…。①行を除去するか、列を除去するか指定したい!②行の要素が全部NaNのとき、or 一つ…

pandas 行名・列名からデータ抽出|条件を満たすラベル指定

データ分析では、特定の行・列のデータを抽出することがよくあります。しかし、pandasは抽出方法が柔軟すぎて、逆に抽出方法がわからなくなってしまうことも…。この記事では、①行名・列名を指定してデータを抽出する方法、②特定の文字を含んでいる行・列を抽…

pandasで見るデータの縦持ち・横持ち|stack, unstack

データを集計する際は、データ構造が縦持ちか横持ちかで処理のしやすさが大きく変わってきます。この記事では、データの縦持ち・横持ちについて、次のような内容を紹介してきます。① そもそも縦持ち・横持ちの違いやメリット・デメリットは? ② 具体的に縦持…

Pandas DataFrameをExcelに出力|to_excelわかりやすい解説

pandasのDataFrameは、.to_excel()メソッドを使用すると簡単にExcelの出力できます。 この記事では.to_excel()について、次の内容について解説していきます。 ① Excelの保存先・書き込み方法の設定、② 出力シート、セルの指定、③ 表の見出しの設定、④出力内…

pandas 本当にわかりやすいソートの仕方|図解・サンプルあり!

pandasのDataFrame, Sereisでは、データやインデックスの内容をもとにデータの並べ替え(ソート)が行えます。この記事では.sort_values(), .sort_index()の使い方について、昇順降順変更、複数データでソート、指定の順番に変更など網羅的にわかりやすく図…

pandas 欠損値NaN処理一覧|抽出、除去、補間

pandasを使用すると欠損値NaNを効率的かつ高速に処理することができます。① NaNのある行や列を抽出する方法は?② NaNのある行や列を削除したい!③ NaNを他の値で置き換えたり、線形補間したりするにはどうするの?こんな悩みをサンプルコート付きでわかりや…

独学でデータ分析を勉強するオススメ学習本

独学でのpythonデータ分析勉強に役立ったおススメ書籍を紹介していきます。業務でそれなりにデータ分析を行えるまで、いろいろな試行錯誤をしてきましたが、もし自分が今ゼロから勉強する立場ならどうするのがいいのか考えてみました。以下では、入門書、個…

pandas DataFrameの行・列を抽出|loc, iloc, at, iatわかりやすく解説!

pandasのDataFrameを使うと、行と列で構成されたデータを簡単に取り扱うことができます。この記事では、「DataFrameの特定の行、列のデータを抽出する方法」、「インデックス参照[]、.loc[]、.iloc[]、at[]、iat[]の使い方」をわかりやすい図解付きで解説し…

pandas plotによるグラフ化|サンプルでわかりやすく解説

pandasの.plot()メソッドを使用すると、簡単にDataFrameをグラフ化することができます。プロットするデータの指定方法、グラフの種類変更や軸の設定、Matplotlibとの連携について、サンプルコード付きで詳しく解説しています。この記事で、plotメソッドの使…

pandas groupbyでグループ化|図解でわかりやすく解説

pandasの.groupby()を使うと、DataFrameの要素をもとにデータをグループ分けして、簡単に集計することができます。①そもそもどうやって.groupbyで、グループ分けするの?②グループ分け結果の確認方法は?③具体的にどうやってグループごとの集計するの?こん…

pandas 移動平均も楽々計算!|rollingをわかりやすく解説!

pandasの.rolling()を使うと、DataFrameやSeriesに対して、データ区間をずらしながら関数を適用することができます。 ①rollingで、データ区間のサイズや出力位置を調整するにはどうするの?②ユーザー定義関数などの任意の関数を適用するには?③日付データでr…

≫pandas 月ごと・週ごとの集計|resampleをわかりやすく解説!

pandasで、DataFrameやSeriesのデータを月ごと週ごとなどで集計する方法を解説します。 集計期間はどうやって設定するの?合計や平均などの集計方法はどうやって設定する?自作関数の適用方法、列毎に違う集計をする方法はあるの?こんな悩みを図解・サンプ…

pandas 最大値・最小値を抽出|図解でわかるmax min idxmax idxmin

pandas DataFrame|最大値、最小値の取り扱いを図解でわかりやすく解説! ①max(), min()で最大値・最小値抽出。②idxmax, idxmin()で最大値・最小値の行名・列名取得。③nlargest, nsmmallestでn番目に大きい・小さい値を取得。

pandas インデックス列の基本操作|要素にアクセス、検索、欠損値処理

pandasのDataFrameでは、インデックス列の操作方法に関して、網羅的に解説!①インデックスの基本構造②インデックス内要素へのアクセス方法③インデックス内のデータ検索、並べ替え、重複処理、欠損値処理。サンプルコード付きでわかりやすく解説!

pandas インデックス名の設定・変更|パターン別にわかりやすく解説

pandasのDataFrameでは、インデックス名でデータにアクセスします。しかし、DataFrameへのインデックス指定方法は少しわかりにくい部分も…。そこで、この記事では、パターン別に設定方法を解説!①DataFrame作成時にインデックス列指定、②既存DataFrameで指定…

pandas 辞書型からDataFrameを生成|インデックスとコラムの設定も!

pandasでは、辞書型からデータフレームを生成することもできます。しかし、pandasの操作に慣れていないうちは、ちょっとした操作も難しいですよね。この記事では、①辞書型からデータフレームを生成する方法、②辞書のキーをインデックス名、コラム名それぞれ…

pandas リストからDataFrameを生成|インデックスとコラムの設定も!

pandasでは、リストからデータフレームを生成することもできます。しかし、pandasの操作に慣れていないうちは、ちょっとした操作も難しいですよね。この記事では、①リストからデータフレームを生成、行と列を追加する方法、②インデックス名、コラム名を設定…

pandas | read_csv() 図解でわかりやすく解説!

pandasでcsvファイルを読み込むための関数read_csv()について、図解で徹底解説! ①区切り文字の指定 ②indexやlabelの行や列を指定する方法 ③読み込む行・列の指定 など細かい設定についての解説記事です!

pandas | read_excel() 図解でわかりやすく解説!

pandasで、excelファイルを読み込むための関数read_excel()について、図解で徹底解説! ①表のデータがセルA1から始まっていないときの対応方法 ②indexやlabelの行や列を指定する方法 ③読み込む行・列の指定 など、かゆいところに手が届く解説記事です!

【レビュー】「Python実践データ分析100本ノック」|100本終えたらpandasが好きになっていた

Python実践データ分析100本ノックで、実際に100本終了したレビューです。 pythonでのデータ分析の入門書としてかなりの良書だったと思います。 ・python2~3冊目に何を勉強しようか迷っている人 ・時間をかけずにデータ分析の基本を学びたい人 ・pandasへ…

pandas|head(), tail()でデータ先頭, 末尾を抽出!

pandasのDataFrameやSeriesで先頭や末尾の数行をさっと確認したい場合には、head()、tail()メソッドを使用します。引数で表示する行数を指定することもできますので、その使用方法を解説していきます。

【レビュー】「Pythonによるデータ分析入門」| pandas開発者によるpandasユーザーのためのpandasの教科書!

「Pythonによるデータ分析入門」を、最初から最後まで実際に実践してみたレビューです。 具体的にどのようなことができるようになったかを実例付きで紹介します! ・DataFrameの生成方法 ・欠損値の処理方法 ・グラフ化の方法 気になる学習時間は…?