Python必須モジュール
pandasでは、DataFrameやSeries内の重複行を簡単に抽出、削除することができます。しかし、実際に重複処理をしようとしても、次のような問題に直面することも…。①そもそも重複行を抽出する方法は?②重複行を削除することはできるの?③特定の列が重複している…
pandasには、データの連結、結合を行うための便利な関数、メソッドがたくさん用意されています。しかし、実際にデータの結合を行おうとすると、次のような問題に直面することも…①結合関係の関数が多すぎてよくわからない!②concat, merge, joinってどれ使え…
pandasでは、インデックス列を階層構造にしてMultiindexとして扱うことができます。MultiindexのDataFrame, Seriesはデータの構造化には便利なのですが…。使い慣れたシングルインデックスと異なり、データ抽出で次のような次のような問題に直面することも…①M…
MultiindexのDataFrame, Seriesはデータの階層構造が視覚的にも把握しやすく、データの集計・分析が効率的に行えます。一方で、Multiindexでは次のような問題に直面することも…①普段使わないからMultiindexの中身がよくわからない②どうやっMultiindexを設定…
pandasのDataFrame, Seriesでは、.dropna()メソッドを使うと簡単に欠損値NaNを含む行・列を削除できます。しかし、実際に欠損値除去する際には次のような疑問を抱くことも…。①行を除去するか、列を除去するか指定したい!②行の要素が全部NaNのとき、or 一つ…
データ分析では、特定の行・列のデータを抽出することがよくあります。しかし、pandasは抽出方法が柔軟すぎて、逆に抽出方法がわからなくなってしまうことも…。この記事では、①行名・列名を指定してデータを抽出する方法、②特定の文字を含んでいる行・列を抽…
データを集計する際は、データ構造が縦持ちか横持ちかで処理のしやすさが大きく変わってきます。この記事では、データの縦持ち・横持ちについて、次のような内容を紹介してきます。① そもそも縦持ち・横持ちの違いやメリット・デメリットは? ② 具体的に縦持…
matplotlib.pyplotモジュールを使用してグラフを作成する方法をまとめています。 pyplotでは手軽に手早く簡単にグラフ作成することが可能です! グラフを作成、 グラフのスタイル変更、 タイトルや軸の設定など基本事項について徹底解説しています!
Matplotlibで一つの図の中に複数のグラフを並べるにはどうすればいいの?plt.subplot()でグラフを並べられるらしいけど、使い方がよくわからない!という方のために、「plt.subplot()の基本的な使い方」を画像付きで解説していきます! plt.subplot()でプロ…
pandasでは、リストからデータフレームを生成することもできます。しかし、pandasの操作に慣れていないうちは、ちょっとした操作も難しいですよね。この記事では、①リストからデータフレームを生成、行と列を追加する方法、②インデックス名、コラム名を設定…
Matplotlibでグラフを描くと、デフォルトで青→オレンジ→緑→…と色が変わっていきます。 この記事では、`Matplotlib`のデフォルトの色(カラーサイクル)の設定変更について紹介していきます。 ①データが10系列以上あるときに、また青に戻ってしまう場合の対応…
pandasのDataFrameは、.to_excel()メソッドを使用すると簡単にExcelの出力できます。 この記事では.to_excel()について、次の内容について解説していきます。 ① Excelの保存先・書き込み方法の設定、② 出力シート、セルの指定、③ 表の見出しの設定、④出力内…
pandasのDataFrame, Sereisでは、データやインデックスの内容をもとにデータの並べ替え(ソート)が行えます。この記事では.sort_values(), .sort_index()の使い方について、昇順降順変更、複数データでソート、指定の順番に変更など網羅的にわかりやすく図…
Matplotlibで散布図を作成する方法がよくわからない…。散布図って何のためにあるの?全部、plt.plotでグラフ作ればよくない? という方のために、「Matplotlibの散布図の作成方法、散布図を応用したデータの可視化例」についてまとめしました!
Matplotlibで棒グラフを作成する方法がよくわからない…。 棒グラフで悩むなら、MatplotlibあきらめてExcel使おうかな…。 と思ったことはありませんか?そんな方のために、Matplotlibの棒グラフ作成方法を徹底的に解説しました!複数系列?積み上げ棒グラフ?…
Pythonでグラフを描くときは、Matplotlibを使用しますね。 グラフの「この要素」を変更するには、「どのメソッド」を使えばいいのかわからない…。という方のために、Matplotlibの軸・目盛り・目盛り線の設定について総まとめしました!
matplotlibでの色の指定方法について紹介していきます。 ちょっとしたグラフ化の時に便利な一文字指定の方法から、グラフでグラデーションを表現したいときに便利なカラーマップの使い方まで、サンプルコード付きで解説していきます!
グラフ内にテキストでコメントを記入することってよくありますよね?グラフにコメントがあると、グラフの大事な部分を強調して説明できます。この記事では、matplotlibでグラフ内にテキストを表示する方法、テキストの見た目の変更方法について図解・サンプ…
pandasを使用すると欠損値NaNを効率的かつ高速に処理することができます。① NaNのある行や列を抽出する方法は?② NaNのある行や列を削除したい!③ NaNを他の値で置き換えたり、線形補間したりするにはどうするの?こんな悩みをサンプルコート付きでわかりや…
pandasのDataFrameを使うと、行と列で構成されたデータを簡単に取り扱うことができます。この記事では、「DataFrameの特定の行、列のデータを抽出する方法」、「インデックス参照[]、.loc[]、.iloc[]、at[]、iat[]の使い方」をわかりやすい図解付きで解説し…
pandasの.plot()メソッドを使用すると、簡単にDataFrameをグラフ化することができます。プロットするデータの指定方法、グラフの種類変更や軸の設定、Matplotlibとの連携について、サンプルコード付きで詳しく解説しています。この記事で、plotメソッドの使…
pandasの.groupby()を使うと、DataFrameの要素をもとにデータをグループ分けして、簡単に集計することができます。①そもそもどうやって.groupbyで、グループ分けするの?②グループ分け結果の確認方法は?③具体的にどうやってグループごとの集計するの?こん…
pandasの.rolling()を使うと、DataFrameやSeriesに対して、データ区間をずらしながら関数を適用することができます。 ①rollingで、データ区間のサイズや出力位置を調整するにはどうするの?②ユーザー定義関数などの任意の関数を適用するには?③日付データでr…
pandasで、DataFrameやSeriesのデータを月ごと週ごとなどで集計する方法を解説します。 集計期間はどうやって設定するの?合計や平均などの集計方法はどうやって設定する?自作関数の適用方法、列毎に違う集計をする方法はあるの?こんな悩みを図解・サンプ…
pandas DataFrame|最大値、最小値の取り扱いを図解でわかりやすく解説! ①max(), min()で最大値・最小値抽出。②idxmax, idxmin()で最大値・最小値の行名・列名取得。③nlargest, nsmmallestでn番目に大きい・小さい値を取得。
pandasのDataFrameでは、インデックス列の操作方法に関して、網羅的に解説!①インデックスの基本構造②インデックス内要素へのアクセス方法③インデックス内のデータ検索、並べ替え、重複処理、欠損値処理。サンプルコード付きでわかりやすく解説!
pandasのDataFrameでは、インデックス名でデータにアクセスします。しかし、DataFrameへのインデックス指定方法は少しわかりにくい部分も…。そこで、この記事では、パターン別に設定方法を解説!①DataFrame作成時にインデックス列指定、②既存DataFrameで指定…
pandasでは、辞書型からデータフレームを生成することもできます。しかし、pandasの操作に慣れていないうちは、ちょっとした操作も難しいですよね。この記事では、①辞書型からデータフレームを生成する方法、②辞書のキーをインデックス名、コラム名それぞれ…
pandasでは、リストからデータフレームを生成することもできます。しかし、pandasの操作に慣れていないうちは、ちょっとした操作も難しいですよね。この記事では、①リストからデータフレームを生成、行と列を追加する方法、②インデックス名、コラム名を設定…
脱初心者のためのMatplotlibマスターガイドです。そもそもどういう流れでプロットするのか?どんな種類のグラフが描けるのか?日本語設定は?タイトルや軸の設定は?オブジェクト指向って何?そんな疑問を解決します!この記事で、脱Matplotlib初心者を目指…