ビジネスに役立つPython入門

18. Pandasでデータ分析

Pandas ピボットテーブル(クロス集計)の作成(pivot_table)

2025年6月15日

ピボットテーブルは、データの集計や分析において、大変重要なツールになります。ピボットテーブルでは、縦軸と横軸、集計値を選択し、クロステーブルで集計結果をすることにより、様々な角度からデータを確認することができます。

上のピボットテーブルでは、縦軸に顧客、横軸に商品、集計値として売上を表示しています。このようにクロステーブルで結果を表示することによって、どの顧客のどの商品が売れているか、売れていないかを視覚的に確認することができます。

この記事では、Pandasにおけるピボットテーブルの作成方法について、確認していきましょう。

目次

ビボットテーブルの作成方法(pivot_tableの使い方)
事例) ピボットテーブルによるクロス集計
- 事前準備 - CSVファイルの読み込みと結合
- pivot_table()によるピボットテーブルの作成

動画教材紹介私(清水義孝)が作成したコース「Pythonによるビジネスに役立つWebスクレイピング」(Udemyへのリンク)が発売中！
発売数１０,０００万本突破を記念して、今だけ期間限定で８７%オフの大セール中！

ビボットテーブルの作成方法(pivot_tableの使い方)

PandasのDataFrameにおいて、ピボットテーブルの作成には、pivot_table()を使い、以下のように記述します。

DataFrame.pivot_table(values = "集計値", index = "行", columns = "列")

引数valuesには、集計する値が格納された項目を指定します。

また引数indexには行を、columnsには列に表示される項目を指定します。項目が複数ある場合は、listで指定します。

例えば、indexに指定する項目が１つの場合、index = "項目1" と指定し、２つ以上の場合、index = ["項目1", "項目2", …] というようにlistで指定します。

動画教材紹介私(清水義孝)が作成したコース「Pythonによるビジネスに役立つWebスクレイピング」(Udemyへのリンク)が発売中！
発売数１０,０００万本突破を記念して、今だけ期間限定で８７%オフの大セール中！

事例) ピボットテーブルによるクロス集計

事前準備 - CSVファイルの読み込みと結合

それでは実際にピボットテーブルを作成していきます。ここでは売上ヘッダ情報、売上明細情報を元にピボットテーブルを作成し、販売組織、顧客、製品毎の売上を分析する例をみていくことにしましょう。

まずは事前準備として、必要なデータをCSVファイルから読み込みます。最初に売上ヘッダ情報が格納されているCSVファイル「T_Sales_Header_pv.csv」をDataFrame df_sales_headerに読み込みます。（※CSVファイルは上のリンクから取得してください。）

1

2

3

4

import pandas as pd

df_sales_header=pd.read_csv("T_Sales_Header_pv.csv",

index_col=["Sales_No"])

df_sales_header

次に売上明細情報が格納されているCSVファイル「T_Sales_Item_pv.csv」をdf_sales_itemに読み込みます。（※CSVファイルは上のリンクから取得してください。）

1

2

3

df_sales_item=pd.read_csv("T_Sales_Item_pv.csv",

index_col=["Sales_No","Sales_Item_No"])

df_sales_item

そして作成した２つのDataFrameを左外部結合で結合しdf_salesに格納します。左外部結合の詳しい説明は、図解！Pandas DataFrameのmergeによる結合(JOIN)を参照ください。

1

2

3

df_sales=pd.merge(df_sales_item, df_sales_header,

how="left", on="Sales_No")

df_sales.head()

このようにして作成したdf_salesを確認すると、マスタの値がコードで示されており、このままピボットテーブルを作成しても、分析には苦労しそうです。

そこでマスタの値も読み込み、名称を表示するようにしましょう。Customer、Product、Sales Organizationの３つのマスタを順に読み込んでいきます。

まず最初にCSVファイル「M_Customer.csv」を読み込み、df_customerに格納します。（※CSVファイルは上のリンクから取得してください。）

1

2

3

4

df_customer=pd.read_csv("M_Customer.csv",

index_col=["Customer_ID"],

encoding="SHIFT-JIS")

df_customer.head()

次にCSVファイル「M_Product_pv.csv」を読み込み、df_productに格納します。（※CSVファイルは上のリンクから取得してください。）

1

2

3

4

df_product=pd.read_csv("M_Product_pv.csv",

index_col=["Product_ID"],

encoding="SHIFT-JIS")

df_product

最後にCSVファイル「M_SalesOrganization.csv」を読み込み、df_sales_orgに格納します。（※CSVファイルは上のリンクから取得してください。）

1

2

3

4

df_sales_org=pd.read_csv("M_SalesOrganization.csv",

index_col=["Sales_Org"],

encoding="SHIFT-JIS")

df_sales_org

df_salesに対して、これら読み込んだ３つのマスタを左外部結合します。

1

2

3

4

5

6

7

df_sales = pd.merge(df_sales, df_customer,

how="left", on="Customer_ID")

df_sales = pd.merge(df_sales, df_product,

how="left", on="Product_ID")

df_sales = pd.merge(df_sales, df_sales_org,

how="left", on="Sales_Org")

df_sales.head()

このようにして、df_salesに対してマスタも結合し、名称も表示されるようになりました。

以上で準備が終わり、いよいよピボットテーブルの作成に取り掛かります。

pivot_table()によるピボットテーブルの作成

それでは先ほど準備したDataFrame df_salesを元にピボットテーブルを作成していきます。

まずは顧客、製品毎の売上を見ていきましょう。集計値には”Amount”、行には"Customer_Name"、列には"Product_Name"を指定します。

1 2	df_sales.pivot_table(values="Amount", index="Customer_Name", columns="Product_Name")

このようにして作成されたピボットテーブルから、顧客、製品毎の売上が確認できます。

例えば、iPod shuffleは佐々木商店によく売れている、海山商事に販売している商品の中ではiPhone 6が売上が高いなどがわかります。

さらに分析軸を増やし、行に"Sales_Org"を追加してみましょう。引数indexにはlistで["Sales_Org_Name","Customer_Name"]を渡します。

1

2

3

df_sales.pivot_table(values="Amount",

index=["Sales_Org_Name","Customer_Name"],

columns="Product_Name")

上記のピボットテーブルでは、販売組織、顧客、製品毎の売上が確認できるようになりました。

このようにしてピボットテーブルでは、行や列に項目を増やしたり、集計値を変えてみたりして、様々な切り口からデータを分析することができます。

関連記事です。
Pandasの中心となるDataFrame（データフレーム）については、次の記事で詳しく解説しております。

Pandas DataFrameを徹底解説！(作成、行・列の追加と削除、indexなど)

https://ai-inter1.com/pandas-dataframe_basic

Pandas（パンダス）とは、データを効率的に扱うために開発されたPythonのライブラリの1つで、データの取り込みや加工・集計、分析処理に利用します。 Pandasには２つの主要なデータ構造があり、Series（シリーズ）が1次元のデータ、DataFrame（データフレーム）が2次元のデータに対応します。実務で利用するデータは２つの軸で表される2次元のデータが多いので、DataFrameを利用する機会は非常に多く、DataFrameを理解することは、データを効率的に扱う上でとても重要になります。この記事では、まずはDataFrameの基...

最後に...

Pythonの学習においては、実際に様々なプログラムを書いて試していくことが非常に重要です。Pythonについて、さらに詳しく学ばれたい方は、以下の私のUdemy講座をご検討いただければ幸いです。

Pythonを用いて世界中のWebサイトから自動的にデータ収集する方法を、基礎からていねいに学ぶことができます。Pythonを初めて学ばれた方も、最初に取り組みやすい内容になっています。

>> Pythonによるビジネスに役立つWebスクレイピング
発売数１０,０００本突破を記念して大セール中！期間限定になりますのでお早めに。

Pythonによるビジネスに役立つWebスクレイピング（BeautifulSoup、Selenium、Requests）講座の画面

既に１０,０００名以上の方に受講頂き、大変好評です。またコースに満足いただけない場合でも、３０日返金保証があるので安心です。

期間限定の割引クーポンは、こちらから！
>> Pythonによるビジネスに役立つWebスクレイピング

このページも人気です！！

まとめ記事

1: 図解！PythonでWEB スクレイピングを始めよう！(サンプルコード付きチュートリアル)

2: ビジネスに役立つPython3入門

3: Pandas DataFrameを徹底解説！(作成、行・列の追加と削除、indexなど)

4: Python Matplotlibのインストールから使い方を徹底解説！(plot、subplotなど)

5: Python NumPyのインストールから使い方を徹底解説！

-18. Pandasでデータ分析