データサイエンス100本ノックで勉強(23)

データサイエンス100本ノックでSQLPythonを勉強していきます。

github.com

S-025: レシート明細テーブル(receipt)に対し、顧客ID(customer_id)ごとに最も古い売上日(sales_ymd)を求め、10件表示せよ。

SQLだと以下のようになります。

%%sql
select customer_id, min(sales_ymd) from receipt
group by customer_id limit 10;

f:id:JunpeiNakasone:20220213055852p:plain

Pythonだと以下のようになります。

df_receipt.groupby('customer_id').agg({'sales_ymd':'min'}).head(10)

f:id:JunpeiNakasone:20220213060055p:plain