データサイエンス100本ノックでSQLとPythonを勉強していきます。
S-025: レシート明細テーブル(receipt)に対し、顧客ID(customer_id)ごとに最も古い売上日(sales_ymd)を求め、10件表示せよ。
SQLだと以下のようになります。
%%sql select customer_id, min(sales_ymd) from receipt group by customer_id limit 10;
Pythonだと以下のようになります。
df_receipt.groupby('customer_id').agg({'sales_ymd':'min'}).head(10)