是否有可能过滤数据,然后使用熊猫将一条语句分组?
我需要像这样实现查询:
SELECT ParsedPickupMonth, COUNT(*)
FROM df
WHERE trip_distance > 0 and trip_distance < 3
GROUP BY ParsedPickupMonth
我的想法:
import pandas as pd
import numpy as np
df = pd.read_csv("yellow_tripdata_2019-01.csv")
df['ParsedPickupMonth'][(df.trip_distance > 0) & (df.trip_distance < 3)].groupby(???).count()
这里是一种方法:
df[(df.trip_distance > 0) && (df.trip_distance < 3)].groupby('ParsedPickupMonth').count().max(axis=1).rename('count').reset_index()