PANDAS Python |在特定位置包含特定值

Question

我试图只选择“Cuenta”列中第三和第四个位置包含“05”的行，例如：51050300，51050600

阿诺	经期	昆达
2023	1	51050300
2023	2	51053900
2023	1	74359570
2023	2	74452500
2023	6	51050300
2023	7	51050600
2023	7	52351005
2023	7	52353505
2023	7	52159500

我正在使用这个代码：

pattern=r'..05*' 

df[df['Cuenta'].str.contains(pattern)]

但是它不起作用，我该怎么做？

Answer 1

或者像这样：

df[df['Cuenta'].astype(str).str[2:4] == '05']

输出：

    Año  Periodo    Cuenta
0  2023        1  51050300
1  2023        2  51053900
4  2023        6  51050300
5  2023        7  51050600

Answer 2

你必须改变你的模式：

pattern = '^..05'  # ^ means from the begin string

>>> df['Cuenta'].astype(str).str.contains(pattern)
0     True
1     True
2    False
3    False
4     True
5     True
6    False
7    False
8    False
Name: Cuenta, dtype: bool

Answer 3

为了好玩，假设一个整数列，算术解决方案是：

m = df['Cuenta'].floordiv(10**(np.ceil(np.log10(df['Cuenta'])-1)-3)).mod(100).eq(5)
out = df.loc[m]

或者，如果位数是固定的：

m = df['Cuenta']//10000%100 == 5

工作原理：

df.assign(n_digits=np.ceil(np.log10(df['Cuenta'])-1)+1,
          first_4=lambda d: d['Cuenta'].floordiv(10**(d['n_digits']-4)),
          digits_3_4=lambda d: d['first_4'].mod(100)
         )

    Año  Periodo    Cuenta  n_digits  first_4  digits_3_4
0  2023        1  51050300       8.0   5105.0         5.0
1  2023        2  51053900       8.0   5105.0         5.0
2  2023        1  74359570       8.0   7435.0        35.0
3  2023        2  74452500       8.0   7445.0        45.0
4  2023        6  51050300       8.0   5105.0         5.0
5  2023        7  51050600       8.0   5105.0         5.0
6  2023        7  52351005       8.0   5235.0        35.0
7  2023        7  52353505       8.0   5235.0        35.0
8  2023        7  52159500       8.0   5215.0        15.0
9  2024        8     12051       5.0   1205.0         5.0

PANDAS Python |在特定位置包含特定值

问题描述投票：0回答：3

3个回答

最新问题

PANDAS Python |在特定位置包含特定值

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3