使用条件从数据框打印特定行

问题描述 投票:1回答:2

建议我在一个函数中这样做,我已经提到了一个非常好的线程。

这是python函数,传递的参数取自用户

def recommend(uid):
    ds = pd.read_csv("pred_matrix-full_ubcf.csv")
    records = ds.loc[ds['uid'] == uid]
    for recom in records:
        print recom

数据格式:

uid iid     rat
344 1189    5
344 1500    5
344 814     5
736 217     3.3242361285
736 405     3.3238380154
736 866     3.323500531
331 1680    2
331 1665    2
331 36      1.999918585

提到:this1this2

无法到达我出错的地方,我正在关注这个1线程但却无法得到它。

python pandas dataframe
2个回答
1
投票

要迭代您的行,请使用df.iterrows()

In [53]: records = df[df['uid'] == query]

In [54]: for index, row in records.iterrows():
    ...:     print(row['uid'], row['iid'], row['rat'])
    ...: 
344.0 1189.0 5.0
344.0 1500.0 5.0
344.0 814.0 5.0

还有其他两种可能的方法来选择您的数据。你可以使用boolean indexing

In [4]: query = 344

In [7]: df[df['uid'] == query]
Out[7]: 
   uid   iid  rat
0  344  1189  5.0
1  344  1500  5.0
2  344   814  5.0

你也可以使用DataFrame.query函数:

In [8]: df.query('uid == %d' %query)
Out[8]: 
   uid   iid  rat
0  344  1189  5.0
1  344  1500  5.0
2  344   814  5.0

0
投票

您也可以立即在DataFrame对象上使用where()方法。您可以将此方法的条件作为第一个参数提供。请参阅以下示例:

dataset.where(dataset['class']==0)

哪个会给出以下输出

        f000001   f000002   f000003  ...     f000102   f000103  class
0      0.000000  0.000000  0.000000  ...    0.000000  0.080000    0.0
1      0.000000  0.000000  0.000000  ...    0.000000  0.058824    0.0
2      0.000000  0.000000  0.000000  ...    0.000000  0.095238    0.0
3      0.029867  0.000000  0.012769  ...    0.000000  0.085106    0.0
4      0.000000  0.000000  0.000000  ...    0.000000  0.085106    0.0
5      0.000000  0.000000  0.000000  ...    0.000000  0.085106    0.0
6      0.000000  0.000000  0.000000  ...    0.000000  0.127660    0.0
7      0.000000  0.000000  0.000000  ...    0.000000  0.106383    0.0
8      0.000000  0.000000  0.000000  ...    0.000000  0.127660    0.0
9      0.000000  0.000000  0.000000  ...    0.000000  0.106383    0.0
10     0.000000  0.000000  0.000000  ...    0.000000  0.085106    0.0
11     0.021392  0.000000  0.000000  ...    0.000000  0.042553    0.0
12    -0.063880 -0.124403 -0.102466  ...    0.000000  0.042553    0.0
13     0.000000  0.000000  0.000000  ...    0.000000  0.021277    0.0
14     0.000000  0.000000  0.000000  ...    0.000000  0.000000    0.0
15     0.000000  0.000000 -0.060884  ...    0.000000  0.000000    0.0

[18323 rows x 104 columns]

(为了简洁起见,我摆脱了输出的其余部分)

使用此方法而不仅仅是引用的一个巨大优势是,您可以使用other参数另外替换那些与条件不匹配的值,并使用inplace参数对匹配条件的值执行某些操作。基本上,您可以根据需要重建数据帧的行。

此外,因为此函数返回的数据帧减去那些与条件不匹配的行,您可以重新引用特定的列,例如

dataset.where(dataset['class']==0)['f000001']

这将为您打印'f000001'(第一个功能)列,其中类标签为0。

© www.soinside.com 2019 - 2024. All rights reserved.