建议我在一个函数中这样做,我已经提到了一个非常好的线程。
这是python函数,传递的参数取自用户
def recommend(uid):
ds = pd.read_csv("pred_matrix-full_ubcf.csv")
records = ds.loc[ds['uid'] == uid]
for recom in records:
print recom
数据格式:
uid iid rat
344 1189 5
344 1500 5
344 814 5
736 217 3.3242361285
736 405 3.3238380154
736 866 3.323500531
331 1680 2
331 1665 2
331 36 1.999918585
无法到达我出错的地方,我正在关注这个1线程但却无法得到它。
要迭代您的行,请使用df.iterrows()
:
In [53]: records = df[df['uid'] == query]
In [54]: for index, row in records.iterrows():
...: print(row['uid'], row['iid'], row['rat'])
...:
344.0 1189.0 5.0
344.0 1500.0 5.0
344.0 814.0 5.0
还有其他两种可能的方法来选择您的数据。你可以使用boolean indexing
:
In [4]: query = 344
In [7]: df[df['uid'] == query]
Out[7]:
uid iid rat
0 344 1189 5.0
1 344 1500 5.0
2 344 814 5.0
你也可以使用DataFrame.query
函数:
In [8]: df.query('uid == %d' %query)
Out[8]:
uid iid rat
0 344 1189 5.0
1 344 1500 5.0
2 344 814 5.0
您也可以立即在DataFrame对象上使用where()
方法。您可以将此方法的条件作为第一个参数提供。请参阅以下示例:
dataset.where(dataset['class']==0)
哪个会给出以下输出
f000001 f000002 f000003 ... f000102 f000103 class
0 0.000000 0.000000 0.000000 ... 0.000000 0.080000 0.0
1 0.000000 0.000000 0.000000 ... 0.000000 0.058824 0.0
2 0.000000 0.000000 0.000000 ... 0.000000 0.095238 0.0
3 0.029867 0.000000 0.012769 ... 0.000000 0.085106 0.0
4 0.000000 0.000000 0.000000 ... 0.000000 0.085106 0.0
5 0.000000 0.000000 0.000000 ... 0.000000 0.085106 0.0
6 0.000000 0.000000 0.000000 ... 0.000000 0.127660 0.0
7 0.000000 0.000000 0.000000 ... 0.000000 0.106383 0.0
8 0.000000 0.000000 0.000000 ... 0.000000 0.127660 0.0
9 0.000000 0.000000 0.000000 ... 0.000000 0.106383 0.0
10 0.000000 0.000000 0.000000 ... 0.000000 0.085106 0.0
11 0.021392 0.000000 0.000000 ... 0.000000 0.042553 0.0
12 -0.063880 -0.124403 -0.102466 ... 0.000000 0.042553 0.0
13 0.000000 0.000000 0.000000 ... 0.000000 0.021277 0.0
14 0.000000 0.000000 0.000000 ... 0.000000 0.000000 0.0
15 0.000000 0.000000 -0.060884 ... 0.000000 0.000000 0.0
[18323 rows x 104 columns]
(为了简洁起见,我摆脱了输出的其余部分)
使用此方法而不仅仅是引用的一个巨大优势是,您可以使用other
参数另外替换那些与条件不匹配的值,并使用inplace
参数对匹配条件的值执行某些操作。基本上,您可以根据需要重建数据帧的行。
此外,因为此函数返回的数据帧减去那些与条件不匹配的行,您可以重新引用特定的列,例如
dataset.where(dataset['class']==0)['f000001']
这将为您打印'f000001'
(第一个功能)列,其中类标签为0。