我正在使用Python中的apriori算法进行数据分析。我将Apriori算法导入到代码页中,但是无法处理我的数据。关于公司的销售数据。但是,数据的排列方式是每行对应一个乘积。如您所见,我想更改此数据的顺序。标题为“ lieferungnumm”的“ Produktnumm是”不应与列标题匹配。每个“ LieferungNummer”包含一个以上的产品。我需要将这些产品与发票内容放在同一行的单元格中,对应于它们所属的“ LieferungNummer”部分。该值的一部分中包含的“ Lieferungnumm是”必须在同一行产品中。这样,代码将给出正确的输出。但是我做不到。我通过视觉分享数据的当前状态和情况。如何在Python中解决此问题?
将熊猫作为pd导入将numpy导入为np导入matplotlib.pyplot作为plt
从apyori导入先验
market_basket = pd.read_excel(“ C:/Users/Lenovo/Desktop/Python_Programlama/reading_data/ornekcalısma.xlsx”)market_basket.head()
market_basket.shape
yeni_veri = market_basket.pivot_table(index =“ LieferungNummer”,列=“ ProduktNummer”)yeni_veri
记录= []
for i在范围内(0,79778)records.append([[str(yeni_veri.values [i,j])for range in(0,7)])]
association_rules =先验(记录,min_supprt = 0.004,min_confidence = 0.25,min_lift = 3,min_length = 2)
association_results =列表(association_rules)
#在此编码中,我将关联结果输出为“ 0”