潘达斯：如何在一个范围之间找到值的索引？

Question

我有一个pandas数据框，在 "Num "列中有一系列的数字。

import pandas as pd

numbers = np.array([10,15,60,45,37,28])
df = pd.DataFrame(numbers, columns= ['Num'])

我想找到所有满足条件的索引值的组合，那么136.5就是70%。

numbers1+numbers2+... >= 70% of df['Num'].sum()

df['Num'].sum() = 195所以136. 5是70%。一些值的组合可能是：，所以136.5是70%。

10+15+60 
15+60 
60+45+37
10+15+60+45+37+28

以此类推我将把这些索引组合，最后，得到超过70%的组合，其中索引数最少。

Answer 1

你可以使用 itertools 这里。

import pandas as pd
import itertools
import numpy as np

numbers = np.array([10,15,60,45,37,28])
df = pd.DataFrame(numbers, columns= ['Num'])
total = int(df.sum())
list_n = list(df['Num'])
for L in range(0, len(list_n)+1):
    for subset in itertools.combinations(list_n, L):
        if sum(subset) > 0.7 * total:
            print(subset)

(60, 45, 37)
(10, 60, 45, 37)
(10, 60, 45, 28)
(15, 60, 45, 37)
(15, 60, 45, 28)
(15, 60, 37, 28)
(60, 45, 37, 28)
(10, 15, 60, 45, 37)
(10, 15, 60, 45, 28)
(10, 15, 60, 37, 28)
(10, 60, 45, 37, 28)
(15, 60, 45, 37, 28)
(10, 15, 60, 45, 37, 28)

当然，你可以完全跳过熊猫。

import itertools
import numpy as np

numbers = np.array([10,15,60,45,37,28])
total = sum(numbers)
for L in range(0, len(numbers)+1):
    for subset in itertools.combinations(numbers, L):
        if sum(subset) > 0.7 * total:
            print(subset)

(60, 45, 37)
(10, 60, 45, 37)
(10, 60, 45, 28)
(15, 60, 45, 37)
(15, 60, 45, 28)
(15, 60, 37, 28)
(60, 45, 37, 28)
(10, 15, 60, 45, 37)
(10, 15, 60, 45, 28)
(10, 15, 60, 37, 28)
(10, 60, 45, 37, 28)
(15, 60, 45, 37, 28)
(10, 15, 60, 45, 37, 28)

潘达斯：如何在一个范围之间找到值的索引？

问题描述投票：0回答：1

1个回答

最新问题

潘达斯：如何在一个范围之间找到值的索引？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1