我正在努力寻找一种有效的方法来检索优化问题的解决方案。该解决方案包含大约200K个变量,我想在pandas DataFrame中使用。在线搜索后,我发现访问变量的唯一方法是通过for循环看起来像这样:
instance = M.create_instance('input.dat') # reading in a datafile
results = opt.solve(instance, tee=True)
results.write()
instance.solutions.load_from(results)
for v in instance.component_objects(Var, active=True):
print ("Variable",v)
varobject = getattr(instance, str(v))
for index in varobject:
print (" ",index, varobject[index].value)
我知道我可以使用这个for循环将它们存储在数据帧中,但这是非常低效的。我发现了如何通过使用访问索引
import pandas as pd
index = pd.DataFrame(instance.component_objects(Var, active=True))
但我不知道如何获得解决方案
当然你可以使用instance.some_var.pprint()
在屏幕上打印它。但是如果你有一个由大集索引的变量。您也可以将其写入单独的文件。以下代码将结果写入.txt文件:
f = open('Result.txt', 'a')
instance.some_var.pprint(f)
f.close()
为了简化代码并在很大程度上避免for循环,我在pyomoio
中找到了urbs project模块,它接管了pandaspyomo.py稍微弃用的代码。它依赖于每个pyomo对象的iteritem()
方法,并优雅地处理多个维度。它可以将集合,参数和变量提取为pandas对象。
如果我设置了一个小型的pyomo模型
from pyomo.environ import *
import pyomoio as po
import pandas as pd
# Define a model with 200k values
m = ConcreteModel()
m.ix = RangeSet(200000)
def idem(model, i):
return i
m.a = Param(m.ix, rule=idem)
我只需一行代码即可读入参数
%%timeit
a_po = po.get_entity(m, 'a')
# 110 ms ± 1.88 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
但是,如果我将它与原始问题中的方法进行比较,它不会更快,甚至更慢一点:
%%timeit
val = []
ix = []
varobject = getattr(m, 'a')
for index in varobject:
ix.append(index)
val.append(varobject[index])
a = pd.Series(index=ix, data=val)
# 92.5 ms ± 1.57 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
实际上有一个非常简单和优雅的解决方案,使用pandas.DataFrame.from_dict
方法结合Var.extract_values()
方法。
from pyomo.environ import *
import pandas as pd
m = ConcreteModel()
m.N = RangeSet(5)
m.x = Var(m.N, rule=lambda _, el: el**2) # x = [1,4,9,16,25]
df = pd.DataFrame.from_dict(m.x.extract_values(), orient='index', columns=[str(m.x)])
print(df)
产量
x
1 1
2 4
3 9
4 16
5 25
请注意,对于Var
,我们可以使用get_values()
和extract_values()
,他们似乎也这样做。对于Param
,只有extract_values()
。
我遇到了与Jasper相同的问题并尝试了建议的解决方案。通过这样做,我注意到,编写结果的部分花费了大部分时间。也许在Jasper的案例中也是如此。
results.write()
instance.solutions.load_from(results)
所以如果你能这样做,我建议压制这两行。也许有人建议如何加快速度?或者另一种方法。
另外我在这篇文章中看到了(Pyomo:将结果保存为CSV文件)重新定义了“for循环”方法。一个pyomo开发人员声明:“我认为在索引中选项2是可能的,并且变量切片以不同的顺序迭代,这将使得到的数组无效。”