在我们的案例中,我们不仅使用惩罚,还使用奖励。我们必须使用奖励,因为我们找不到将非奖励转化为惩罚的方法。我们希望有一个基于最佳成绩的终止策略。如果我们只有惩罚,那么只需在静态的应用程序属性中设置
optaplanner.solver.termination.best-score-limit=0hard/0medium/0soft
就很容易了。但是,如果我们有奖励,并且在启动服务时最大奖励是未知的,并且由每个请求确定,这意味着每个请求都不同。有没有办法为每个请求设置终止策略?
谢谢!
在 OptaPlanner 中,没有。在 Timefold Solver 中,请参阅 SolverConfigOverride。