有关统计预测的问题,尤其是编程任务。
[我正在研究一个时间序列分析项目,以预测股票价格,使用get_forecast()时遇到一个问题,而get_predictions()很好,并且模型适合...
[训练XGBoost分类模型时,我使用eli5函数“ explain_prediction()”来查看特征对单个预测的贡献。但是,eli5软件包似乎在...
假设我们有1,000个珠子,分别是900个红色和100个蓝色。当我通过SKlearn分类器集合运行问题时,score = clf.score(X_test,y_test)他们得出的分数约为.9,但是,...
使用SGDclassifier的predict_proba使用多类分类的多类分类置信度得分
我正在SGDClassifier中使用Logistic回归来执行〜10k类别的多类分类。为了获得预测结果的置信度分数,我正在使用predict_proba函数。但我得到...
我正在尝试为使用mlr软件包中的makeStackedLearner拟合的集成模型得出预测误差。这些是我要执行的步骤:> library(mlr)> library(matrixStats)> ...
我将通过RNN进行时间序列预测的简介,并将代码修改为其他数据集。随着数据的标准化,使用:uni_train_mean = uni_data [:...
我遇到一个问题,在尝试预测R中的单个结果时会得到数百个结果。有关如何解决此问题的任何建议都将非常有帮助。 logwage
我可以在python中使用哪种方法根据过去的数据确定值的可能性?
我有一个很大的“时间序列”数据集,看起来像这样:日期星期几自上次快乐外出的天数城外快乐1/1/20星期一0 1 ...
我正在作为一个项目进行糖尿病的预测和统计。对于统计数据,我正在寻找一个我可以调用的API来获取数据,该数据可用于统计每天的糖尿病增长情况,或...
我有两列的时间序列数据:日期和体积,例如在此处输入图像描述,我想预测第二天的体积,那么如何设置参数? P / S:我将预测范围设为1 ...
我正在研究一个项目,在项目中我必须预测第二天的销售额。我正在使用ARIMA模型,并通过熊猫read_sql_table函数从mysql加载数据。问题是我的日期已保存...
如果这里的人们可以看一下这段代码并尝试帮助评估这些预测间隔是否正确计算或需要更改什么,将不胜感激。我...
我想使用贝叶斯分类找到ali(öksürük= var,ateş= yok,halsizlik = var)的类值。下面的代码正在工作,但是我收到警告消息:1:naive_bayes():功能Öksürük-...
对于大的缺失,插补与对随机森林的可用子集进行训练相比有什么优势?
我想在缺失较大的数据集上训练随机森林模型。我知道“标准方法”,即我们在训练集中估算缺少的数据,对...
我想使用LSTM预测股票价格。我已经成功训练了模型并保存了模型。现在,我已经重新加载它了,我将如何使用model.predict()来预测不会出现的股价...
我使用hyper_grid%floor())head(hyper_grid)来调整MARS模型和`set.seed(...
我已经生成了3个月的数据(每一行对应于每一天),并且我想对其进行多元时间序列分析:可用的列是-日期...
scikit学习中的precise与predict_proba之间的差异
假设我已经创建了一个模型,并且我的目标变量是0、1或2。看来,如果我使用预测,答案可能是0、1或2。但是,如果我使用预测_proba,则会得到一个具有3个列的行...