data-science 相关问题

数据科学涉及以任何形式或形式从数据中提取知识或见解。它可以包含预测分析,通常需要进行大量的数据争论。请考虑在https://datascience.stackexchange.com/上发帖


如何更好的清理数据?求朋友

我才刚开始,所以我尽量先构建能用的东西,然后再考虑如何改进代码。我一直在使用CoinGecko的API来转储价格等数据。我遇到的第一个问题是...

回答 1 投票 1

如何让这个SVM在python中运行得更快?

我正在寻找一种方法让这个SVM运行得更快。当我运行这个的时候,它会使用我电脑的所有CPU,而且需要很长的时间来运行。

回答 1 投票 0

ju如何在python中找到大于1或0的缺失值的%。

我正在寻找我的数据集的缺失值的百分比,超过0或1,因为我想以后推算它。我使用这个代码df,其中有数据df.isnull().mean()*100输出的 ...

回答 1 投票 0

从游戏商店获取用户评论

我刚刚开始从事数据科学项目,对于其中一个项目,我们需要从play store中获取用户评论。有什么方法可以在不使用开发者账号的情况下获取评论。

回答 1 投票 0

多次将一列的值替换为其他列的值。

我有一个pandas数据框,它看起来像这样:id new_id 0 00 11 1 11 22 2 22 3 3 89 100 4 101 102 我想用这个数据框来替换旧的id... ...

回答 1 投票 0

两个时间序列之间的差异窗口

我正试图寻找2个时间序列之间的3个差异区域。我能够看到2个时间序列之间的差异,但我想最终自动检测最大的差异和较小的差异。

回答 1 投票 1

无法在r中正确绘制data.frame。

我自己做不了,至少试了2个小时...。我有如下data.frame:> asyl_continents 2010 2011 2012 2013 2014 2015 2016 欧洲 1411 1352 2047 3277 ....

回答 1 投票 0

删除零方差的变量

谁能帮我写一下代码,用python删除数据框中方差为零的变量?

回答 1 投票 -1

对于这个通常的散点图,但不寻常的分布,哪个回归模型应该是最合适的?

我需要对下面的df(如属于两个不同家族的曲线)拟合两个不同的回归模型。因此,思考我所知道的回归类型,有 。线性 ...

回答 1 投票 0

在pandas中替换这个功能的更好方法?

我有一个数据框(df),由每天每小时的污染物读数(5)组成。最大的污染物值,无论是一个小时或一天的值将是一个参考,以获得空气质量指数,并将其添加为...。

回答 1 投票 1

将Python IDE连接到谷歌云

有没有一种方法可以让我在Python IDE(如Spyder)这样的环境下工作,同时利用计算引擎中GPU的强大功能? Google有数据实验室,但那是Jupyter Notebook的环境, ...

回答 1 投票 0

如何计算一棵树上的平均分支因子?

谁能给我解释一下,如果我们在计算b时排除叶子节点,平均分支系数的值是多少?举个例子。我不知道如何用正确的方法计算: 非常感谢

回答 1 投票 0

PACF和ACF图没有显示出任何意义。

我被困在建立ARMA(ARIMA(p,0,q)模型的过程中,因为在我的ACF和PACF图中没有任何意义。我看了几篇关于ARIMA的文章,但所有的文章至少都显示出显著 ...

回答 1 投票 0

==给出奇怪的结果 R [重复]

我在R中尝试下面的代码,希望两个条件语句给出相同的结果,但情况并非如此。请帮助理解这种行为。 > a [1] 23 34 45 43 > b [1] 45 34 > ...

回答 2 投票 0

使用rtweet的ts_plot()绘制推文时,时区无法使用。

rtweet github上有一个已关闭的问题,说你可以在ts_plot中使用tz https:/github.comropenscirtweetissues227 rt。

回答 1 投票 0

防止在单个单元格中滚动的python代码。

for feature in features_with_na: data = train.copy() # 做一个变量,如果观测值缺失则表示1,如果没有缺失则表示0 data[feature] = np.where(data[feature].isnull(), 1, 0) # ... ...

回答 1 投票 0

将列值四舍五入到最接近的10,然后显示满足条件的每组的百分比。

df = pd.DataFrame({'Credit Scores':[654 ,738, 863], 'Delinquent': [True, False, True]}) df.head() 初学者 使用pandas数据帧 所以我创建了一个数据帧,其中包括Credit ...

回答 1 投票 0

读取大的csv文件中带有洗牌行的大块文件,以便用ML进行分类。

我最近得到了这个数据集,它对我的内存来说太大,我必须用pd.read_csv('文件名.csv')来分块读取它。我必须使用 pd.read_csv('filename.csv', chunksize=1024) 分块读取,而数据集中的所有标签都是连续的,即所有 ...

回答 1 投票 0

在scikit中根据数据运行所有的回归器。

我正在努力创建一个框架,在这个框架中,我可以调用scikit-learn中可用的所有回归器。与此相关,我有两个问题--如何以编程方式获得所有回归器的列表?目的是...

回答 1 投票 1

summary.eRm confint:当使用summary(rasch.model)时,95%置信区间或97.5%。

我刚刚用包eRm在R中挖了一下,想知道confint是如何计算Rasch模型的置信区间的。使用getAnywhere(summary.eRm),我发现代码实际上......

回答 1 投票 0