data-analysis 相关问题

数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。

如何在pandas DataFrame中转换或解码Unicode字符?

我正在使用pandas从excel文件中读取一些数据并进行了一些行遍历以生成一个python字典,然后将其放入json文件中。问题是我得到了Unicode字符......

回答 1 投票 1

使用histcountsmex而不是histcounts

我正在尝试优化我的MATLAB代码。我的代码需要在for循环中使用超过一百万个向量的histcounts函数。我想要做的是直接使用histcountsmex而不是histcounts。 ...

回答 1 投票 1

去除与Pandas中相邻点偏离太多的点

所以我在Pandas做一些时间序列分析,并且有一种特殊的异常值模式,我想删除它。波纹管图基于数据框,第一列为日期,并且......

回答 1 投票 2

TfIDf矢量化器重量

嗨我有一个lemmatized文本格式如引理所示。我想获得每个单词的TfIdf得分这是我写的函数:将numpy作为np导入pandas导入numpy作为来自sklearn的pd ....

回答 1 投票 1

如何将pdf数据提取到excel中?

我想将pdf数据转换为excel数据。我已经将pdf转换为文本文件并删除了.txt文件中不必要的文本,但它们现在已经存在行但我希望它们成为列式。 PDF ...

回答 1 投票 -1

具有季节性的Excel时间序列预测

我正在尝试使用虚构公司的营销费用的月度时间序列数据集来创建预测。数据看起来像这样:使用线性回归预测未来......

回答 1 投票 2

如何在Pandas布尔减少中获得列名结果为True

我有一个df,0 1 2 A -0.740485792 -0.299824912 0.169113705 1 1.120120949 -0.62580736 0.013757667 2 -0.685112999 0.439492717 -0 ....

回答 1 投票 2

将数据导入现有表,唯一条目

我需要对数据做一些汇总和统计,我正在考虑用Excel做这个,因为原始数据已经是Excel格式。基本上你可以说它是一种日志类型的数据......

回答 1 投票 0


将csv转换为txt(制表符分隔)并迭代目录python中的文件

我有〜1000个文件,带有一个两列数组,行数不同,扩展名为.csv。我需要读取文件的每一行,跳过第一个标题行,然后写下所有...

回答 2 投票 0

Python中re.findall的明显限制

我有一个包含数据(定义一些数学对象)的文件,格式不方便,我想用Python 3将它转换为JSON。因为文件很大(它包含921,497 ...

回答 1 投票 3

如果我想使用历史数据预测未来在线购物的购买量,我是否需要数据科学或数据分析或大数据?

我想学习预测未来事件,比如......能够使用过去二十年的飞机失事数据预测2018年飞机失事的数量......或者......预测有多少T恤衫与贾斯汀...

回答 2 投票 1

效用函数:R中的NA值验证

我正在尝试编写一个函数来验证数据帧的目标列的NA值。如果我在函数外运行代码它工作正常。并且返回TRUE,但不是在我尝试的时候......

回答 1 投票 -3

使用SciPy将数据插入到二次拟合中

我有一组数据,当绘制时,大多数点聚集在x轴的左侧:plt.plot(x,y,marker ='o')plt.title('Original')plt.show()ORIGINAL GRAPH I想用scipy来......

回答 1 投票 0

在python中使用的最佳数据结构,用于存储命名数据的三维立方体

我想对我选择的数据结构做一些反馈。我有一个特定电压值的2D X-Y电流值网格。我有几个电压步骤,并将数据组织成一个多维数据集......

回答 1 投票 2

如何在pandas中附加两个或多个数据帧并进行一些分析

我有3个df:df1 = pd.DataFrame({“Name”:[“one”,“two”,“three”],“value”:[4,5,6]})df2 = pd.DataFrame({ “名称”:[“四”,“一”,“三”],“值”:[8,6,2]})df3 = pd.DataFrame({“名称”:[“一”,“四” , “六个一”], “价值”:...

回答 1 投票 2

熊猫和移动平均线

我有数据:日期计数2015-09-01 5 2015-09-02 4 2015-09-03 8 2015-09-04 8 2015-09-05 3 2015-09-06 5 2015-09-07 9 2015- 09-08 7 2015-09-09 5 2015-09-10 7 ...我需要动起来......

回答 2 投票 1

SQLite中的聚合

我期待构建一个SQL查询,它能够按月汇总分期值。通常情况下,这并不会太难,因为您只需按月汇总分期付款值。 ...

回答 3 投票 3

不同匹配级别的spark加入

我有两个火花数据帧:df1 = sc.parallelize([['a','1','value1'],['b','1','value2'],['c','2', 'value3'],['d','4','value4'],['e','2','value5'],['f','4','...

回答 1 投票 0

预期字符串或字节类似对象错误

从nltk import word_tokenize,sent_tokenize text = data.loc [:,“text”] tokenizer = word_tokenize((text))print(tokenizer)我试图在...上的特定列上执行word tokenizer

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.