data-analysis 相关问题

数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。

从数据集中提取和转换数据

我有一个数据集,格式如下:时间戳(dd-mm-yyyy)温度我需要从系列当前每个观察的时间戳信息中提取日期和月份...

回答 1 投票 -1

如何在python中打开csv?

我有以下格式的数据集。 row_num; locale; day_of_week; hour_of_day; agent_id; entry_page; path_id_set; traffic_type; session_durantion;点击“988681; L6;星期一; 17; 1; 2111;”“31672; 0”“; 6; 7037; ...

回答 2 投票 0

R String从数据框列生成

假设我在R中有一个带有两列的数据帧名称,数字样本数据集“PETER”,“15401”,“SAMMY”,“68475”现在每行我想要创建一个新列,其值为<第一位数...

回答 2 投票 0

从一列中删除值,该值等于另一列中的值

我目前有两个专栏:Word Sentence apple [this,fruit,is,an,apple] orange [orange,is,this,fruit] grape [this,is,grape] strawberry [strawberry,is,...

回答 2 投票 0

`as.Date()`将简短形式的年份(比如01/10/68)标识为“2068-10-01”而不是“1968-10-01”,如何修复它? [重复]

我有一个csv数据集,其出生日期存储为格式为01-06-68(“%d-%m-%y”)的字符。我尝试使用as.Date()将日期转换为Date对象,但它将年份标识为2068 ...

回答 1 投票 2

使用pandas group by按从最大到最小的顺序排序

尝试从公司的销售额的最大到最小排序,该公司还根据列表中的销售指数重新排列公司的名称。我不知道该尝试什么,因为我...

回答 2 投票 1

如何通过Pandas删除组中的列

尝试删除不再需要的一列数据。我试过使用.drop并没有做任何我能说的事情。 df = df.groupby(df ['Distributor'])['Tickets Sold']。sum()df1 = df [df ....

回答 2 投票 0

将数据库转储文件导入excel

我想知道是否有可能将(数据库)转储文件导入excel。最后,我将使用Python Jupyter Notebook分析数据。此外,它还可以导入Jupyter ...

回答 2 投票 -2

如何更新1000个随机样本的代码,大小为25到1000个样本,其中一个大小为25的随机样本

我现在的代码演示了为R中的分布Gamma(5,1)采集了大小为25的1000个随机样本。我的问题是更新此代码以表示采用1000个重采样(使用...

回答 1 投票 1

python中的散点图密度来自csv中的数据

我有一个非常庞大的18000名玩家数据集。每个玩家都有一个功能整体和完成例如,我想制作散点密度图,因为“正常”情节我不能在哪里更多和...

回答 1 投票 0

仅抓取来自多个不同网站的内容

目前我正在开展一个项目,我想分析他们网站上在线发布的不同博客,杂志等的不同文章。因此我已经构建了一个Webcrawler ......

回答 1 投票 0

使用PROC GLIMMIX分析重复测量数据

我正在使用PROC GLIMMIX来分析有关特定性事件的重复测量数据。原始数据来自每周约400人的日记研究。在每周他们报道...

回答 1 投票 0

替换Pandas中的列值

我在数据集中有一个“高度”列,如下所示。高度0 6-2 1 6-6 2 6-5 3 6-5 4 6-10 5 6-9 6 6-8 7 7-0它的类型是dtype:object现在我想......

回答 2 投票 2

使用pandas包在python中组合来自多个excel文件的数据

我正在尝试将具有不同日期的excel数据文件组合到一个文件中,以便我可以使用pandas包进行分析。我有困难,因为文件按日期命名并有多张表...

回答 2 投票 2

如何在数据帧中创建一个新列,这将是另一个列的函数,条件比for循环更快?

我有一个相对较大的数据框(8737行和16列所有变量类型,字符串,整数,布尔等),我想基于方程和一些条件创建一个新列。 ...

回答 2 投票 1

回归问题:如何解决高十进制输入特征的问题[关闭]

我有以下输入数据结构:X1 | X2 | X3 | ...... |输出(标签)118.12341 | 118.12300 | 118.12001 | ...... | [值介于0和1之间],例如0.423645我在哪儿...

回答 1 投票 -3

生成一个for循环,它将创建绘图并为它们提供正确的标题

问题出在for循环中。似乎它没有为使用AAstat函数生成的每个绘图选取标题。 prot_seq

回答 1 投票 0

插值以减小步长Matlab

我在matlab中有数据数组,如下所示:1,2,3; 2,4,6; ...在Matlab中是否有一个随时可用的算法,可以插入数据并给我这样的东西(例如线性)1,2,3; 1 ....

回答 1 投票 -1

我尝试了很多代码在R中将多个数据帧合并在一起,但总是会出错

更新:我知道问题,我不应该将变量名称命名为'2013'我有一些数据框,我想将它们合并在一起,但总是会出错。我想通过变量合并它们('Date'...

回答 1 投票 -1

计算满足DataFrame中多个条件的值的百分比

我有一个DataFrame,其中包含自1985年以来每一个March Madness游戏的信息。现在我试图通过一轮来计算更高种子的胜利百分比。主DataFrame看起来像这样:...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.