data-analysis 相关问题

数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。

R的种群数据线性回归分析

我有一个家庭作业,我需要根据美国各地的人口数据获取一个CSV文件,并对内部数据进行一些数据分析。我需要找到存在的数据......

回答 1 投票 1

如何使用SOMPY库在SOM中标记数据?

我目前正在开发一个使用机器学习来确定网络流是僵尸网络还是良性流的项目。当然在这个过程中,我一直在使用不同的数据分析方法,......

回答 1 投票 0

理解热图的相关性

我试图找到功能之间的相关性。我正在使用kaggle数据集,作者说RM(.7),LSTAT( - 。74),PTRATIO( - .51)与MEDV有很强的相关性我的理解是......

回答 1 投票 -1

SQL - 我希望以30分钟的间隔获取查询中的时间戳

我有一个查询,如下面的SELECT DISTINCT table_1.id,table_1.time_utc table_1.city_uuid,cast(table_2.score_rate as decimal(5,3))as score_rate FROM integrated_delivery ....

回答 2 投票 0

将两个Pandas数据帧与ID值配对

我正在尝试整理一组有关冰川的可用数据。我们的原始数据来自ArcGIS数据集,纬度/经度值存储在一个单独的文件中,现在与...分离

回答 2 投票 0

Pandas - 查找列的重复值

我正在寻找两种不同的方法来在df中找到列的重复值。首先要查找基于不同列的条件的列中的值是否存在于不同的df中。如果在......

回答 2 投票 0

如何进行实时数据分析?

我曾与R合作进行数据分析以制作预测模型。现在我需要为实时数据分析构建解决方案。这可以从数据中找到模式并在某些情况发生时显示警报......

回答 1 投票 0

实时时间序列数据中的峰值信号检测Matlab R Golang Python Swift Groovy C ++ C ++ Rust Scala Kotlin Ruby Fortran Julia C#C Java

更新:迄今为止表现最佳的算法就是这个算法。该问题探讨了用于检测实时时间序列数据中的突然峰值的稳健算法。考虑以下数据集:p = [1 1 ...

回答 27 投票 170

Python:pandas合并多个数据帧

我有不同的数据框架,需要根据日期列将它们合并在一起。如果我只有两个数据帧,我可以使用df1.merge(df2,on ='date')来做三个数据帧,我使用df1 ....

回答 6 投票 26

识别数据模式的最佳方法是什么,以及了解该主题的最佳方法是什么?

我正在开发的一个开发人员正在开发一个程序来分析路面图像,以找到路面裂缝。对于他的程序找到的每个破解,它会在一个文件中生成一个条目,告诉我......

回答 12 投票 19

如何使用ML算法与单词包中的特征向量数据?

我正在制作一个程序,可以根据文本中的数据预测相应的业务单位。我已经设置了一个词汇表来查找文本中与某个单元相对应的单词出现但是...

回答 1 投票 1

基于特定行的值的条件创建多个分位数输出

我有一个df,其列有如下列:xx_id interval_start_time interval_end_time percentage_rate bd63 2019-04-01 20:00:00.000 ...

回答 1 投票 0

Pandas,groupby和计算其他列中的数据

我有四列数据,包括:Id,CreationDate,Score和ViewCount。 CreationDate有下一种格式,例如:2011-11-30 19:41:14.960。多年来我需要分组......

回答 1 投票 1

加入两个csv文件

我有两个csv文件,如下所示。它就像一个键值对数据。如果我把它读成熊猫数据框,它就像第一列一样显示为“多功能方向盘是”。但实际上......

回答 1 投票 -1

我如何删除从python中使用pypdf2提取的条形码中提取的整个非ascii字符串? mantion不是条形码下面的文字[重复]

我在python中使用pyPDF2包将pdf转换为文本,我想从这个文本中提取特定的单词,但是当我将句子传递给代码时会因为pypdf2包而导致错误...

回答 1 投票 -1

如何将时间戳小时分为白天和黑夜?

我想知道如何根据时间将数据框中的时间戳列分类为日夜列?我正在尝试这样做,但无法使用相同的新列完成...

回答 1 投票 0

从持续时间中查找平均值,但是从同一天查找日志

我有用户日志:df = pd.DataFrame({'users':[1,1,1,2],'dates':['2018-09-06','2018-09-06','2018 -09-10','2018-09-10'],'持续时间':[3,3,8,8]})给出:用户日期......

回答 1 投票 2

拆分字段并添加小数点以创建数值SQL

我在SQL Server 2014中有一个字段,我正在使用它看起来像这样:** RawField ** 20060202 20060323我想添加一个分割字段并添加一个小数点并创建一个数字字段。 ...

回答 3 投票 0

使用Python进行RBAC数据分析 - 任何想法/提示?

我正在开发一个项目,使用数百种具有不同权限和数千名用户的不同应用程序为RBAC创建配置文件。我正在寻找数据和组中的模式......

回答 1 投票 0

从数据框R中提取行

我有一个小问题。我设法从另外两个数据帧创建数据框,这很好,但我有太多行。示例:** PL | WPLF05652203 | Terytorium_nowe | F109 | 2017-05-14 | F106 | 2017-09-05 ** ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.