数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。
我有一个数据集,目标列中有多个值。我正在解决的问题是金融(贷款)欺诈检测问题,我试图识别潜在的违约者。 我没有...
我有一个更大的数据框,包含 22 元素向量作为行(比如 m 行),其中一些行是重复的。我想计算数据中每行有多少,同时保留原始数据
我有 4 列,Col1、Col2、Col3 和 Col4 我需要添加 2 个计算列,以获取每行中这 4 列的 4 个值的平均值和中位数。 那应该是DAX,不需要强力查询 C...
我想使用Looker studio的图表过滤器,但数据过滤后只有TRUE和False结果。 如何在图表过滤器上使用条件? 图表和表格不使用任何过滤器。 我预计该图表将...
我有以下数据框: 范围 价值 0NO2 46 00O3 56 有更多参数 c("00C6H6", "00CO", "00HR", "LAEQ", "00NO2", "...
如何克服Python中的KeyError:错误? [已关闭]
我有一个 CSV 文件,我想用 python 来分析它。我写了一段代码,问题似乎是 KeyError:Niveau。我的 CSV 文件中有一列名为 Niveau。现在如何处理错误以及...
我想使用plotly.express 绘制交互式条形图 state_count = df['state'].value_counts().head(10) state_names = df['state'].value_counts().head(10).index Bar_plot = px.bar(df,state_names,
对于数据分析,我在各个直方图中显示各个文件夹中的数据。为了更好地了解测量值的分散情况,我现在想显示所有...
我正在使用 t-SNE 进行探索性数据分析。我使用它而不是 PCA,因为 PCA 是线性的,而 t-SNE 是非线性的。 非常简单地知道需要多少个维度...
我可以使用哪些库在 Python 中进行时间序列数据的异常检测?
我正在处理的数据由两个变量组成: 日期-时间(以 15 分钟为间隔)和 要求 有了这些变量,我需要制定一个模型来训练数据来检测数据中的异常...
我目前正在使用 Python 开发一个数据可视化项目,我可以使用专家的一些指导。我正在尝试创建一个具有发散色彩图的线图,而我面临...
我正在研究 Google 的数据分析顶点案例研究。在给定的数据集中,我需要找到骑行开始时间和结束时间之间的差异。我总体上得到了正确的值...
我目前正计划将Excel中的销售报表(包括总金额、记录第一行的子类别等)转换为同一个Excel文件中的数据库表结构。
我在 R Studio 中使用 Lubridate,当我使用 group by(与 dplyr)按月份或工作日分组时,它会自动按字母顺序排序。我如何更改此日期订单? 这是...
数据框如下所示: 年 月 2021年 10 2021年 11 2021年 12 2022年 1 2022年 2 2022年 3 南 1 我必须通过检查相应月份的年份来填充年份列中的空值
我有一个名为 Brand_ID 的列,其中 ID 的范围应该是 0-6,但在我的 Brand_ID 列中记录了错误的 User_ID 数字。我一直找不到...
以块的形式处理 pandas DataFrame 或优化聚合功能的内存使用
我正在使用 Python 和 Pandas 编写 Jupyter 笔记本进行数据分析。 创建新的聚合功能时,由于系统的内存容量,我遇到了“MemoryError”。 之前...
我现在看到了几个项目,它们从典型无线路由器收集的无线电数据中获取新颖的空间信息: http://wisee.cs.washington.edu/ http://www.extremetech.com/extreme/
我在电源查询编辑器中有多个表,名为 CGTMSE_2020-21、CGTMSE_2021-22、CGTMSE_2022-23 等。所有表的表结构完全相同。 (附上一张样本表作为
我需要在条形图上显示每个考试日期注册的体重值,但 Y 轴与注册的值不成比例。 90公斤显示为小于85公斤。我错过了什么?谢谢...