data-analysis 相关问题

数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。

为什么Plotly条形图不成比例?

我需要在条形图上显示每个考试日期注册的体重值,但 Y 轴与注册的值不成比例。 90公斤显示为小于85公斤。我错过了什么?谢谢...

回答 1 投票 0

根据距最近像素的距离,将连续值的贡献放入离散的 2D 网格中

我有一个包含点坐标的numpy数组(在3D中,但我首先尝试了1D和2D中的方法),我想将其放入离散网格中。然而我不想

回答 1 投票 0

收到“错误:必须从色调调色板中请求至少一种颜色。”从尝试运行 ggplot()

出现一些错误导致我无法绘制 PCA 图?这是我在终端上运行这组代码时的输出。 > #pdf(文件=“pca.mouse.control.pdf”) > #我们执行 PCA...

回答 1 投票 0

按天分割数据并创建折线图以显示一天内随时间的变化,同时将每个 id 相互分层

我有一个名为 hourly_steps_merged 的数据集,Id 列中有许多唯一的 ID。我想按日期和 ID 对数据进行分组,因为我有一个月的数据。我想将唯一 ID 分层...

回答 1 投票 0

如何查找包含世界各地赠款列表的数据库

我的任务是创建拨款接受者的实时可视化,旨在提供透明度和见解。然而,由于缺乏可访问的途径,我面临着重大挑战,

回答 2 投票 0

最近Spectre和FlowSOM功能有不兼容的情况吗?

我正在尝试运行函数 prep.cytonorm 但收到错误 Error in if (sampleWithReplacement & (nrow(f) < cFile)) { : argument is of length zero After tracking the codes, I f...

回答 1 投票 0

Pandas 数据框:前向填充多行

输入 = pd.DataFrame({ '时间戳':[ pd.Timestamp('19/01/2022 10:00:00'), pd.Timestamp('19/01/2022 10:00:00'), pd.Timestamp('19/01/2022 15:00:00'), pd.Timest...

回答 1 投票 0

如何使用重叠的数据对来构建更大的模型?

我有成对的数据 - 例如,给定主题 A、B、C、D、E...我可能有 AB、AC、BD 和 DE 对的数据。所有数据都是相对于该对中的另一个成员的,没有绝对的d...

回答 1 投票 0

如何查看客户购买动态

我想监控客户的购买行为。每个客户可以购买一种或多种产品,每种产品有不同的价格范围。如何判断客户是否购买

回答 1 投票 0

需要帮助从 Kaggle 中的 arxiv 数据集下载 PDF

我正在寻求帮助,将 arxiv 数据集(可在 Kaggle 上找到)中的 PDF 下载到我的本地文件系统上。理想情况下,我正在寻找一个允许用户输入主题的代码......

回答 1 投票 0

我陷入了如何将一个函数的返回输出使用到另一个函数中

我想在另一个函数中使用一个函数的结果进行比较并打印出余额。但代码重复了两次并且没有给我所需的结果 以下是...的一部分...

回答 1 投票 0

如何进行“匹配”函数从右到左分析?

我正在分析距离客户上次购买已有多少个月了。行是客户,月份是列。我有我需要的确切公式;唯一的问题是它不从 ri 进行分析...

回答 1 投票 0

如何关联Excel上的两列

在我的 Excel 工作表的第一列中,我有 150 个参加活动的人员的 ID。由于我还有 5 列 ID(一些不同维度),是否可以查看某个 ID 是否是预...

回答 1 投票 0

Python Pandas Figsize 未定义

我是 pandas 的数据分析新手,我刚刚安装了具有所需依赖项的 pandas(NumPy、python-dateutil、pytz、numexpr、bottleneck 和 matplotlib)。但当我开始尝试最...

回答 5 投票 0

提取学号

我有包含许多列的Excel数据,一列名为Description的数据包含以下数据,我想使用KNIME从每一行中提取学生编号 下面的示例是三个不同的行

回答 1 投票 0

有两个长度不同的字典列想要使用系列爆炸,但它不匹配

我的数据框中有两列,其中有多个词典,我想将其扩展为多个列,但是当我使用爆炸系列时出现问题,它不匹配 例子: A栏 科鲁...

回答 1 投票 0

如何清理包含大量重复值的庞大数据集列

我正在做一个关于数据分析的小型项目,在数据清理过程中,我观察到列中的唯一值相当混乱。我不确定如何清理这个col...

回答 1 投票 0

如何根据多个条件选择值:如果满足一个范围的求和,则对另一个范围求和

我有一个表格,其中包含以下列:国家、年份、值、 我需要找到 2015 年至 2018 年期间价值总和为 0 且 2019 年至 2022 年期间价值总和大于 1 的国家。 我试过了...

回答 1 投票 0

自动生成 Power BI 报告

我有一份 Power bi 报告,其中有一列称为“名称”。所以,我想自动化报告生成过程。我想用 python 编写一个脚本,以便与 Power BI 报告交互,

回答 1 投票 0

如何在 R 中复制 Python 的 matplotlib 绘图?

我有一个使用 matplotlib 的 Python 代码,它可以绘制 DataFrame 中的数据: 将 matplotlib.pyplot 导入为 plt dataframe_name.plot(图大小=(20,10)) plt.show() 下面是 Python 代码的输出: 我是

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.