数据分析涉及从原始数据中提取意义和见解。它涉及检查,清理,转换和建模数据以获得结论的方法和算法。
我有多个 csv 文件,其格式均为: 日期、时间、姓名 1、姓名 2、数字 1、数字 2、数字 3、数字 4、数字 5、数字 6、数字 7 我想要做的是通过连接
我需要将维度中的外键添加到 Power BI 中的所有事实表吗?
我的事实是工单和工单操作,具有各种维度(为简单起见,此处显示 2) - 有些是两者共同的,有些是独特的,例如操作类型仅与工单操作相关,但它属于...
为什么在与 Google 地图进行比较时,我从 OSMnx 或 networkx 得到的长度和行程时间不同?
我是新来使用OSM数据、OSMnx和networkx库的,所以如果有更好的方法来完成从A到B位置的最短路径,我将不胜感激。 我正在努力获得
总结 使用两个表的 PowerPivot 数据模型,我无法创建一个具有多个行的数据透视表,其过滤方式与单个表使用相同列的方式相同。 细节 我有一个si...
总结 使用两个表的 PowerPivot 数据模型,我无法创建一个具有多个行的数据透视表,其过滤方式与单个表使用相同列的方式相同。 细节 我有一个si...
单元格值为858497.997359999,但我在power query中看到的是858497。Excel自定义数字格式为_(* #,##0_);_(* (#,##0);_(* "- “?_);_(@_) 我怎样才能看到幂的整数
如何将控制台的 SQL 查询输出添加到 github 中的 README.md 中?
我是数据分析新手,正在尝试做一个项目,涉及在 BigQuery 中分析和清理数据,然后在 Tableau 中进行可视化。我想记录我的过程和步骤,以...
部分模式下的 PostgreSQL / TimescaleDB 百分位数
假设我有一个结果表: 结果ID 属性ID 用户身份 价值 时间戳 1 1 1 100 2024-02-10 14:30:15.248087+00 2 2 1 111 2024-02-10 10:30:15.248087+00 3 1 1 122 2024-02-09 14:30:15.248087+...
如何在 SQL 中实现“FROM”输入以从我的项目中提取信息?描述中的截图
我正在学习关于数据分析的 coursera 课程并跟随视频学习,但我不确定为什么会收到错误消息或视频如何获得“系绳”选项? 我附上了一个
我的weight_class过滤器不适用,我尝试专门过滤weight_class==10924,然后将dtype转换为“weight_class”,我还剥离了列,但仍然得到了Rice
我正在使用 SAS 处理数据分析问题,其中我有一个由属于不同类别的各种项目组成的数据集。每个项目可以属于多个类别,但我很感兴趣...
我正在尝试将下面的 Tableau 计算字段转换为 SQL: 计算字段#1: { 固定 SM、日期、DC: 最小值( 如果 svb = 'S' 那么 如果 sg = 'X8' 并且 p = 'N' 那么 s * 2 其他的 结尾 结束...
TypeError: agg 函数失败 [how->mean,dtype->object] pandas pycharm
将 pandas 导入为 pd df = pd.read_csv("003 大学专业工资.csv") clean_df = df.dropna() # 打印(clean_df.tail()) # print(clean_df.groupby("Group").count()) 打印(清除...
我有一个包含两列的数据集 - Student_login 和 reviewer_login。一个人既可以是学生,也可以是审稿人。无论该人的角色如何,我们都需要找到唯一数量的对。对于
任何人都可以帮我编写代码,使用 DAX Studio 在 DAX 中执行“转置”功能(从图 1 到图 2) 图1 图 2
我正在使用Power BI(我只能使用DAX)。 从这个表开始: 客户 购买日期 客户端A 01/01/2023 客户端A 2023年1月2日 客户端B 2023年1月3日 客户端B 2023年1月2日 我想创建一个新的
Python 使用 pandas DataFrame.query() 方法时出现“SyntaxError:扫描字符串文字时 EOL”错误
我很抱歉这可能是一个非常愚蠢的问题,但我无法自己解决问题。 我需要在 df.query() 方法中编写一个非常大的条件来过滤我的数据。但由于某种原因我有一个
我可以使用 is_monotonic 方法检查 pandas.DataFrame() 的索引是否单调递增。但是,我想检查其中一列值的值是否严格增加(...
Power BI:通过将部分信息分组到下拉列表中来重新创建仪表板
我在 Power BI 中有一个仪表板,如下所示: 姓名 指定活动 等级 活动组 安娜 篮球 2 运动的 安娜 排球 3 运动的 朱丽叶 篮球 1 运动的 朱丽叶 网球 2 斯波...
在 pyspark 中应用交叉表后我有一个 DataFrame,示例如下 ID A 乙 C CSSD 0 1 0 sdsdsd 1 1 1 ssdssd 1 0 0 xxxxxx 0 0 0 我想获取行的百分比而不是 0,1...