点火柱内的计算

问题描述 投票:0回答:1

我的公司决定点火,然后任命我为spotfire guru(因为我在那里),现在我正在搞清楚。我们使用非常大的数据集(我要问的是几百万行)。无论如何,该列是Z数据,每个连续单元格之间的差异将显示它所代表的机器移动了多远。例如:

Name    Time Stamp         X      Y     Lat     Long      Z         Delta Z
Name    28.3.2018 10:59 0,02438 0,02888 60,49   26,96   0,037794693 
Name    28.3.2018 10:59 0,02671 0,03768 60,49   26,96   0,046186649 0,00839
Name    28.3.2018 10:59 0,02409 0,0294  60,49   26,96   0,038009053 0,00818
Name    28.3.2018 11:00 0,02676 0,03768 60,49   26,96   0,046215582 0,00821
Name    28.3.2018 11:00 0,02393 0,02941 60,49   26,96   0,037915604 0,00830
Name    28.3.2018 11:00 0,02669 0,03761 60,49   26,96   0,046117981 0,00820
Name    28.3.2018 11:00 0,02341 0,02966 60,49   26,96   0,037785496 0,00833
Name    28.3.2018 11:00 0,02673 0,03758 60,49   26,96   0,046116692 0,00833
Name    28.3.2018 11:00 0,02329 0,0297  60,49   26,96   0,037742736 0,00837
Name    28.3.2018 11:00 0,02205 0,0306  60,49   26,96   0,037716873 0,00003

所以,上面是我从excel中获取的输出中的几行转储。我在源数据(它是JSON)上运行一个python脚本,它输出上面的内容,除了我需要计算的最后两列。我可以使用spotfire来制作Z列(这是简单的毕达哥拉斯,因为X和Y是从参考点开始向上),但我需要的是Z(delta Z)在一天中的变化。在excel中它很容易,因为公式是“= ABS(G3-G2)”然后沿整个列粘贴它变成“= ABS(G4-G3)”,“= ABS(G5-G4)”等等。由于文件太大,我无法在excel中创建它。

公式不会将第一个Z作为固定的锚点,它会使用每个Z点。然后数据让我看到机器在一定时期内移动了多远。

这是我无法解决的问题。所有帮助赞赏。

calculated-columns spotfire
1个回答
1
投票

更新:感谢您提供时间戳列和说明。我仍然需要使用我创建的[Row]列,因为我想确保事情的顺序正确,并且时间戳不够精确以确保这一点。如果你的实际数据集中有一个秒或毫秒的时间戳,我建议在[Row]上使用它。

那说,我没有看到与原始结果有太大差异,我认为我的答案仍然几乎完全有效。最大的区别是[Delta Z]的空白行位于数据集的顶部而不是底部。我通过将表达式更改为:

Abs([Z] - First([Z]) OVER Previous([Row]))

这是结果表。 [Delta Z]是您在上面发布的结果列,[DZ_1]是我的新专栏:

DeltaZ    Z              Row  DZ_1
          0.037794693    1    
0.00839   0.046186649    2    0.008391956
0.00818   0.038009053    3    0.008177596
0.00821   0.046215582    4    0.008206529
0.0083    0.037915604    5    0.008299978
0.0082    0.046117981    6    0.008202377
0.00833   0.037785496    7    0.008332485
0.00833   0.046116692    8    0.008331196
0.00837   0.037742736    9    0.008373956
0.00003   0.037716873    10   2.5863000000001E-05

另外,您可以通过转到编辑»列属性,选择有问题的列,选择格式选项卡,最后根据需要设置小数下拉列表来调整显示的小数位数。


首先,欢迎来到StackOverflow。请在将来准备提供完整的Minimally Complete, Verifiable Example。就Spotfire而言,这意味着我可以复制粘贴到Spotfire中的样本数据集(文本中),包括显示预期结果的列。您可以在Excel或记事本中创建它。请理解我正在抽出时间来帮助解决您的问题,并要求您尽可能简单地让我这样做。

第二,欢迎来到Spotfire!我和你一样学习。我强烈建议您的雇主支付TIBCO Spotfire在线课程的费用,因为它们将为使用该工具提供很好的理解基础。

除此之外,我对您的数据集做了以下假设,因为您还没有完全回答我关于您的数据集的问题。如果我的假设不正确,请回答我关于您的数据集的问题。

  1. 没有列表示某种顺序,例如时间戳或行号
  2. 您不希望数据集的最后一行有任何结果

为了满足您的要求,首先我需要创建一个删除上述假设#1的列。我把这个专栏命名为[Row],其表达式很简单:

RowId()

这将输出该行的文字行号(与BaseRowId()函数相反,后者显示应用任何标记和过滤器后的可视行号)。

我创建这个是因为为了比较行,Spotfire需要某种指示器来确定哪一行在下一行之前。

然后我用以下表达式创建了第二列[Delta Z]

Abs([Z] - First([Z]) OVER Next([Row]))

换句话说,“对于每一行,取该行的[Z]的当前值,并从在以下所有行(即下一行)中找到的[Z]的第一个值中减去它。”

这产生以下结果:

Z          Row     Delta Z
0.24157    1       0.03424
0.27581    2       0.03195
0.24386    3       0.000149999999999983
0.24371    4    

您可以通过该可视化的“属性”对话框在任何表格可视化中隐藏[Row],但不能完全删除它。

© www.soinside.com 2019 - 2024. All rights reserved.