数据分析:集团价值流acc。相似

问题描述 投票:0回答:1

我和我的同事(都是机械工程师)喜欢学习python并解决新的有趣问题。

我们的问题:我们要分析组件的价值流(> 50.000),并根据它们的价值流的相似性对其进行分组。

举个例子-假设我们有三种材料A,B和C,其数据如下:

A = [610384,521056,112200,194825633,45]

B = [10389,462,1028503]

C = [10389,462,1028503,112200,45,194825633]

每个数组代表一个值流,每个元素代表值流中的一台机器。例如,必须运行5台以上的机器才能生产。 “ 610384”是值流中第一台计算机的编号。如您所见,A和B与C相似,因为B是C的100%子流,但是A包含3台相同的机器,但顺序不同。

约束:

  • 数字根本没有意义->不能根据大小或其他任何东西进行比较

  • 数组也有不同的长度,元素

  • 数组可以包含子数组,也可以以不同顺序排列,等等。一切皆有可能(我们正在处理数据集)。

  • 我们可以在从上到下的4个等级上评分:技术,过程描述,过程描述详细信息,机器编号->含义:机器编号10389和462根本不相等,但是两台机器都习惯于“钻洞。因此,级别2(过程描述)将相等。因此,我们可以使用它来给它们评分不等于100%或0%,但是可以在此机器上给它们30%的相似度(不是整个价值流!)。

4个级别的示例:手动钻孔(1)->钻孔(2)-> 90度钻孔(3)->机器编号462(4)

问题:

  1. 我们应该如何评价每个价值流之间的相互关系?考虑到不同的长度等]]

  2. 我们如何以有用的方式对给定的评级进行聚类?

  3. 我们应该使用合适的算法吗?我们需要自己定义规则吗?如果是这样,您可以推荐阅读吗?

[我们的目标:

将相似的价值流组合在一起,因此我们可以看到价值流的高速路,并查看是否应该移动机器。

PS:这是Reddit r / analytics的调整后转贴

我和我的同事(都是机械工程师)喜欢学习python并解决新的有趣问题。我们的问题:我们要分析组件的价值流(> 50.000)并将它们分组...

python stream analytics production lean
1个回答
0
投票

这可能是我的部分解决方案,

© www.soinside.com 2019 - 2024. All rights reserved.