flatten 相关问题

展平是指将多维数组缩减为单个维度,或者减少类和类方法以处理基于函数的调用。

Mysql 压平数组

该表包含json数据,我想从这个json中提取labelKey 表:d_json 数据 {“标签”:null,“选项”:[{“labelKey”:“key10”,“值”:&

回答 2 投票 0

将嵌套 JSON 文件转换为 pandas Dataframe

我正在尝试将带有列表和字典的嵌套 JSON 文件转换为数据框架。到目前为止我已经写了这段代码: 对于 rawData['results'] 中的结果: openfda_data = result.get('openfda', {}...

回答 1 投票 0

在 Rust 中将非此即彼的结构展平为另一个结构

我正在尝试用 Rust 创建一个灵活但特定类型的结构。我们将该结构称为 Analysis。所有 Analysis 结构都必须具有字段 name、id、created、modified。但有3种不同的

回答 2 投票 0

如何从对象流中统一对象的集合

我有这个 CasaDeBurrito 课程: 公共类 CasaDeBurritoImpl 实现 OOP.Provided.CasaDeBurrito { 私有整数 ID; 私有字符串名称; 私有整数分布; 私人套装<

回答 2 投票 0

使用 pandas json_normalise 将嵌套的 json 文件展平为数据框

我有一个大的json文件数据,我想将其转换为表格形式。我正在尝试使用 json_nomalise 将数据展平为数据帧。到目前为止我有这个: 到目前为止的代码 我想进一步平坦...

回答 1 投票 0

压平 SciPy lil_matrix 而不转换为密集以避免内存错误

鉴于: 将 numpy 导入为 np 导入 scipy print(np.__version__, scipy.__version__) # numpy: 1.23.5 scipy: 1.11.3 我想展平我的切片数组而不将其转换为密集以避免

回答 1 投票 0

从多维数组中获取所有值作为平面索引数组[重复]

我有这个数组: 数组(3){ [0]=> 数组(3){ [0]=> 数组(1){ [0]=> 字符串(2)“14” } [1]=> 字符串(2)“12” [2]=> 字符串(2)“13” } ...

回答 6 投票 0

递归过滤多维数组并收集字符串长度最小的元素

我有一个像这样的数组: [ [ 'key1' => '你好,我是一条短信', 'key2' => 真, 'key3' => '><><', ], [ [ 'key1' => '你好

回答 2 投票 0

如何使用 PySpark 展平这个复杂的 json?

背景:我正在使用 Azure Synapase 将数据从 API 通过管道传输到 json 文件。我使用 PySpark Notebook 来展平该复杂的 json,以便我可以将数据加载到 SQL 数据库中。 评论...

回答 1 投票 0

如何在不使用标准库的情况下定义List.flatten?

最初代码位于List.flatten(OCaml 标准库)中。但是,我不想使用标准库。因此我定义了展平函数。它在 List.flatten 期间工作正常。在我实施之后...

回答 1 投票 0

横向扁平化,XML 文件外部不起作用

我将以下 xml 加载到具有变体数据类型的表中 我将以下 xml 加载到具有变体数据类型的表中 <VehicleDamageEstimateAddRq xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.cieca.com/BMS"> <RqUID>014b91da-1227-4c2b-995f-0f2f6e1b0be4</RqUID> <DamageLineInfo> <LineNum>2</LineNum> <UniqueSequenceNum>4</UniqueSequenceNum> <ParentLineNum>3</ParentLineNum> <SupplementNum>0</SupplementNum> <EstimateVerCode>EM</EstimateVerCode> <ManualLineInd>false</ManualLineInd> <AutomatedEntry>true</AutomatedEntry> <LineStatusCode>1</LineStatusCode> <LineDesc>O/H front bumper</LineDesc> <DescJudgmentInd>false</DescJudgmentInd> <LaborInfo> <LaborType>LAB</LaborType> <DatabaseLaborType>LAB</DatabaseLaborType> <LaborOperation>OP0</LaborOperation> <LaborHours>3.9</LaborHours> <DatabaseLaborHours>3.9</DatabaseLaborHours> <LaborInclInd>false</LaborInclInd> <LaborAmt>195.00</LaborAmt> <TaxableInd>false</TaxableInd> <LaborHoursJudgmentInd>false</LaborHoursJudgmentInd> <LaborTypeJudgmentInd>false</LaborTypeJudgmentInd> <DrillingInd>false</DrillingInd> </LaborInfo> </DamageLineInfo> <DamageLineInfo> <LineNum>3</LineNum> <UniqueSequenceNum>2</UniqueSequenceNum> <SupplementNum>0</SupplementNum> <EstimateVerCode>EM</EstimateVerCode> <ManualLineInd>false</ManualLineInd> <AutomatedEntry>false</AutomatedEntry> <LineStatusCode>1</LineStatusCode> <LineDesc>Bumper cover w/o hybrid</LineDesc> <DescJudgmentInd>false</DescJudgmentInd> <PartInfo> <PartType>PAA</PartType> <PartNum>MI1000341</PartNum> <OEMPartNum>6400L177</OEMPartNum> <NonOEM> <PartType>PAA</PartType> <NonOEMPartNum>MI1000341</NonOEMPartNum> <PartSelectedInd>true</PartSelectedInd> </NonOEM> <PartPrice>431.00</PartPrice> <UnitPartPrice>431.00</UnitPartPrice> <TaxableInd>true</TaxableInd> <PriceJudgmentInd>false</PriceJudgmentInd> <AlternatePartInd>true</AlternatePartInd> <GlassPartInd>false</GlassPartInd> <PriceInclInd>false</PriceInclInd> <Quantity>1</Quantity> </PartInfo> <LaborInfo> <LaborType>LAB</LaborType> <DatabaseLaborType>LAB</DatabaseLaborType> <LaborOperation>OP11</LaborOperation> <LaborHours>0.0</LaborHours> <DatabaseLaborHours>3.9</DatabaseLaborHours> <LaborInclInd>true</LaborInclInd> <LaborAmt>0</LaborAmt> <TaxableInd>false</TaxableInd> <LaborHoursJudgmentInd>false</LaborHoursJudgmentInd> <LaborTypeJudgmentInd>false</LaborTypeJudgmentInd> <DrillingInd>false</DrillingInd> </LaborInfo> <RefinishLaborInfo> <LaborType>LAR</LaborType> <LaborOperation>OP6</LaborOperation> <LaborHours>3.1</LaborHours> <DatabaseLaborHours>3.1</DatabaseLaborHours> <LaborInclInd>false</LaborInclInd> <LaborAmt>155.00</LaborAmt> <LaborHoursJudgmentInd>false</LaborHoursJudgmentInd> </RefinishLaborInfo> <OtherChargesInfo> <OtherChargesType>MAPA</OtherChargesType> <Price>102.30</Price> <UnitOfMeasure>HR</UnitOfMeasure> <Quantity>3.1</Quantity> <PriceInclInd>false</PriceInclInd> </OtherChargesInfo> </DamageLineInfo> </VehicleDamageEstimateAddRq> DamageLineInfo 标签/部分重复 N 次,但所有 DamageLineInfo 标签/部分的内部键并不相同,因为您可以看到 LineNum:3 具有 LineNum:2 没有的 RefinishLaborInfo 和 OtherChargesInfo。我写了下面的sql来提取outer => True的两行,但它只返回1行(行号:3) SELECT GET(XMLGET(DamageLineInfo.value, 'LineNum'),'$')::number as DamageLineInfo_LineNum ,GET(XMLGET(DamageLineInfo.value, 'UniqueSequenceNum'),'$')::number as DamageLineInfo_UniqueSequenceNum , GET(XMLGET(RefinishLaborInfo.value, 'LaborType'),'$')::string as RefinishLaborInfo_LaborType FROM "DEFAULT"."PUBLIC"."SAMPLE2_XML" ,LATERAL FLATTEN(GET(SRC_XML, '$')) DamageLineInfo ,LATERAL FLATTEN(input=>GET(DamageLineInfo.value, '$'),OUTER=>TRUE) RefinishLaborInfo where GET(DamageLineInfo.value, '@') = 'DamageLineInfo'and GET(RefinishLaborInfo.value,'@')='RefinishLaborInfo' 即使某些部分(例如 RefinishLaborInfo )不存在,我的代码应该是什么才能获取这两行。 我发现在 Snowflake 中使用 CTE 解析嵌套 XML 文档效果最好。 with DAMAGE_LINE_INFO as ( select THIS from SAMPLE2_XML, lateral flatten(SRC_XML, recursive => true) where VALUE = 'DamageLineInfo' ), DAMAGE_AND_LABOR as ( select get(xmlget(THIS, 'LineNum'), '$') as "DamageLineInfo_LineNum" ,get(xmlget(THIS, 'UniqueSequenceNum'), '$') as "DamageLineInfo_UniqueSequenceNum" ,xmlget(THIS, 'LaborInfo') as LABOR_INFO ,xmlget(THIS, 'RefinishLaborInfo') as REFINISH_LABOR_INFO from DAMAGE_LINE_INFO ) select "DamageLineInfo_LineNum" ,"DamageLineInfo_UniqueSequenceNum" ,get(xmlget(LABOR_INFO, 'LaborType'), '$')::string as LABOR_TYPE ,get(xmlget(REFINISH_LABOR_INFO, 'LaborType'), '$')::string as REFINISH_LABOR_TYPE from DAMAGE_AND_LABOR

回答 1 投票 0

Ruby 复杂字符串数组到浮点数数组

我试图将这个(相当复杂)浮点字符串的字符串数组转换为浮点数组,但没有成功: [ 5.85142857 6.10684807 6.15328798 6.31582766 6.96598639 7.61614512 7.87...

回答 3 投票 0

Ruby 压平字符串数组

我试图将这个输出字符串压平到一个数组中,但没有成功: [ 5.85142857 6.10684807 6.15328798 6.31582766 6.96598639 7.61614512 7.87156463 8.73070295 9.38086168 9.6595...

回答 1 投票 0

比较两个具有相同列名的数据框,并用后缀压平结果数据框

我有两个数据框: dfA = pd.DataFrame({ “跑步”: ( 1, 1, 1, 2, 2, 2, 3, 3, 3 ), “观点”: ( 1, 2, 3, 1, 2, 3, 1, 2, 3 ),...

回答 1 投票 0

将嵌套的 JSON 数组转换为 CSV 文件中的单独列

我有一个如下所示的 JSON 文件: { “id”:10011, "title": "测试程序", “蛞蝓”:“蛞蝓”, "url": "http://test.test", “电子邮件”:“[email protected]”, “链接”:“http://测试...

回答 2 投票 0

使用 jq 展平嵌套 JSON

我想展平嵌套的 json 对象,例如{"a":{"b":1}} 到 {"a.b":1} 以便在 solr 中消化它。 我有 11 TB 的 json 文件,它们都是嵌套的,并且字段名称中包含点,这意味着......

回答 6 投票 0

如何使用横向展平解析雪花中的嵌套json

想要从 event_params 属性中提取值, 我想从 event_params."key": "link_class":string_value 获取值 前任: event_params--> key=link_class 和...

回答 1 投票 0

IMPORTRANGE 公式,返回 Google 表格中同一单元格中的一些值

我正在尝试制作一个Google表格,它从其他表格中提取数据并在那里收集它们。我有很多列,对于其中的大多数,我使用了以下公式,效果完美。 =

回答 1 投票 0

在多维数组的第三级中搜索值并返回扁平化的合格数据集

我正在尝试在多维数组中搜索符合条件的条目,并以扁平的关联子数组的形式返回一个或多个数据集。 输入示例: [ [ '名字' => '迪克·詹斯...

回答 4 投票 0

Pandas df 数据扁平化

我有一个有 3 列的 pandas df。 联系人为 col1,个人资料为 col2,客户为 col3 输入 df 如下 - |联系方式|简介|客户| |:------|:------|:-----| |{'id':'1','姓名':'abc'}|{'电子邮件':'abc@gm...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.