no。每十年的猪记录数量

问题描述 投票:0回答:1

我有这样的数据

name, id, nametype,recclass,mass, fall, year,

Aachen,1, Valid,    L5,      21,  Fell, 01/01/1880 12:00:00 AM,

Aarhus,2, Valid,    H6,      720  Fell, 01/01/1951 12:00:00 AM

 :     :


 :     :

 :    45700

我必须找出没有。每十年使用Piglatin进行录音的次数。不知道开始和结束年份,因为数据未排序

我尝试了以下代码:

nasadata = load 'Meteorite_Landings.csv' using PigStorage(',') as(name:chararray,id:int,nametype:chararray,recclass:chararray,mass:int,fall:chararray,year:chararray);

B = FOREACH nasadata  GENERATE year;

C = FOREACH B GENERATE ToDate(year,'dd-MM-YYYY') as year1;

[当我转储C时,它显示无法从输入文件读取数据。但是当我转储nasadata时,它起作用。当我描述C时,它显示]]

C: {year1: datetime}
grunt> 

我有类似此名称,id,名称类型,recclass,质量,秋天,年份,亚琛,1,有效,L5、21,掉落,01/01/1880 12:00:00 AM,奥尔胡斯,2,有效的数据,H6,720 Fell,01/01/1951 12:00:00 AM:...

apache-pig data-analysis
1个回答
0
投票

您确定ToDate格式正确,因为“ 01/01/1880 12:00:00 AM”没有格式“ dd-MM-YYYY”,但是“ 01-01-1880”会正确。

© www.soinside.com 2019 - 2024. All rights reserved.