从Java映射的头文件中减少精简代码

Question

我正在尝试获取一个csv文件的摘要，文件的第一行是标题。有没有一种方法可以使每列的值都以其标题名称作为来自Java代码的键值对。

例如：输入文件就像

A，B，C，D

1,2,3,4

5,6,7,8

我希望映射器的输出为(A,1),(B,2),(C,3),(D,4),(A,5),....

注意：我尝试在Mapper类中使用重写run函数来跳过第一行。但是据我所知，每次输入分割都会调用run函数，因此不适合我的需求。对此的任何帮助将不胜感激。

这是我的映射器的外观：

public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

        String line = value.toString();
        String[] splits = line.split(",",-1);
        int length = splits.length;
    //  count = 0;

        for (int i = 0; i < length; i++) {
            columnName.set(header[i]);      
            context.write(columnName, new Text(splits[i]+""));
        }

    }

    public void run(Context context) throws IOException, InterruptedException
    {        
        setup(context); 
        try 
        {

            if (context.nextKeyValue())
            { 

                Text columnHeader = context.getCurrentValue();
                header =  columnHeader.toString().split(",");

            }    
            while (context.nextKeyValue()) 
            {
                map(context.getCurrentKey(), context.getCurrentValue(), context);
            }
        } 
        finally 
        {
            cleanup(context);
        }      
    }

Answer 1

@ Manjunath Ballur接受的答案很不错。但是，Map Reduce必须与简单性结合使用。建议您不要检查每一行的标题。

从Java映射的头文件中减少精简代码

问题描述投票：1回答：2

2个回答

最新问题

从Java映射的头文件中减少精简代码

问题描述 投票：1回答：2

2个回答

最新问题

问题描述投票：1回答：2