我移植了一个Python应用程序到Java,并贴在实施LAMBDA flatMap()
的正确方法。我通过IP日志分析,需要拆就“”(空格)。
我的环境:
我所拥有的是:
加载数据框:
Dataset<Row> MyLog = spark.sql("Select RecordNumber, IpAddress from Table);
MyLog.createOrReplaceTempView("MyLog");
现在尝试拉姆达flatmap()
Dataset<String> Mylog2 = Mylog.flatMap(e -> String.asList(e.split(' ')));
我已经试过这几个变化,包括:
Dataset<Row> Mylog2 = Mylog.flatMap(e -> Array.asList(e.split(' ')));
Dataset<String> Mylog2 = Mylog.flatMap(lambda(e -> String.asList(e.split(' '))));
等等
原来蟒蛇是这样的:
Mylog2 = Mylog.rdd.flatMap(lambda(x,y): ((x,v) for v in y.split(' ')))
我将不胜感激任何见解正确的方法用放电来实现这个Java中
谢谢
关于什么:
Dataset<String> Mylog2 = Mylog.flatMap(row -> java.util.Arrays.stream(row.getString(1).split(' ')).iterator(), Encoders.STRING());
但是你要哪一列分割?在Ip地址?