我在过去的几个月里一直在研究Spark。其中Dataset是作为分布式对象集合使用的,我并不担心它是如何分布的,而是一个基本的数据结构。
我并不担心它是如何分布的,而是一个基本的数据结构。我很想知道如何把它放在java中,如果创建我自己的Dataset这样的东西。
它看起来像这样 Dataset<Row>
. 其中Row是记录,可以是很多。
这就是它的工作原理,要创建 Dataset<Row>
List<Row> rows = new ArrayList<Row>();
for (Employee e : employees) {
rows.add(RowFactory.create(e.getFirstname(),
e.getLastname(),
e.getTitle(),
e.getId(),
e.getDivision(),
e.getSupervisor()));
}
return rows.iterator();
而上面给我的是这样的 Dataset<Row>
有谁能分享一下如何将其放在Java中?我的意思是在java中的一些代码,这是负责创建这样的东西。Dataset<Row>
我并不要求完整的代码,只要求一个基本的想法,这样我就可以清楚地想象它在后端是什么样子。
基本的小样本数据结构将是非常有帮助的。
谢谢你