我有一个CSV文件没有固定数量的列,如下所示:
col1,col2,col3,col4,col5
val1,val2,val3,val4,val5
column1,column2,column3
value1,value2,value3
有没有办法用Spring Batch读取这种CSV文件?
我试着这样做:
<bean id="ItemReader" class="org.springframework.batch.item.file.FlatFileItemReader">
<!-- Read a csv file -->
<property name="resource" value="classpath:file.csv" />
<property name="lineMapper">
<bean class="org.springframework.batch.item.file.mapping.DefaultLineMapper">
<!-- split it -->
<property name="lineTokenizer">
<bean
class="org.springframework.batch.item.file.transform.DelimitedLineTokenizer">
<property name="names"
value="col1,col2,col3,col4,col5,column1,column2,column3" />
</bean>
</property>
<property name="fieldSetMapper">
<bean
class="org.springframework.batch.item.file.mapping.BeanWrapperFieldSetMapper">
<property name="prototypeBeanName" value="myBean" />
</bean>
</property>
</bean>
</property>
</bean>
但结果是这个错误:
您可以使用PatternMatchingCompositeLineMapper
根据模式委派给每行适当的LineMapper
实现。从那里,你的每个代表都会使用DelimtedLineTokenizer
和FieldSetMapper
来相应地绘制线。
您可以在此处的文档中了解更多相关信息:http://docs.spring.io/spring-batch/trunk/apidocs/org/springframework/batch/item/file/mapping/PatternMatchingCompositeLineMapper.html
你的AbstractLineTokenizer#setStrict(boolean)
的DelimitedLineTokenizer
应该做的工作。
来自javadoc:
公共setter为严格的标志。如果为true(默认值),则行中的标记数必须与LineTokenizer中定义的标记数(按范围,列等)匹配。如果为false,那么具有较少令牌的行将被容忍并且用空列填充,并且具有更多令牌的行将被简单地截断。
您应该将配置的这一部分更改为:
<bean class="org.springframework.batch.item.file.transform.DelimitedLineTokenizer">
<property name="names" value="col1,col2,col3,col4,col5,column1,column2,column3" />
<property name="strict" value="false" />
</bean>