如何使用U-SQL修改文本文件

问题描述 投票:0回答:1

我有一个大约130MB的大文件,每行包含10个A字符,而在第10个“A”字符的末尾是\ t,我想提取这个文本文件,然后将所有A改为B。任何人都可以帮助它的代码片段吗?

这是我到现在所写的

USE DATABASE imodelanalytics;

@searchlog =
 EXTRACT characters string
 FROM "/iModelAnalytics/Samples/Data/dummy.txt"
 USING Extractors.Text(delimiter: '\t', skipFirstNRows: 1);


@modify = 
SELECT characters  AS line
FROM @searchlog;

OUTPUT @modify 
TO "/iModelAnalytics/Samples/Data/B.txt" 
USING Outputters.Text();

我是新手,所以任何建议都会有所帮助!谢谢

text jobs azure-data-lake u-sql
1个回答
0
投票

假设所有的字段都是AAAAAAAAAA然后你可以写:

@modify = SELECT "BBBBBBBBBB" AS characters FROM @searchlog;

如果只有一些是As,那么你会在SELECT条款中做到:

@modify = 
  SELECT (characters == "AAAAAAAAAA" ? "BBBBBBBBBB" : characters) AS characters 
  FROM @searchlog;

如果AAAAAAAAAA周围还有其他字符,那么您将使用更多的C#字符串函数来查找它们并以类似的模式替换它们。

© www.soinside.com 2019 - 2024. All rights reserved.