我有一个以逗号分隔的文本文件,我正在阅读并使用textscan
进行解析。其中两个字段是日期和时间。我能够使用datenum
将两个字段转换为小数天,并且意图将两个结果向量相加。
我的问题是,每隔一段时间,其中一条数据信息就包含TIME字段,但不包括DATE字段。这被textscan
读作空字符串。我发现当datenum
遇到空字符串时,它返回一个空矩阵而不是NaN
值或其他填充值。这导致TIME和DATE的向量长度不同,并且没有明确指示如何对齐数据。
如何以保留数据顺序的方式处理这些空字符串?有没有办法让datenum
输出一个空值而不是简单地忽略该字段?我可以使用NaN
或0
或类似值来表示空字符串。如果可能的话,我宁愿保持这个矢量化,但我知道for
循环可能是必要的。
一种简单的方法是使用logical indexing仅处理有效日期,并在输出中将空的日期初始化为0
。例如,如果你在cell array C
中有你的日期,你可以使用cellfun
和isempty
得到索引,如下所示:
index = cellfun(@isempty, C);
out(index) = 0; % Empty dates are 0 in output
out(~index) = datenum(C(~index), 'ddmmyy');
或者,您可以先用'0/0/0'
替换空字符串,0
将转换为datenum
。例如:
C(cellfun(@isempty, C)) = {'0/0/0'};
但是,这种转换不适用于您的特定'ddmmyy'
格式(即,即使指定datenum('000000', 'ddmmyy')
参数,0
也不会返回PivotYear
)。第一个选项可能是您最好的选择。