我正在管理文件目录。每个文件的命名方式类似于
Image_000000.png
,每个存储的文件的数字部分都会递增。
也可以删除文件,在编号顺序中留下间隙。我之所以问这个问题,是因为我认识到,在未来的某个时刻,用户可能会用完号码序列,除非我采取措施在号码可用时重新使用号码。我意识到这是一百万,而且很多,但我们有 20 多年的用户,所以“有一天”并不是不可能的。
所以,我特别想问是否存在一种方法可以轻松确定序列中的间隙,而无需简单地循环。我意识到因为它是一个固定范围,所以我可以简单地在预期范围内循环。
我会的,除非有更好/更清洁/更简单/更快的替代方案。如果有的话,我想了解一下。
调用该方法来获取下一个可用的文件名:
public static String GetNextImageFileName()
{
String retFile = null;
DirectoryInfo di = new DirectoryInfo(userVars.ImageDirectory);
FileInfo[] fia = di.GetFiles("*.*", SearchOption.TopDirectoryOnly);
String lastFile = fia.Where(i => i.Name.StartsWith("Image_") && i.Name.Substring(6, 6).ContainsOnlyDigits()).OrderBy(i => i.Name).Last().Name;
if (!String.IsNullOrEmpty(lastFile))
{
Int32 num;
String strNum = lastFile.Substring(6, 6);
String strExt = lastFile.Substring(13);
if (!String.IsNullOrEmpty(strNum) &&
!String.IsNullOrEmpty(strExt) &&
strNum.ContainsOnlyDigits() &&
Int32.TryParse(strNum, out num))
{
num++;
retFile = String.Format("Image_{0:D6}.{1}", num, strExt);
while (num <= 999999 && File.Exists(retFile))
{
num++;
retFile = String.Format("Image_{0:D6}.{1}", num, strExt);
}
}
}
return retFile;
}
编辑:如果它对任何人有帮助,这是最后的方法,结合丹尼尔·希尔加斯的答案:
public static String GetNextImageFileName()
{
DirectoryInfo di = new DirectoryInfo(userVars.ImageDirectory);
FileInfo[] fia = di.GetFiles("Image_*.*", SearchOption.TopDirectoryOnly);
List<Int32> fileNums = new List<Int32>();
foreach (FileInfo fi in fia)
{
Int32 i;
if (Int32.TryParse(fi.Name.Substring(6, 6), out i))
fileNums.Add(i);
}
var result = fileNums.Select((x, i) => new { Index = i, Value = x })
.Where(x => x.Index != x.Value)
.Select(x => (Int32?)x.Index)
.FirstOrDefault();
Int32 index;
if (result == null)
index = fileNums.Count - 1;
else
index = result.Value - 1;
var nextNumber = fileNums[index] + 1;
if (nextNumber >= 0 && nextNumber <= 999999)
return String.Format("Image_{0:D6}", result.Value);
return null;
}
查找第一个间隙的第一个数字的非常简单的方法如下:
int[] existingNumbers = /* extract all numbers from all filenames and order them */
var allNumbers = Enumerable.Range(0, 1000000);
var result = allNumbers.Where(x => !existingNumbers.Contains(x)).First();
如果所有数字均已使用且不存在间隙,则将返回 1,000,000。
这种方法的缺点是它的性能相当糟糕,因为它会迭代
existingNumbers
多次。
更好的方法是使用 Zip:
allNumbers.Zip(existingNumbers, (a, e) => new { Number = a, ExistingNumber = e })
.Where(x => x.Number != x.ExistingNumber)
.Select(x => x.Number)
.First();
DuckMaestro 答案的改进版本实际上返回第一个间隙的第一个值 - 而不是第一个间隙之后的第一个值 - 看起来像这样:
var tmp = existingNumbers.Select((x, i) => new { Index = i, Value = x })
.Where(x => x.Index != x.Value)
.Select(x => (int?)x.Index)
.FirstOrDefault();
int index;
if(tmp == null)
index = existingNumbers.Length - 1;
else
index = tmp.Value - 1;
var nextNumber = existingNumbers[index] + 1;
改进其他答案,使用
Where
的替代版本。
int[] existingNumbers = ...
var result = existingNumbers.Where( (x,i) => x != i ).FirstOrDefault();
值
i
是从 0
开始的计数器。
.NET 3.5 支持此版本的
where
(http://msdn.microsoft.com/en-us/library/bb549418(v=vs.90).aspx)。
这是一个老问题,但有人建议(在评论中)您可以使用
.Except()
代替。我倾向于更喜欢这个解决方案,因为它会给你第一个缺失的数字(间隙)或序列中下一个最小的数字。这是一个例子:
var allNumbers = Enumerable.Range(0, 999999); //999999 is arbitrary. You could use int.MaxValue, but it would degrade performance
var existingNumbers = new int[] { 0, 1, 2, 4, 5, 6 };
int result;
var missingNumbers = allNumbers.Except(existingNumbers);
if (missingNumbers.Any())
result = missingNumbers.First();
else //no missing numbers -- you've reached the max
result = -1;
运行上面的代码会将
result
设置为:
3
此外,如果您将现有号码更改为:
var existingNumbers = new int[] { 0, 1, 3, 2, 4, 5, 6 };
所以没有差距,你会得到 7。
无论如何,这就是为什么我更喜欢 except 而不是 Zip 解决方案——只是我的两分钱。 谢谢!
var firstnonexistingfile = Enumerable.Range(0,999999)
.Select(x => String.Format("Image_{0:D6}.{1}", x, strExt))
.FirstOrDefault(x => !File.Exists(x));
这将从
0
迭代到 999999
,然后将 String.Format()
的结果输出为 IEnumerable<string>
,然后找到该序列中第一个为 File.Exists()
返回 false 的字符串。