Linq 是否提供了一种轻松发现序列中间隙的方法?

问题描述 投票:0回答:4

我正在管理文件目录。每个文件的命名方式类似于

Image_000000.png
,每个存储的文件的数字部分都会递增。

也可以删除文件,在编号顺序中留下间隙。我之所以问这个问题,是因为我认识到,在未来的某个时刻,用户可能会用完号码序列,除非我采取措施在号码可用时重新使用号码。我意识到这是一百万,而且很多,但我们有 20 多年的用户,所以“有一天”并不是不可能的。

所以,我特别想问是否存在一种方法可以轻松确定序列中的间隙,而无需简单地循环。我意识到因为它是一个固定范围,所以我可以简单地在预期范围内循环。

我会的,除非有更好/更清洁/更简单/更快的替代方案。如果有的话,我想了解一下。

调用该方法来获取下一个可用的文件名:

public static String GetNextImageFileName()
{
    String retFile = null;
    DirectoryInfo di = new DirectoryInfo(userVars.ImageDirectory);
    FileInfo[] fia = di.GetFiles("*.*", SearchOption.TopDirectoryOnly);
    String lastFile = fia.Where(i => i.Name.StartsWith("Image_") && i.Name.Substring(6, 6).ContainsOnlyDigits()).OrderBy(i => i.Name).Last().Name;
    if (!String.IsNullOrEmpty(lastFile))
    {
        Int32 num;
        String strNum = lastFile.Substring(6, 6);
        String strExt = lastFile.Substring(13);
        if (!String.IsNullOrEmpty(strNum) && 
            !String.IsNullOrEmpty(strExt) && 
            strNum.ContainsOnlyDigits() &&
            Int32.TryParse(strNum, out num))
        {
            num++;
            retFile = String.Format("Image_{0:D6}.{1}", num, strExt);
            while (num <= 999999 && File.Exists(retFile))
            {
                num++;
                retFile = String.Format("Image_{0:D6}.{1}", num, strExt);
            }
        }
    }

    return retFile;
}

编辑:如果它对任何人有帮助,这是最后的方法,结合丹尼尔·希尔加斯的答案:

public static String GetNextImageFileName()
{
    DirectoryInfo di = new DirectoryInfo(userVars.ImageDirectory);
    FileInfo[] fia = di.GetFiles("Image_*.*", SearchOption.TopDirectoryOnly);
    List<Int32> fileNums = new List<Int32>();
    foreach (FileInfo fi in fia)
    {
        Int32 i;
        if (Int32.TryParse(fi.Name.Substring(6, 6), out i))
            fileNums.Add(i);
    }
    var result = fileNums.Select((x, i) => new { Index = i, Value = x })
                .Where(x => x.Index != x.Value)
                .Select(x => (Int32?)x.Index)
                .FirstOrDefault();

    Int32 index;
    if (result == null)
        index = fileNums.Count - 1;
    else
        index = result.Value - 1;

    var nextNumber = fileNums[index] + 1;

    if (nextNumber >= 0 && nextNumber <= 999999)
        return String.Format("Image_{0:D6}", result.Value);

    return null;
}
c# linq .net-3.5 sequences
4个回答
2
投票

查找第一个间隙的第一个数字的非常简单的方法如下:

int[] existingNumbers = /* extract all numbers from all filenames and order them */
var allNumbers = Enumerable.Range(0, 1000000);
var result = allNumbers.Where(x => !existingNumbers.Contains(x)).First();

如果所有数字均已使用且不存在间隙,则将返回 1,000,000。

这种方法的缺点是它的性能相当糟糕,因为它会迭代

existingNumbers
多次。

更好的方法是使用 Zip:

allNumbers.Zip(existingNumbers, (a, e) => new { Number = a, ExistingNumber = e })
          .Where(x => x.Number != x.ExistingNumber)
          .Select(x => x.Number)
          .First();

DuckMaestro 答案的改进版本实际上返回第一个间隙的第一个值 - 而不是第一个间隙之后的第一个值 - 看起来像这样:

var tmp = existingNumbers.Select((x, i) => new { Index = i, Value = x })
                         .Where(x => x.Index != x.Value)
                         .Select(x => (int?)x.Index)
                         .FirstOrDefault();

int index;
if(tmp == null)
    index = existingNumbers.Length - 1;
else
    index = tmp.Value - 1;

var nextNumber = existingNumbers[index] + 1;

2
投票

改进其他答案,使用

Where
的替代版本。

int[] existingNumbers = ...
var result = existingNumbers.Where( (x,i) => x != i ).FirstOrDefault();

i
是从
0
开始的计数器。

.NET 3.5 支持此版本的

where
(http://msdn.microsoft.com/en-us/library/bb549418(v=vs.90).aspx)。


0
投票

这是一个老问题,但有人建议(在评论中)您可以使用

.Except()
代替。我倾向于更喜欢这个解决方案,因为它会给你第一个缺失的数字(间隙)或序列中下一个最小的数字。这是一个例子:

var allNumbers = Enumerable.Range(0, 999999); //999999 is arbitrary. You could use int.MaxValue, but it would degrade performance
var existingNumbers = new int[] { 0, 1, 2, 4, 5, 6 };

int result;
var missingNumbers = allNumbers.Except(existingNumbers);
if (missingNumbers.Any())
  result = missingNumbers.First();
else //no missing numbers -- you've reached the max
  result = -1;

运行上面的代码会将

result
设置为:

3

此外,如果您将现有号码更改为:

var existingNumbers = new int[] { 0, 1, 3, 2, 4, 5, 6 };

所以没有差距,你会得到 7。

无论如何,这就是为什么我更喜欢 except 而不是 Zip 解决方案——只是我的两分钱。 谢谢!


0
投票
var firstnonexistingfile = Enumerable.Range(0,999999)
  .Select(x => String.Format("Image_{0:D6}.{1}", x, strExt))
  .FirstOrDefault(x => !File.Exists(x));

这将从

0
迭代到
999999
,然后将
String.Format()
的结果输出为
IEnumerable<string>
,然后找到该序列中第一个为
File.Exists()
返回 false 的字符串。

© www.soinside.com 2019 - 2024. All rights reserved.