实现自定义Int +范围列表解决方案

问题描述 投票:2回答:1

我想知道是否有人能想出一种方法来以更高效的内存方式实现数组,这种方式会自动组织成范围。例;

List testList = new List{1,2,3,4,5,6,7...};

VS

List<Range> testList = new List<Range>{1-3000,3002,4000-5000...};

在此之前,我已经提出一个问题,只是为了确认这是否实际上是一个更有效的内存替代方案。然而,这个问题与实际应用有关,如何实现这个范围列表解决方案。

Index Array Storage Memory

我想这可能需要一个自定义列表解决方案,它将是一个整体和范围的混合。我想象能够.Add([int])到列表,此时它将确定该值是否会导致添加范围或者只是将int值添加到列表中。

RangeList rangeList = new RangeList{1, 4, 7-9};
rangeList.Add(2);
//rangeList -> 1-2, 4, 7-9
rangeList.Add(3);
//rangeList -> 1-3, 4, 7-9

具体到我的实施细节

在我的特殊情况下,我正在逐行分析一个非常大的文档。需要识别满足特定标准的行,然后需要向用户呈现整个行索引列表。

显然,显示“33-32019行标识”优于“33,34,35行......等”。对于这种情况,数字将始终为正数。

c# list range
1个回答
3
投票

我要做的第一件事是创建一个代表你的范围的类。您可以提供一些方便,例如格式化为字符串,以及从int进行隐式转换(这有助于稍后实现范围列表)

public class Range
{
    public int Start{get; private set;}
    public int End{get; private set;}

    public Range(int startEnd) : this(startEnd,startEnd)
    {           
    }

     public Range(int start, int end)
     {
        this.Start = start;
        this.End = end;
     }

    public static implicit operator Range(int i)
    {
        return new Range(i);
    }

    public override string ToString()
    {
        if(Start == End)
            return Start.ToString();
        return String.Format("{0}-{1}",Start,End);
    }
}

然后,您可以开始RangeList的简单实现。通过提供Add方法,您可以使用类似于List<T>的列表初始化器:

public class RangeList : IEnumerable<Range>
{
    private List<Range> ranges = new List<Range>();

    public void Add(Range range)
    {
        this.ranges.Add(range);
    }

    public IEnumerator<Range> GetEnumerator()
    {
        return this.ranges.GetEnumerator();
    }

    IEnumerator IEnumerable.GetEnumerator(){
        return this.GetEnumerator();
    }
}

此时您可以编写一些测试代码:

var rangeList = new RangeList(){
    new Range(1,10),
    15
};

foreach(var range in rangeList)
    Console.WriteLine(range);

// Outputs:
//  1-10
//  15

此时的实例:http://rextester.com/NCZSA71850

接下来要做的是提供Add的重载,它接受一个int并找到正确的范围或添加一个新的。一个天真的实现可能如下所示(假设在范围上添加了Update方法)

public void Add(int i)
{
    // is it within or contiguous to an existing range
    foreach(var range in ranges)
    {
        if(i>=range.Start && i<=range.End)
            return; // already in a range
        if(i == range.Start-1)
        {
            range.Update(i,range.End);
            return;
        }
        if(i == range.End + 1)
        {
            range.Update(range.Start,i);
            return;
        }
    }
    // not in any ranges
    ranges.Add(i);
}

此时的实例:http://rextester.com/CHX64125

然而,这有一些缺陷

  1. 不合并范围(比如你已经有1-10和12-20而你Add(11)
  2. 没有重新订购,所以如果你有1-5和20-25和Add(7)这将是在最后而不是在中间。

您可以通过在每次添加后应用排序来解决这两个问题,并使用一些逻辑来确定是否应合并范围

private void SortAndMerge()
{
    ranges.Sort((a,b) => a.Start - b.Start);
    var i = ranges.Count-1;
    do
    {
        var start = ranges[i].Start;
        var end = ranges[i-1].End;
        if(end == start-1)
        {
            // merge and remove
            ranges[i-1].Update(ranges[i-1].Start,ranges[i].End);
            ranges.RemoveAt(i);
        }
    } while(i-- >1);
}

每次更改列表后都需要调用它。

public void Add(Range range)
{
    this.ranges.Add(range);
    SortAndMerge();
}

public void Add(int value)
{
    // is it within or contiguous to an existing range
    foreach(var range in ranges)
    {
        if(value>=range.Start && value<=range.End)
            return; // already in a range
        if(value == range.Start-1)
        {
            range.Update(value,range.End);
            SortAndMerge();
            return;
        }
        if(value == range.End + 1)
        {
            range.Update(range.Start,value);
            SortAndMerge();
            return;
        }
    }
    // not in any ranges
    ranges.Add(value);
    SortAndMerge();
}

这里的实例:http://rextester.com/SYLARF47057

还有一些可能的边缘情况,我敦促你解决。

UPDATE

以下将使此工作按预期工作。这将合并任何添加的范围/整数,并按正常方式返回它们。我只更改了Add(Range)方法,我认为这是一种相当干净的方法。

public void Add(Range rangeToAdd)
{
    var mergableRange = new List<Range>();
    foreach (var range in ranges)
    {
        if (rangeToAdd.Start == range.Start && rangeToAdd.End == range.End)
            return; // already exists

        if (mergableRange.Any())
        {
            if (rangeToAdd.End >= range.Start - 1)
            {
                mergableRange.Add(range);
                continue;
            }
        }
        else
        {
            if (rangeToAdd.Start >= range.Start - 1
                && rangeToAdd.Start <= range.End + 1)
            {
                mergableRange.Add(range);
                continue;
            }

            if (range.Start >= rangeToAdd.Start
                && range.End <= rangeToAdd.End)
            {
                mergableRange.Add(range);
                continue;
            }
        }
    }

    if (!mergableRange.Any()) //Standalone range
    {
        ranges.Add(rangeToAdd);
    }
    else //merge overlapping ranges
    {
        mergableRange.Add(rangeToAdd);
        var min = mergableRange.Min(x => x.Start);
        var max = mergableRange.Max(x => x.End);
        foreach (var range in mergableRange) ranges.Remove(range);
        ranges.Add(new Range(min, max));
    }

    SortAndMerge();
}

最后,我们需要在if (ranges.Count > 1)方法中使用SortAndMerge()来防止在添加第一个范围时出现索引错误。

有了这个,我认为这完全满足了我的问题。

© www.soinside.com 2019 - 2024. All rights reserved.