使用 linq 删除列表中的重复项

问题描述 投票:0回答:11

我和

Items
一起上课
properties (Id, Name, Code, Price)

Items
的列表中填充有重复的项目。

例如:

1         Item1       IT00001        $100
2         Item2       IT00002        $200
3         Item3       IT00003        $150
1         Item1       IT00001        $100
3         Item3       IT00003        $150

如何使用linq删除列表中的重复项?

c# linq linq-to-objects generic-list
11个回答
741
投票
var distinctItems = items.GroupBy(x => x.Id).Select(y => y.First());

455
投票
var distinctItems = items.Distinct();

要仅匹配某些属性,请创建自定义相等比较器,例如:

class DistinctItemComparer : IEqualityComparer<Item> {

    public bool Equals(Item x, Item y) {
        return x.Id == y.Id &&
            x.Name == y.Name &&
            x.Code == y.Code &&
            x.Price == y.Price;
    }

    public int GetHashCode(Item obj) {
        return obj.Id.GetHashCode() ^
            obj.Name.GetHashCode() ^
            obj.Code.GetHashCode() ^
            obj.Price.GetHashCode();
    }
}

然后像这样使用它:

var distinctItems = items.Distinct(new DistinctItemComparer());

47
投票

如果有某些东西无法满足您的 Distinct 查询,您可能需要查看 MoreLinq 并使用 DistinctBy 运算符并按 id 选择不同的对象。

var distinct = items.DistinctBy( i => i.Id );

34
投票

这就是我能够使用 Linq 进行分组的方式。希望有帮助。

var query = collection.GroupBy(x => x.title).Select(y => y.FirstOrDefault());

28
投票

通用的扩展方法:

public static class EnumerableExtensions
{
    public static IEnumerable<T> DistinctBy<T, TKey>(this IEnumerable<T> enumerable, Func<T, TKey> keySelector)
    {
        return enumerable.GroupBy(keySelector).Select(grp => grp.First());
    }
}

使用示例:

var lstDst = lst.DistinctBy(item => item.Key);

20
投票

您可以使用三个选项来删除列表中的重复项目:

  1. 使用自定义相等比较器,然后使用
    Distinct(new DistinctItemComparer())
    ,如提到的@Christian Hayter
  2. 使用

    GroupBy
    ,但请注意,在
    GroupBy
    中,您应该按所有列进行分组,因为如果您仅按
    Id
    分组,它不会始终删除重复的项目。例如,考虑以下示例:

    List<Item> a = new List<Item>
    {
        new Item {Id = 1, Name = "Item1", Code = "IT00001", Price = 100},
        new Item {Id = 2, Name = "Item2", Code = "IT00002", Price = 200},
        new Item {Id = 3, Name = "Item3", Code = "IT00003", Price = 150},
        new Item {Id = 1, Name = "Item1", Code = "IT00001", Price = 100},
        new Item {Id = 3, Name = "Item3", Code = "IT00003", Price = 150},
        new Item {Id = 3, Name = "Item3", Code = "IT00004", Price = 250}
    };
    var distinctItems = a.GroupBy(x => x.Id).Select(y => y.First());
    

    该分组的结果将是:

    {Id = 1, Name = "Item1", Code = "IT00001", Price = 100}
    {Id = 2, Name = "Item2", Code = "IT00002", Price = 200}
    {Id = 3, Name = "Item3", Code = "IT00003", Price = 150}
    

    这是不正确的,因为它认为

    {Id = 3, Name = "Item3", Code = "IT00004", Price = 250}
    是重复的。所以正确的查询是:

    var distinctItems = a.GroupBy(c => new { c.Id , c.Name , c.Code , c.Price})
                         .Select(c => c.First()).ToList();
    

    3.覆盖项目类别中的

    Equal
    GetHashCode

    public class Item
    {
        public int Id { get; set; }
        public string Name { get; set; }
        public string Code { get; set; }
        public int Price { get; set; }
    
        public override bool Equals(object obj)
        {
            if (!(obj is Item))
                return false;
            Item p = (Item)obj;
            return (p.Id == Id && p.Name == Name && p.Code == Code && p.Price == Price);
        }
        public override int GetHashCode()
        {
            return String.Format("{0}|{1}|{2}|{3}", Id, Name, Code, Price).GetHashCode();
        }
    }
    

    然后你可以像这样使用它:

    var distinctItems = a.Distinct();
    

17
投票

使用

Distinct()
但请记住,它使用默认的相等比较器来比较值,因此如果您想要除此之外的任何内容,您需要实现自己的比较器。

请参阅 http://msdn.microsoft.com/en-us/library/bb348436.aspx 有关示例。


6
投票

尝试一下这个扩展方法。希望这能有所帮助。

public static class DistinctHelper
{
    public static IEnumerable<TSource> DistinctBy<TSource, TKey>(this IEnumerable<TSource> source, Func<TSource, TKey> keySelector)
    {
        var identifiedKeys = new HashSet<TKey>();
        return source.Where(element => identifiedKeys.Add(keySelector(element)));
    }
}

用途:

var outputList = sourceList.DistinctBy(x => x.TargetProperty);

4
投票
List<Employee> employees = new List<Employee>()
{
    new Employee{Id =1,Name="AAAAA"}
    , new Employee{Id =2,Name="BBBBB"}
    , new Employee{Id =3,Name="AAAAA"}
    , new Employee{Id =4,Name="CCCCC"}
    , new Employee{Id =5,Name="AAAAA"}
};

List<Employee> duplicateEmployees = employees.Except(employees.GroupBy(i => i.Name)
                                             .Select(ss => ss.FirstOrDefault()))
                                            .ToList();

0
投票

另一种解决方法,不美观但有效。

我有一个 XML 文件,其中包含一个名为“MEMDES”的元素,具有两个属性“GRADE”和“SPD”来记录 RAM 模块信息。 SPD中有很多重复的项目。

所以这是我用来删除重复项的代码:

IEnumerable<XElement> MList =
    from RAMList in PREF.Descendants("MEMDES")
    where (string)RAMList.Attribute("GRADE") == "DDR4"
    select RAMList;

List<string> sellist = new List<string>();

foreach (var MEMList in MList)
{
    sellist.Add((string)MEMList.Attribute("SPD").Value);
}

foreach (string slist in sellist.Distinct())
{
    comboBox1.Items.Add(slist);
}

-1
投票

当您不想编写 IEqualityComparer 时,您可以尝试以下操作。

 class Program
{

    private static void Main(string[] args)
    {

        var items = new List<Item>();
        items.Add(new Item {Id = 1, Name = "Item1"});
        items.Add(new Item {Id = 2, Name = "Item2"});
        items.Add(new Item {Id = 3, Name = "Item3"});

        //Duplicate item
        items.Add(new Item {Id = 4, Name = "Item4"});
        //Duplicate item
        items.Add(new Item {Id = 2, Name = "Item2"});

        items.Add(new Item {Id = 3, Name = "Item3"});

        var res = items.Select(i => new {i.Id, i.Name})
            .Distinct().Select(x => new Item {Id = x.Id, Name = x.Name}).ToList();

        // now res contains distinct records
    }



}


public class Item
{
    public int Id { get; set; }

    public string Name { get; set; }
}
© www.soinside.com 2019 - 2024. All rights reserved.