区别于不使用LINQ to Objects

问题描述 投票:104回答:7
class Program
{
    static void Main(string[] args)
    {
        List<Book> books = new List<Book> 
        {
            new Book
            {
                Name="C# in Depth",
                Authors = new List<Author>
                {
                    new Author 
                    {
                        FirstName = "Jon", LastName="Skeet"
                    },
                     new Author 
                    {
                        FirstName = "Jon", LastName="Skeet"
                    },                       
                }
            },
            new Book
            {
                Name="LINQ in Action",
                Authors = new List<Author>
                {
                    new Author 
                    {
                        FirstName = "Fabrice", LastName="Marguerie"
                    },
                     new Author 
                    {
                        FirstName = "Steve", LastName="Eichert"
                    },
                     new Author 
                    {
                        FirstName = "Jim", LastName="Wooley"
                    },
                }
            },
        };


        var temp = books.SelectMany(book => book.Authors).Distinct();
        foreach (var author in temp)
        {
            Console.WriteLine(author.FirstName + " " + author.LastName);
        }

        Console.Read();
    }

}
public class Book
{
    public string Name { get; set; }
    public List<Author> Authors { get; set; }
}
public class Author
{
    public string FirstName { get; set; }
    public string LastName { get; set; }
    public override bool Equals(object obj)
    {
        return true;
        //if (obj.GetType() != typeof(Author)) return false;
        //else return ((Author)obj).FirstName == this.FirstName && ((Author)obj).FirstName == this.LastName;
    }

}

这基于“LINQ in Action”中的示例。代码清单4.16

这两次打印Jon Skeet。为什么?我甚至尝试在Author类中重写Equals方法。仍然不同似乎没有用。我错过了什么?

编辑:我也添加了==和!=运算符重载。仍然没有帮助。

 public static bool operator ==(Author a, Author b)
    {
        return true;
    }
    public static bool operator !=(Author a, Author b)
    {
        return false;
    }
c# .net linq iequatable iequalitycomparer
7个回答
141
投票

LINQ Distinct在自定义对象方面并不聪明。

它所做的就是查看你的列表并看到它有两个不同的对象(它们并不关心它们对于成员字段具有相同的值)。

一种解决方法是实现IEquatable接口,如here所示。

如果你像这样修改你的Author类它应该工作。

public class Author : IEquatable<Author>
{
    public string FirstName { get; set; }
    public string LastName { get; set; }

    public bool Equals(Author other)
    {
        if (FirstName == other.FirstName && LastName == other.LastName)
            return true;

        return false;
    }

    public override int GetHashCode()
    {
        int hashFirstName = FirstName == null ? 0 : FirstName.GetHashCode();
        int hashLastName = LastName == null ? 0 : LastName.GetHashCode();

        return hashFirstName ^ hashLastName;
    }
}

Try it as DotNetFiddle


63
投票

Distinct()方法检查引用类型的引用相等性。这意味着它正在寻找重复的相同对象,而不是包含相同值的不同对象。

有一个overload采用IEqualityComparer,因此您可以指定不同的逻辑来确定给定的对象是否等于另一个。

如果希望Author通常表现得像普通对象(即只是引用相等),但为了通过名称值检查相等性,请使用IEqualityComparer。如果您总是希望根据名称值比较Author对象,则覆盖GetHashCode和Equals,或实现IEquatable。

IEqualityComparer界面上的两个成员是EqualsGetHashCode。您确定两个Author对象是否相等的逻辑似乎是First和Last名称字符串是否相同。

public class AuthorEquals : IEqualityComparer<Author>
{
    public bool Equals(Author left, Author right)
    {
        if((object)left == null && (object)right == null)
        {
            return true;
        }
        if((object)left == null || (object)right == null)
        {
            return false;
        }
        return left.FirstName == right.FirstName && left.LastName == right.LastName;
    }

    public int GetHashCode(Author author)
    {
        return (author.FirstName + author.LastName).GetHashCode();
    }
}

41
投票

没有实现IEquatableEqualsGetHashCode的另一个解决方案是使用LINQs GroupBy方法并从IGrouping中选择第一个项目。

var temp = books.SelectMany(book => book.Authors)
                .GroupBy (y => y.FirstName + y.LastName )
                .Select (y => y.First ());

foreach (var author in temp){
  Console.WriteLine(author.FirstName + " " + author.LastName);
}

23
投票

还有一种方法可以从用户定义的数据类型列表中获取不同的值:

YourList.GroupBy(i => i.Id).Select(i => i.FirstOrDefault()).ToList();

当然,它会提供不同的数据集


20
投票

Distinct()对可枚举中的对象执行默认的相等比较。如果你还没有覆盖Equals()GetHashCode(),那么它会使用object上的默认实现,它会比较引用。

简单的解决方案是将Equals()GetHashCode()的正确实现添加到参与您正在比较的对象图(即Book和Author)的所有类中。

IEqualityComparer界面是一种便利,当你无法访问需要比较的类的内部,或者你使用不同的比较方法时,它允许你在一个单独的类中实现Equals()GetHashCode()


10
投票

你已经覆盖了Equals(),但要确保你也覆盖了GetHashCode()


7
投票

以上答案都是错误的! MSDN上声明的区别是返回默认的Equator,如上所述,Default属性检查类型T是否实现System.IEquatable接口,如果是,则返回使用该实现的EqualityComparer。否则,它返回一个EqualityComparer,它使用由T提供的Object.Equals和Object.GetHashCode的覆盖。

这意味着只要你重写等于你就可以了。

您的代码无效的原因是您检查firstname == lastname。

看看https://msdn.microsoft.com/library/bb348436(v=vs.100).aspxhttps://msdn.microsoft.com/en-us/library/ms224763(v=vs.100).aspx

© www.soinside.com 2019 - 2024. All rights reserved.