Linq to Entities,随机顺序

问题描述 投票:0回答:13

如何以随机顺序返回匹配的实体?
需要明确的是,这是实体框架的内容和 LINQ to Entities。

(航空代码)

IEnumerable<MyEntity> results = from en in context.MyEntity
                                where en.type == myTypeVar
                                orderby ?????
                                select en;

谢谢

编辑:
我尝试将其添加到上下文中:

public Guid Random()
{
    return new Guid();
}

并使用此查询:

IEnumerable<MyEntity> results = from en in context.MyEntity
                                where en.type == myTypeVar
                                orderby context.Random()
                                select en;

但是我收到了这个错误:

System.NotSupportedException: LINQ to Entities does not recognize the method 'System.Guid Random()' method, and this method cannot be translated into a store expression..

编辑(当前代码):

IEnumerable<MyEntity> results = (from en in context.MyEntity
                                 where en.type == myTypeVar
                                 orderby context.Random()
                                 select en).AsEnumerable();
c# entity-framework linq-to-entities
13个回答
55
投票

执行此操作的一个简单方法是按

Guid.NewGuid()
进行排序,但排序发生在客户端。您也许能够说服 EF 在服务器端随机执行某些操作,但这并不一定简单 - 使用“按随机数排序”显然已损坏

要使排序发生在 .NET 端而不是在 EF 中,您需要

AsEnumerable
:

IEnumerable<MyEntity> results = context.MyEntity
                                       .Where(en => en.type == myTypeVar)
                                       .AsEnumerable()
                                       .OrderBy(en => context.Random());

最好在列表中获取无序版本,然后对其进行洗牌。

Random rnd = ...; // Assume a suitable Random instance
List<MyEntity> results = context.MyEntity
                                .Where(en => en.type == myTypeVar)
                                .ToList();

results.Shuffle(rnd); // Assuming an extension method on List<T>

抛开其他不说,洗牌比排序更有效。 有关获取适当的 Random 实例的详细信息,请参阅我的

关于随机性的文章
。 Stack Overflow 上有很多 Fisher-Yates shuffle 实现。


42
投票

Jon 的回答很有帮助,但实际上您可以让数据库使用

Guid
和 Linq to Entities 进行排序(至少,您可以在 EF4 中):

from e in MyEntities
orderby Guid.NewGuid()
select e

这会生成类似于以下的 SQL:

SELECT
[Project1].[Id] AS [Id], 
[Project1].[Column1] AS [Column1]
FROM ( SELECT 
    NEWID() AS [C1],                     -- Guid created here
    [Extent1].[Id] AS [Id], 
    [Extent1].[Column1] AS [Column1],
    FROM [dbo].[MyEntities] AS [Extent1]
)  AS [Project1]
ORDER BY [Project1].[C1] ASC             -- Used for sorting here

在我的测试中,在生成的查询上使用

Take(10)
(在 SQL 中转换为
TOP 10
),查询针对具有 1,794,785 行的表持续运行在 0.42 到 0.46 秒之间。不知道 SQL Server 是否对此进行了任何类型的优化,也不知道它是否为该表中的每个行生成了一个 GUID。无论哪种方式,这都比将所有这些行放入我的流程并尝试在那里对它们进行排序要快得多。


30
投票

简单的解决方案是创建一个数组(或

List<T>
),然后随机化其索引。

编辑:

static IEnumerable<T> Randomize<T>(this IEnumerable<T> source) {
  var array = source.ToArray();
  // randomize indexes (several approaches are possible)
  return array;
}

编辑:就个人而言,我发现 Jon Skeet 的答案更优雅:

var results = from ... in ... where ... orderby Guid.NewGuid() select ...

当然,您可以使用随机数生成器来代替

Guid.NewGuid()


4
投票

不幸的是,用于在服务器端对其进行排序的

NewGuid
黑客会导致实体在连接(或急切获取包含)的情况下重复。

有关此问题,请参阅此问题

为了解决这个问题,您可以在某些唯一值计算服务器端使用 sql

NewGuid
来代替
checksum
,并在客户端计算一次随机种子以将其随机化。请参阅之前链接问题的我的回答


2
投票

此处提供的解决方案在客户端上执行。如果您想要在服务器上执行某些内容,这里有一个 LINQ to SQL 的解决方案,您可以将其转换为实体框架。


1
投票

lolo_house 有一个非常简洁、简单且通用的解决方案。您只需将代码放在单独的静态类中即可使其工作。

using System;
using System.Collections.Generic;
using System.Linq;

namespace SpanishDrills.Utilities
{
    public static class LinqHelper
    {
        public static IEnumerable<T> Randomize<T>(this IEnumerable<T> pCol)
        {
            List<T> lResultado = new List<T>();
            List<T> lLista = pCol.ToList();
            Random lRandom = new Random();
            int lintPos = 0;

            while (lLista.Count > 0)
            {
                lintPos = lRandom.Next(lLista.Count);
                lResultado.Add(lLista[lintPos]);
                lLista.RemoveAt(lintPos);
            }

            return lResultado;
        }
    }
}

然后使用代码即可:

var randomizeQuery = Query.Randomize();

就这么简单!谢谢lolo_house。


0
投票

这个怎么样:


    var randomizer = new Random();
    var results = from en in context.MyEntity
                  where en.type == myTypeVar
                  let rand = randomizer.Next()
                  orderby rand
                  select en;


0
投票

Toro 的答案是我会使用的答案,但就像这样:

static IEnumerable<T> Randomize<T>(this IEnumerable<T> source)
{
  var list = source.ToList();
  var newList = new List<T>();

  while (source.Count > 0)
  {
     //choose random one and MOVE it from list to newList
  }

  return newList;
}

0
投票

这是一个很好的方法(主要用于谷歌搜索)。

您还可以在末尾添加 .Take(n) 以仅检索一组数字。

model.CreateQuery<MyEntity>(   
    @"select value source.entity  
      from (select entity, SqlServer.NewID() as rand  
            from Products as entity 
            where entity.type == myTypeVar) as source  
            order by source.rand");

0
投票

我认为最好不要向类添加属性。更好地使用该位置:

public static IEnumerable<T> Randomize<T>(this IEnumerable<T> pCol)
    {
        List<T> lResultado = new List<T>();
        List<T> lLista = pCol.ToList();
        Random lRandom = new Random();
        int lintPos = 0;

        while (lLista.Count > 0)
        {
            lintPos = lRandom.Next(lLista.Count);
            lResultado.Add(lLista[lintPos]);
            lLista.RemoveAt(lintPos);
        }

        return lResultado;
    }

调用将(如 toList() 或 toArray()):

var 结果 = IEnumerable.Where(..).Randomize();


0
投票

(来自 EF Code First:如何获取随机行的交叉发布)

比较两个选项:


跳过(随机行数)

方法

private T getRandomEntity<T>(IGenericRepository<T> repo) where T : EntityWithPk<Guid> {
    var skip = (int)(rand.NextDouble() * repo.Items.Count());
    return repo.Items.OrderBy(o => o.ID).Skip(skip).Take(1).First();
}
  • 接受 2 次查询

生成的SQL

SELECT [GroupBy1].[A1] AS [C1]
FROM   (SELECT COUNT(1) AS [A1]
        FROM   [dbo].[People] AS [Extent1]) AS [GroupBy1];

SELECT TOP (1) [Extent1].[ID]            AS [ID],
               [Extent1].[Name]          AS [Name],
               [Extent1].[Age]           AS [Age],
               [Extent1].[FavoriteColor] AS [FavoriteColor]
FROM   (SELECT [Extent1].[ID]                                  AS [ID],
               [Extent1].[Name]                                AS [Name],
               [Extent1].[Age]                                 AS [Age],
               [Extent1].[FavoriteColor]                       AS [FavoriteColor],
               row_number() OVER (ORDER BY [Extent1].[ID] ASC) AS [row_number]
        FROM   [dbo].[People] AS [Extent1]) AS [Extent1]
WHERE  [Extent1].[row_number] > 15
ORDER  BY [Extent1].[ID] ASC;

指导

方法

private T getRandomEntityInPlace<T>(IGenericRepository<T> repo) {
    return repo.Items.OrderBy(o => Guid.NewGuid()).First();
}

生成的SQL

SELECT TOP (1) [Project1].[ID]            AS [ID],
               [Project1].[Name]          AS [Name],
               [Project1].[Age]           AS [Age],
               [Project1].[FavoriteColor] AS [FavoriteColor]
FROM   (SELECT NEWID()                   AS [C1],
               [Extent1].[ID]            AS [ID],
               [Extent1].[Name]          AS [Name],
               [Extent1].[Age]           AS [Age],
               [Extent1].[FavoriteColor] AS [FavoriteColor]
        FROM   [dbo].[People] AS [Extent1]) AS [Project1]
ORDER  BY [Project1].[C1] ASC

因此,在较新的 EF 中,您可以再次看到

NewGuid
被翻译为 SQL(由 @DrewNoakes 确认https://stackoverflow.com/a/4120132/1037948)。尽管两者都是“in-sql”方法,但我猜 Guid 版本更快?如果您不必为了跳过而对它们进行排序,并且您可以合理地猜测要跳过的数量,那么也许 Skip 方法会更好。


0
投票

Entity Framework Core 6+ 新增了一个功能:

EF.Functions.Random()

context.MyEntity
.Where(en => en.type == myTypeVar)
.OrderBy(en => EF.Functions.Random());

from en in context.MyEntity
where en.type == myTypeVar
orderby EF.Functions.Random()
select en;

这种方法的优点是它使用数据库引擎的内部功能和单个查询。最终微软为大多数数据库实现了它。

参见https://github.com/dotnet/efcore/issues/16141#issuecomment-666641607


-1
投票

从理论上讲(我还没有实际尝试过),以下应该可以解决问题:

将分部类添加到您的上下文类中:

public partial class MyDataContext{

        [Function(Name = "NEWID", IsComposable = true)] 
        public Guid Random()
        { 
            // you can put anything you want here, it makes no difference 
            throw new NotImplementedException();
        }
}

实施:

from t in context.MyTable
orderby  context.Random()
select t; 
© www.soinside.com 2019 - 2024. All rights reserved.