Rails模型中不区分大小写的搜索

问题描述 投票:201回答:19

我的产品型号包含一些商品

 Product.first
 => #<Product id: 10, name: "Blue jeans" >

我现在从另一个数据集导入一些产品参数,但名称的拼写有不一致之处。例如,在另一个数据集中,Blue jeans可以拼写为Blue Jeans

我想要Product.find_or_create_by_name("Blue Jeans"),但这将创造一个新产品,几乎与第一个相同。如果我想找到并比较小写的名字,我有什么选择。

性能问题在这里并不重要:只有100-200个产品,我想将其作为导入数据的迁移来运行。

有任何想法吗?

ruby-on-rails activerecord case-insensitive
19个回答
343
投票

你可能必须在这里更加冗长

name = "Blue Jeans"
model = Product.where('lower(name) = ?', name.downcase).first 
model ||= Product.create(:name => name)

4
投票

现在不推荐使用Find_or_create,您应该使用AR Relation而不是first_or_create,如下所示:

TombolaEntry.where("lower(name) = ?", self.name.downcase).first_or_create(name: self.name)

这将返回第一个匹配的对象,或者如果不存在则为您创建一个。


2
投票

不区分大小写的搜索内置于Rails中。它解释了数据库实现的差异。使用the built-in Arel library, or a gem like Squeel


2
投票

这里有很多很棒的答案,尤其是@ oma's。但您可以尝试的另一件事是使用自定义列序列化。如果您不介意在数据库中存储小写的所有内容,那么您可以创建:

# lib/serializers/downcasing_string_serializer.rb
module Serializers
  class DowncasingStringSerializer
    def self.load(value)
      value
    end

    def self.dump(value)
      value.downcase
    end
  end
end

然后在你的模型中:

# app/models/my_model.rb
serialize :name, Serializers::DowncasingStringSerializer
validates_uniqueness_of :name, :case_sensitive => false

这种方法的好处是,您仍然可以使用所有常规查找程序(包括find_or_create_by),而无需在查询中使用自定义作用域,函数或lower(name) = ?

缺点是您丢失了数据库中的套管信息。


1
投票

您也可以使用下面这样的范围并将它们放在一个问题中并包含在您可能需要它们的模型中:

scope :ci_find, lambda { |column, value| where("lower(#{column}) = ?", value.downcase).first }

然后像这样使用:Model.ci_find('column', 'value')


0
投票

假设您使用mysql,您可以使用不区分大小写的字段:http://dev.mysql.com/doc/refman/5.0/en/case-sensitivity.html


0
投票
user = Product.where(email: /^#{email}$/i).first

0
投票

有些人使用LIKE或ILIKE显示,但那些允许正则表达式搜索。你也不需要在Ruby中使用downcase。您可以让数据库为您执行此操作。我认为它可能会更快。 first_or_create也可以在where之后使用。

# app/models/product.rb
class Product < ActiveRecord::Base

  # case insensitive name
  def self.ci_name(text)
    where("lower(name) = lower(?)", text)
  end
end

# first_or_create can be used after a where clause
Product.ci_name("Blue Jeans").first_or_create
# Product Load (1.2ms)  SELECT  "products".* FROM "products"  WHERE (lower(name) = lower('Blue Jeans'))  ORDER BY "products"."id" ASC LIMIT 1
# => #<Product id: 1, name: "Blue jeans", created_at: "2016-03-27 01:41:45", updated_at: "2016-03-27 01:41:45"> 

0
投票

类似于安德鲁斯,#1:

对我有用的东西是:

name = "Blue Jeans"
Product.find_by("lower(name) = ?", name.downcase)

这消除了在同一查询中执行#where#first的需要。希望这可以帮助!


0
投票

另一种选择可以

c = Product.find_by("LOWER(name)= ?", name.downcase)

-9
投票

到目前为止,我使用Ruby制作了一个解决方案。将其放在产品型号中:

  #return first of matching products (id only to minimize memory consumption)
  def self.custom_find_by_name(product_name)
    @@product_names ||= Product.all(:select=>'id, name')
    @@product_names.select{|p| p.name.downcase == product_name.downcase}.first
  end

  #remember a way to flush finder cache in case you run this from console
  def self.flush_custom_finder_cache!
    @@product_names = nil
  end

这将是我第一个名字匹配的产品。或者没有。

>> Product.create(:name => "Blue jeans")
=> #<Product id: 303, name: "Blue jeans">

>> Product.custom_find_by_name("Blue Jeans")
=> nil

>> Product.flush_custom_finder_cache!
=> nil

>> Product.custom_find_by_name("Blue Jeans")
=> #<Product id: 303, name: "Blue jeans">
>>
>> #SUCCESS! I found you :)

97
投票

这是Rails中的完整设置,供我自己参考。如果它对你有帮助我很高兴。

查询:

Product.where("lower(name) = ?", name.downcase).first

验证者:

validates :name, presence: true, uniqueness: {case_sensitive: false}

该指数(来自Case-insensitive unique index in Rails/ActiveRecord?的回答):

execute "CREATE UNIQUE INDEX index_products_on_lower_name ON products USING btree (lower(name));"

我希望有一个更美好的方式来做第一个和最后一个,但是再一次,Rails和ActiveRecord是开源的,我们不应该抱怨 - 我们可以自己实现它并发送pull请求。


22
投票

如果您使用Postgres和Rails 4+,那么您可以选择使用列类型CITEXT,这将允许不区分大小写的查询而无需写出查询逻辑。

迁移:

def change
  enable_extension :citext
  change_column :products, :name, :citext
  add_index :products, :name, unique: true # If you want to index the product names
end

要测试它你应该期望以下:

Product.create! name: 'jOgGers'
=> #<Product id: 1, name: "jOgGers">

Product.find_by(name: 'joggers')
=> #<Product id: 1, name: "jOgGers">

Product.find_by(name: 'JOGGERS')
=> #<Product id: 1, name: "jOgGers">

21
投票

您可能想要使用以下内容:

validates_uniqueness_of :name, :case_sensitive => false

请注意,默认设置为:case_sensitive => false,因此如果您没有更改其他方式,则甚至不需要编写此选项。

有关更多信息,请访问:http://api.rubyonrails.org/classes/ActiveRecord/Validations/ClassMethods.html#method-i-validates_uniqueness_of


13
投票

在postgres:

 user = User.find(:first, :conditions => ['username ~* ?', "regedarek"])

9
投票

引自SQLite documentation

任何其他字符匹配自身或其大小写等效(即不区分大小写的匹配)

......我不知道。但它有效:

sqlite> create table products (name string);
sqlite> insert into products values ("Blue jeans");
sqlite> select * from products where name = 'Blue Jeans';
sqlite> select * from products where name like 'Blue Jeans';
Blue jeans

所以你可以这样做:

name = 'Blue jeans'
if prod = Product.find(:conditions => ['name LIKE ?', name])
    # update product or whatever
else
    prod = Product.create(:name => name)
end

我知道,不是#find_or_create,它可能不是非常跨数据库友好,但值得一看?


8
投票

有几条评论提到了Arel,没有提供一个例子。

以下是不区分大小写搜索的Arel示例:

Product.where(Product.arel_table[:name].matches('Blue Jeans'))

这种解决方案的优点是它与数据库无关 - 它将为您当前的适配器使用正确的SQL命令(matches将使用ILIKE用于Postgres,而LIKE用于其他所有)。


6
投票

大写和小写字母仅相差一位。搜索它们的最有效方法是忽略这一点,而不是转换为低位或高位等。请参阅关键字COLLATION for MSSQL,如果使用Oracle,请参阅NLS_SORT=BINARY_CI等。


5
投票

没有人提到的另一种方法是将不区分大小写的查找器添加到ActiveRecord :: Base中。细节可以找到here。这种方法的优点是您不必修改每个模型,并且您不必将lower()子句添加到所有不区分大小写的查询中,而只需使用不同的finder方法。

© www.soinside.com 2019 - 2024. All rights reserved.