我有多个文件的索引。这些文件包含以下字段:
我想创建一个elasticsearch dsl查询。对于此查询,有两个输入可用,如adhar_number和pan_number。此查询应与此条件匹配OR条件。
示例:在一个文档中包含提供的aadhaar编号,然后我也想要该文档。
我有一个下面的内容字典(my_dict):
{
"adhar_number": "123456789012",
"pan_number": "BGPPG4315B"
}
我尝试过如下:
from elasticsearch import Elasticsearch
from elasticsearch_dsl import Search
es = Elasticsearch([{'host': 'localhost', 'port': 9200}])
s = Search(using=es, index="my_index")
for key, value in my_dict.items():
s = s.query("match", **{key:value})
print(s.to_dict())
response = s.execute()
print(response.to_dict())
它创建以下查询:
{
'query': {
'bool': {
'must': [
{
'match': {
'adhar_number': '123456789012'
}
},
{
'match': {
'pan_number': 'BGPPG4315B'
}
}
]
}
}
}
上面的代码为我提供了AND条件而不是OR条件的结果。
请建议我包含OR条件的好建议。
要修复ES查询本身,您需要做的就是使用'should'而不是'must':
{
'query': {
'bool': {
'should': [
{
'match': {
'adhar_number': '123456789012'
}
},
{
'match': {
'pan_number': 'BGPPG4315B'
}
}
]
}
}
}
要在python中实现此目的,请参阅the docs中的以下示例。默认逻辑是AND,但您可以将其覆盖为OR,如下所示。
查询组合可以使用逻辑运算符组合查询对象:
Q("match", title='python') | Q("match", title='django') # {"bool": {"should": [...]}} Q("match", title='python') & Q("match", title='django') # {"bool": {"must": [...]}} ~Q("match", title="python") # {"bool": {"must_not": [...]}}
当您多次调用.query()方法时,&运算符将在内部使用:
s = s.query().query() print(s.to_dict()) # {"query": {"bool": {...}}}
如果要对查询表单进行精确控制,请使用Q快捷键直接构造组合查询:
q = Q('bool', must=[Q('match', title='python')], should=[Q(...), Q(...)], minimum_should_match=1 ) s = Search().query(q)
所以你想要类似的东西
q = Q('bool', should=[Q('match', **{key:value})])