ElasticSearch电子邮件地址,带有特殊字符,例如@

问题描述 投票:0回答:1

我正在使用ElasticSearch v6.8和NEST客户端,编写C#代码。我正在使用流利的贴图。

我正在为电子邮件字段建立索引,因此可以通过搜索其电子邮件地址来找到用户。标准分析器无法正常工作,然后我使用uax_url_email标记程序继续阅读。我插入了它,它比标准分析器更好,但是我仍然无法使用@字符或'。'进行搜索。字符。示例:键入“ firstname”将获得匹配项。输入的“名字@”不匹配。输入“ firstname.lastname”也不匹配。

我做错了什么?我假设uax_url_email标记生成器将处理此问题。我改用NGram,然后它可以工作,但是对于现有的内置电子邮件分析器不处理@符号和类似符号似乎有点奇怪。

这是我的字段映射(这是一个纯字符串):

 .Map<UserSearchEntity>(
                        m => m
                            .AutoMap()
                            .Properties(p => p
                                .Text(t => t
                                    .Name(n => n.Email)
                                    .Analyzer("user_email_analyzer")))

分析器先前已经使用uax_url_email令牌生成器进行了注册。

c# elasticsearch nest
1个回答
0
投票

这里是一个简单的应用程序,显示uax_url_email令牌生成器的用法。

{
    var createIndexResponse = await client.CreateIndexAsync("my_index", c => c
        .Settings(s => s.Analysis(a => a
            .Analyzers(an => an.Custom("my_analyzer", cu => cu.Tokenizer("my_tokenizer")))
            .Tokenizers(t => t.UaxEmailUrl("my_tokenizer", u => u.MaxTokenLength(3)))))
        .Mappings(m => m
            .Map<Document>(map => map
                .Properties(p => p.Text(t => t.Name(n => n.Email).Analyzer("my_analyzer"))))));

    var indexResponse = await client.IndexAsync(new Document {Id = "1", Email = "[email protected]"},
        i => i.Refresh(Refresh.WaitFor));

    await Search(client, "robert.lyson");
    await Search(client, "robert");
    await Search(client, "lyson");
    await Search(client, "@domain.com");
    await Search(client, "domain.com");
    await Search(client, "rob");
}

private static async Task Search(ElasticClient client, string query)
{
    var searchResponse = await client.SearchAsync<Document>(s => s
        .Query(q => q.Match(m => m.Field(f => f.Email).Query(query))));

    System.Console.WriteLine($"result for query \"{query}\": {string.Join(",", searchResponse.Documents.Select(x => x.Email))}");
}

public class Document
{
    public string Id { get; set; }
    public string Email { get; set; }
}

输出:

result for query "robert.lyson": [email protected]
result for query "robert": [email protected]
result for query "lyson": [email protected]
result for query "@domain.com": [email protected]
result for query "domain.com": [email protected]
result for query "rob": [email protected]

使用elasticsearch 6.8.0和NEST 6.8.x测试。

希望有所帮助。

© www.soinside.com 2019 - 2024. All rights reserved.