Elasticsearch 参考指南(全文查询)

AFei00 2019-06-28

全文查询

高级全文查询通常用于在全文字段(如电子邮件正文)上运行全文查询,它们了解如何分析被查询的字段,并将在执行之前将每个字段的analyzer(或search_analyzer)应用到查询字符串。

本组中的查询为:

match query

  • 执行全文查询的标准查询,包括模糊匹配和短语或接近查询。

match_phrase query

  • 类似于match查询,但用于匹配精确的短语或单词接近匹配。

match_phrase_prefix query

  • match_phrase查询类似,但是在最后一个单词上执行通配符搜索。

multi_match query

  • match查询的多字段版本。

common terms query

  • 一种更专业的查询,它对不常见的词有更多的偏好。

query_string query

  • 支持紧凑的Lucene查询字符串语法,允许你在单个查询字符串中指定AND|OR|NOT条件和多字段搜索,仅适用于专业用户。

simple_query_string query

  • query_string语法的一个更简单、更健壮的版本,适合直接向用户公开。

Match Query

match查询接受文本/数字/日期,分析它们并构造查询,例如:

GET /_search
{
    "query": {
        "match" : {
            "message" : "this is a test"
        }
    }
}

注意,message是字段的名称,你可以替换为任何字段的名称。

match

match查询是boolean类型的,这意味着提供的文本被分析,并且分析过程从提供的文本构造一个布尔查询,operator标志可以设置为orand控制布尔子句(默认为or),可以使用minimum_should_match参数设置要匹配的可选should子句的最小数量。

可以设置analyzer来控制哪个分析器将对文本执行分析过程,它默认为字段显式映射定义或默认搜索分析器。

lenient参数可以设置为true以忽略由数据类型不匹配引起的异常,例如尝试用文本查询字符串查询数值字段,默认值为false

模糊性

fuzziness允许基于被查询的字段类型进行模糊匹配,查看允许设置的模糊性

在这种情况下,可以设置prefix_lengthmax_expansion来控制模糊过程,如果设置了模糊选项,查询将使用top_terms_blended_freqs_${max_expansions}作为其重写方法,fuzzy_rewrite参数允许控制查询如何重写。

模糊互换(abba)在默认情况下都是允许的,但可以通过设置fuzzy_transpositionsfalse禁用。

这里有一个提供额外参数的例子(注意结构的细微变化,message是字段名):

GET /_search
{
    "query": {
        "match" : {
            "message" : {
                "query" : "this is a test",
                "operator" : "and"
            }
        }
    }
}

零条件查询

相关推荐