Как использовать вложенную агрегацию в Elasticsearch?

Я новичок в elasticsearch. Я пишу вложенный dsl с использованием агрегации.

Структура входного документа выглядит примерно так:

   {
        "_source": {
           "id": 1234,
           "oid": 6,

            "education": [
              {
                 "school_name": "Harvard",
                 "city" : "Boston",
                 "year": 1965,
                 "degree": "Undergrad"
              },
              {
                 "school_name": "Harvard",
                 "city" : "Boston",
                 "year": 1975,
                 "degree": "Masters"
              },
              {
                 "school_name": "Harvard",
                 "city" : "Boston",
                 "year": 1958,
                 "degree": "BA"
              }  
           ],
        }
     },

---- Еще записи ... и тд

* Показанный выше документ соответствует одной записи.

Цель: Я пытаюсь узнать всех тех студентов, которые учились в Бостоне. Итак, в идеале, если у меня есть только вышеуказанный документ, я должен получить только 1 запись.

С вложенным запросом агрегации, который я написал ниже, я получаю 3 в счетчике для Бостона.

GET cluster_test/index_test/_search
{
"query": {
 "bool": {
  "must": [
    {
      "term": {
        "oid": {
          "value": "6"
        }
      }
    }
  ]
}
},
 "aggs": {
    "education": {
      "nested": {
        "path": "education"
      },
      "aggs": {
        "edu": {
          "terms": {
            "field": "education.city",
            "size": 0
          }
        }
      }
    }
  }
}         

Если кто-нибудь может указать, где я ошибаюсь, или что лучше решать с такими запросами. Любая помощь приветствуется.


person asang    schedule 20.06.2014    source источник
comment
@javanna Не могли бы вы рассказать мне об этом?   -  person asang    schedule 26.06.2014


Ответы (1)


Вы не должны использовать агрегаты, так как вы хотите отфильтровать студентов, которые учились в желаемом городе. Использование фильтров, как показано ниже, должно помочь.

GET cluster_test/index_test/students/_search
{
"filtered" : {
    "query" : { "match_all" : {} },
    "filter" : {
        "nested" : {
            "path" : "education",
            "filter" : {
                "bool" : {
                    "must" : [
                        {
                            "term" : {"education.city" : "Boston"}
                        }
                    ]
                }
            }
        }
    }
}
person ismet özöztürk    schedule 13.01.2015