Я новичок в elasticsearch. Я пишу вложенный dsl с использованием агрегации.
Структура входного документа выглядит примерно так:
{
"_source": {
"id": 1234,
"oid": 6,
"education": [
{
"school_name": "Harvard",
"city" : "Boston",
"year": 1965,
"degree": "Undergrad"
},
{
"school_name": "Harvard",
"city" : "Boston",
"year": 1975,
"degree": "Masters"
},
{
"school_name": "Harvard",
"city" : "Boston",
"year": 1958,
"degree": "BA"
}
],
}
},
---- Еще записи ... и тд
* Показанный выше документ соответствует одной записи.
Цель: Я пытаюсь узнать всех тех студентов, которые учились в Бостоне. Итак, в идеале, если у меня есть только вышеуказанный документ, я должен получить только 1 запись.
С вложенным запросом агрегации, который я написал ниже, я получаю 3 в счетчике для Бостона.
GET cluster_test/index_test/_search
{
"query": {
"bool": {
"must": [
{
"term": {
"oid": {
"value": "6"
}
}
}
]
}
},
"aggs": {
"education": {
"nested": {
"path": "education"
},
"aggs": {
"edu": {
"terms": {
"field": "education.city",
"size": 0
}
}
}
}
}
}
Если кто-нибудь может указать, где я ошибаюсь, или что лучше решать с такими запросами. Любая помощь приветствуется.