Я знаю, что вы можете найти наиболее часто используемые термины в указателе с использованием фасетов.
Например, на следующих входах:
"A B C"
"AA BB CC"
"A AA B BB"
"AA B"
фасет термина возвращает это:
B:3
AA:3
A:2
BB:2
CC:1
C:1
Но мне интересно, можно ли перечислить следующее:
AA B:2
A B:1
BB CC:1
....etc...
Есть ли такая функция в ElasticSearch?
shingle
. Это создаст токены, объединив слова (как вы спрашиваете). Затем вы можете попытаться увидеть, будет ли фасет возвращать счетчики для этих комбинированных токенов. ознакомьтесь с документацией es по токен-фильтру shingle а> - person ramseykhalaf   schedule 15.08.2013