2024/03/13 3

[엘라스틱서치] 6. 한글 형태소, mapping

한글 형태소 설치 엘라스틱서치 -> bin위치에서 cmd창 열어서 설치하기 합성어(복합어) 처리 3가지 옵션 none : 복합어를 분리하지 않음 discard : 복합어 분리 mixed : none과 discard 모두 저장 PUT my_nori2 { "settings":{ "analysis":{ "tokenizer":{ "nori-none":{ "type":"nori_tokenizer", "discompound_mode":"none" }, "nori-discard":{ "type":"nori_tokenizer", "discompound_mode":"discard" }, "nori-mixed":{ "type":"nori_tokenizer", "discompound_mode":"mixed" } } } } ..

ELASTICSEARCH 2024.03.13

[엘라스틱서치] 5. 데이터 색인, 사용자 정의 토큰 필터

데이터 색인 : 역인덱스 ( 단어 → 매핑문서 ) → tokenizer filter GET _analyze { "text":"Today is a day where I feel lucky and happy", "tokenizer":"whitespace", "filter":[ "lowercase", // 소문자로 변환 "stop", // 불용어 제외 "snowball" // 단어의 원형 ] } "snowball" // 단어의 원형 → 을 넣으면, y는 i 로 바뀌어서 저장됨 빼면 lucky, happy 그대로 나옴 "stop", // 불용어 제외 → is, a, and 이런거 빠짐, 빼고 넣으면 다 나옴 결과값 { "tokens": [ { "token": "today", "start_offset": 0, "..

ELASTICSEARCH 2024.03.13

[엘라스틱서치] 4. Bool query, Range query

Bool query : 여러 쿼리를 조합하여 사용 가능 must : 쿼리가 참인 문서들을 검색 must_not : 쿼리가 거짓인 문서들을 검색 should : 검색 결과 중 이 쿼리에 해당하는 문서들의 score를 높여줌 filter : 쿼리가 참인 문서를 검색하지만, score를 계산하지 않음 must보다 검색 속도가 빠르다 [사용법] GET 인덱스명/_search { "query":{ "bool":{ "must":[ { 쿼리 }, ... ], "must_not":[ { 쿼리 }, ... ], "should":[ { 쿼리 }, ... ], "filter":[ { 쿼리 }, ... ] } } } EX01 ) 조건 - 팀이 jazz 이고, golden states 가 참인 것 ( 둘 다 참인 것 ) gol..

ELASTICSEARCH 2024.03.13