Elasticsearch 성능 최적화 May 24, 2022 1 분 소요 Query must보단 filter를 최대한 활용 filter 사용 시 score 계산이 되지 않음 자주 호출되는 문서 캐싱 (Node Query Cache) - indices.queries.cache.size로 조절 가능 처리해야할 query가 쌓일 경우 bulk API 활용 문서 색인 시 PUT 보다는 POST를 활용 PUT 사용 시 ID가 존재하는지 확인하는 검색 과정 존재 match 대신 term, text 대신 keyword 활용 불필요한 분석 과정 생략 분석이 필요하지 않는 성별, 직업 등의 문자열은 keyword를 활용 Mapping 여러 필드를 모아서 검색이 필요한 경우 multi_terms보다는 copy_to 활용 multi field를 하나의 field로 묶어서 저장 수치 계산이 필요하지 않은 숫자형 데이터는 keyword 사용 System Setting 적절한 refresh_interval 사용 Disk I/O 최소화 시간대에 따라 조절 가능 (새벽 시간에 interval을 늘린다던지…) 레플리카 샤드가 꼭 필요한 경우가 아니라면 프라이머리 샤드만으로 운영 공유하기 Twitter Facebook LinkedIn 이전 다음 댓글남기기
ArgoCD의 App of Apps 패턴 March 3, 2024 2 분 소요 ArgoCD는 쿠버네티스를 위한 대표적인 선언적, GitOps 기반의 CD(Continuous Delivery) 도구입니다. 배포할 쿠버네티스 서비스의 deployment, service, ingress 등을 정의하고 서비스 Repository에서 GitOps 기반의 배포 파이프라...
Airflow에서 KubernetesPodOperator로 kubectl image 쉽게 사용하는 방법 February 22, 2024 최대 1 분 소요 Airflow 파이프라인에서 kubectl을 이용해서 deployment rollout을 해야할 상황이 생겼습니다. 여러 방법을 고민해보다 KubernetesPodOperator와 Secret을 이용하면 쉽게 할 수 있어서 그 방법을 정리합니다.
댓글남기기