최근 포스트

데이터 수집 전처리하기 (태그, 특수문자 코드)

최대 1 분 소요

웹에 있는 데이터를 수집하다보면 보이는 텍스트와 달리 태그나 특수문자 코드 등이 그대로 함께 수집되는 경우가 있습니다. 예를 들면 아래와 같은 형태로 수집될 수 있습니다.

Elasticsearch search queries

4 분 소요

Elasticsearch에서 특정 키워드로 검색할 때 조건에 따라 적절한 방법을 사용해야합니다. 아래에서 검색할 때 대표적으로 많이 사용되는 term, match, match_phrase, string_query을 설명하겠습니다.

Mac에서 Minikube 설치하기

5 분 소요

금방 할 줄 알았던 Minikube 설치에서 삽질하는 과정이 너무 길어져서 기록으로 남깁니다.. 비슷한 이슈가 있는 분들에게 참고가 됐으면 좋겠습니다.

Airflow 병렬처리하기

6 분 소요

병렬처리 고려 대상 Airflow에서 병렬차리할 때 고려해야할 대상이 크게 5가지 있습니다.

K3s 및 Helm 설치

1 분 소요

K3s 설치 ```bash $ curl -sfL https://get.k3s.io | sh -

글또 8기를 시작하며

3 분 소요

블로그를 약 1년 정도 운영하던 중 글또를 알게되면서 참여하게 되었습니다. 👏

Kubernetes Pod DNS(CoreDNS) Naming Rule

1 분 소요

Kubernetes에서 각 Service와 통신할 때 IP를 일일이 확인하고 입력하지 않습니다. 각 Service를 IP로 직접 연결하면 아래 단점이 있기 때문입니다.

2022년 회고

7 분 소요

2021년 12월. 새로운 회사로 이직하면서 2022년을 맞이했다. 때문에 2022년의 목표는 주로 새로운 회사에서의 목표와도 같았다. 목표와는 다르게 흘러간 부분이 있었지만, 오히려 달라진 부분에서 더 만족했던 해였다.

Airflow S3에 있는 파일을 디스크를 안거치고 메모리로 가져오기

1 분 소요

S3에 있는 파일을 디스크에 저장 후 작업을 진행하면 파일을 삭제하기 전에 예외 상황이 발생할 수 있고, 이렇게 되면 파일이 삭제되지 않고 디스크에 남아버립니다. 때문에 특별한 경우가 아니라면 디스크에 저장하지 않고 바로 가져와서 사용하는 것이 좋습니다.