기록 둘러보기

  • JSON_CONTAINS(), IN 절의 검색 대상을 여러 개로 확장하는 전략

    JSON_CONTAINS(), IN 절의 검색 대상을 여러 개로 확장하는 전략

    0. 글을 시작하며 현재 진행하는 프로젝트에는 해시태그 개념이 존재하고, 이 해시태그를 이용한 검색 기능을 제공하고 있었습니다. 기존에는 하나의 post는 하나의 해시태그만을 가질 수 있다는 정책을 설정하고 사용하고 있어서 데이터를 다음과 같은 형태로 저장하고 있었습니다. post_id post_name post_content ... hash_tag 1 석촌호수 벚꽃 석촌호수 벚꽃이 정말... ... 벚꽃 2 따뜻한 날씨 요즘 날씨가 많이 따뜻... ... 일상 ... ... 104 날씨 좋은 날 나들이 이렇게 날씨 좋은 날 ... ... 나들이 105 Querydsl 도입기 기존 프로젝트에서는... ... 기술 그래서 사용자가 "벚꽃" 또는 "나들이" 라는 해시태그가 포함된 글을 보고 싶다면 다음과 같..

  • 단위 테스트가 프로젝트에 가져온 긍정적 효과

    단위 테스트가 프로젝트에 가져온 긍정적 효과

    0. 글을 시작하며 현재 회사에서 진행 중인 프로젝트를 인수인계 받으면서 눈에 띄었던 부분 중 하나는 테스트 코드가 존재하지 않는다는 점이었습니다. 해당 프로젝트를 통해 개발 중인 시스템은 실시간으로 어떤 대상의 값을 보고 내부에서 설정한 정책에 따라 작업 생성여부를 판단하는 로직을 타게 되는 데 판정대상이 단순히 하나의 어떤 대상을 보는 것이 아니라 과거의 값까지도 봐야하는 등 꽤 복잡한 형태로 구성되어 있었습니다. 시스템에서 작업을 생성할 것인지, 말 것인지를 판정하는 로직인 만큼 굉장히 중요한 부분이고, 그렇기에 작성한 로직에 대한 검증이 대단히 중요한 부분이기도 했습니다. 하지만 문제는 이 부분을 포함해서 프로젝트 전체에서 테스트 코드를 통한 검증 자동화가 존재하지 않다보니 기존에는 개발 서버에 ..

  • 동적 쿼리와의 전쟁... Querydsl을 도입할 수 없었던 이유

    동적 쿼리와의 전쟁... Querydsl을 도입할 수 없었던 이유

    0. 글을 시작하며 2024년 회사에서 새로운 프로젝트를 시작한 것도 어느덧 2달이 넘어가고 있습니다. 이미 오랜 기간 개발이 되어오던 프로젝트라 복잡한 DB 구조 및 비즈니스 로직, 새로운 요구사항을 반영할수록 높아지는 클래스간 결합도 등 저를 괴롭히는 문제들이 많지만, 그 중에서 단연 가장 큰 문제는 바로 "동적쿼리" 처리 방식이었습니다. 해당 프로젝트는 현재 Spring Boot에 JPA를 주요 기술스택으로 사용하고 있습니다. JPA에서 동적쿼리 문제를 가장 이상적으로 해결할 수 있는 기술이 querydsl 이라는 것은 많은 분들이 이미 알고 계실겁니다. 하지만 이번 글에서는 제가 자신있게 querydsl을 도입해서 현재 프로젝트의 동적쿼리 문제를 더 깔끔하게 풀어낼 수 없었는 지, native q..

  • 프로젝트 인수인계 시 꼭 기억할 5가지

    프로젝트 인수인계 시 꼭 기억할 5가지

    0. 글을 시작하며 2024년을 시작하면서 입사 후 한 해동안 진행하던 프로젝트를 마무리하고 새로운 프로젝트를 인수인계 받아 진행하게 되었습니다. 이전 프로젝트는 처음부터 프로젝트를 세팅하고 코드를 직접 작성하며 진행한 프로젝트였지만 이번 프로젝트는 지난 1년부터 지금까지 개발과 유지보수 병행하며 실제 운영 중인 서비스를 유지보수하고 추가 개발하는 내용이었습니다. 이전에는 머릿속으로 정리한 논리를 코드로만 잘 작성하면 되었지만 이제는 기존 전임자의 코드를 통해서 핵심 로직을 이해하고, 전체 시스템에 대해 이해하여 서비스에 대한 유지보수와 함께 신규 기능 추가 개발을 통해 서비스를 향상시켜야할 필요가 있었습니다. 즉, 이전에는 나의 방식대로 로직만 잘 작성하여 요구사항을 충족하는 능력만 있으면 되었다면, ..

  • 자기개발 미루지 않는 개발자 되기

    자기개발 미루지 않는 개발자 되기

    0. 글을 시작하며 모든 직업, 분야를 관통하는 문장이지만 특히 개발자라는 직업을 두고 이 문장이 단골로 등장합니다. 개발자는 평생 공부하는 직업이다. 지금 이 순간에도 많은 신기술이 등장하고, 업계 분위기가 바뀌는 개발 시장에서 개발자로서 살아남기 위해서는 지속적인 공부(자기개발)는 필수 요건입니다. 하지만 개발자로서 이 자기개발을 하는 것에 대한 가장 큰 적은 바로 "미루는 습관" 입니다. 저도 '오늘은 이만하면 되지 않았을 까', '오늘 회사일로 이미 힘들었는 데 또 공부를 해야할까?', '주말에 하자... 내일 출근해야 지' 등을 핑계로 자기개발을 미루는 습관들이 반복되다보니 제가 백엔드 개발자로서 기대했던 수준에 미치지 못하는 아쉬움을 많이 느꼈습니다. 그래서 우리가 더 좋은 개발자로 성장하는 ..

  • SOLID, 객체지향 설계 5원칙

    SOLID, 객체지향 설계 5원칙

    0. 글을 시작하며 객체지향 설계 5원칙 SOLID는 우리가 스프링을 공부하거나 기술면접을 준비할 때 아주 쉽게 접하게 되는 개념입니다. 보통 기술면접을 준비하면서 많이 접하게 되고 5가지 원칙을 거의 암기하는 방식으로 학습하게 되는 데 그렇다보니 금방 잊어버리고, 해당 원칙을 준수함으로서 가져오게 되는 효과 등 본질적인 내용은 정작 이해하지 못한다는 문제점이 있었습니다. 그래서 이번 글을 통해서 객체지향 언어를 사용하는 개발자라면 꼭 알아야할 객체지향 설계 5원칙을 구성하는 각 원칙의 개념정리와 함께 구체적 예시, 이해하기 어려운 부분들을 정리해보고자 합니다. 흔히 SOLID라고 불리는 이 용어의 정의는 다음과 같습니다. 좋은 객체지향 설계가 지켜야할 5가지 원칙 (SRP, OCP, LSP, ISP, ..

  • 간단하게 살펴보는 빅데이터 분석과 관련 개념들

    간단하게 살펴보는 빅데이터 분석과 관련 개념들

    0. 글을 시작하며 올해 2월 현재 회사에 서버개발자로 입사했지만 부가적인 업무로 빅데이터 분석을 통한 BI(Business Intelligence)를 지원하는 업무를 병행하게 되었습니다. 입사 초반에 모르는 기술 용어와 개념으로 가득한 회의에 들어가면서 어려움을 겪었던 기억이 있습니다. 물론 이 분야를 전문으로 하지 않는 상황에서 빅데이터 분석에 대한 전문적인 개념들을 모두 이해하고 업무를 하는 것은 불가능하지만 "해당 분야에 대한 큰 그림을 이해하고 접근하자"라는 관점이 업무를 진행하는 데 굉장히 큰 도움이 되었습니다. 이 글에서는 빅데이터 분석에서 사용하는 어떤 특정 기술에 대한 전문적인 내용을 다루는 것이 아니라 빅데이터 분석 분야에 대한 대략적인 큰 그림을 정리해보고자 합니다. 혹시 저처럼 본인..

  • 유클리드 호제법 (Euclidean-algorithm)

    유클리드 호제법 (Euclidean-algorithm)

    0. 글을 시작하며 우리가 문제해결을 하다보면 최대 공약수를 구해야하는 경우가 있습니다. 우선 가장 쉽게 생각해볼 수 있는 것은 초등학교 때 배우는 두 수를 모두 소인수 분해 후 공약수를 찾아 모두 곱하는 방식입니다. 예를 들어 우리가 27과 45의 최대공약수를 구한다고 할 때 보통 이런 그림을 그려서 최대 공약수를 구하곤 합니다. 그래서 우리가 두 자연수의 최대 공약수를 구해야하는 문제를 코드로 작성해서 해결해야할 때 가장 먼저 쉽게 떠올리고 접근하게 되는 방식이 바로 위의 방식일 것 입니다. 이를 코드로 다음과 같이 옮겨서 문제해결을 할 수 있지만 이 방식에는 한 가지 문제점이 있습니다 (여기서는 numberA가 numberB보다 크거나 같은 수임을 전제로 합니다). private static int..

  • [Google BigQuery] WITH문, 성능에 문제없을까?

    [Google BigQuery] WITH문, 성능에 문제없을까?

    0. 배경 통계쿼리를 작성할 때 가독성을 고려하지 않고 작성하다보면 주요 지표들을 계산하는 복잡한 로직과 Table 간의 JOIN, 많은 서브쿼리들이 복잡하게 얽혀 매우 복잡한, 가독성을 사실상 거의 포기한 Query가 나오게 됩니다. 하지만 보통 데이터 분석에서 다루는 로그 성격의 정보를 저장하는 테이블들은 아무리 적절히 정제과정을 거처더라도 row수가 매우 많습니다 (1억건도 많지는 않은 편...). 그렇기 때문에 이렇게 거대한 Table들을 모두 JOIN해서 사용하는 것은 아무리 ON 조건을 적절히 잘 건다고 하더라도 상상 이상의 비용이 발생합니다. Google BigQuery 같이 수천대의 분산환경 컴퓨팅 성능을 활용할 수 있는 막강한 성능을 가진 플렛폼을 사용하더라도 분명 결과를 받기까지 상당히..

  • [Google BigQuery] 1라인 쿼리에서 변수를 사용하고 싶을 때

    [Google BigQuery] 1라인 쿼리에서 변수를 사용하고 싶을 때

    0. 배경 (문제 상황) 데이터 분석 프로젝트를 진행하면서 Google BigQuery로 구성된 DW에 저장된 전체 서비스 로그와 사용자 정보가 저장된 Table로부터 Mart Table을 생성하는 CTAS Query를 작성해야할 일이 있었습니다. 전체 서비스 로그가 하나의 Table로 모여 저장되고 있었기 때문에 내부적으로 이를 저장할 때에는 해당 로그가 어떤 서비스에 대한 로그인지를 식별하기 위한 식별자가 들어갔고, 이 식별자를 알고 있으면 특정 서비스에 대한 로그만을 필터링하여 이를 데이터 분석에 활용할 수 있었습니다. 하지만 통계쿼리의 특성 상 쿼리 길이가 굉장히 길고(수백라인...) 각 서비스들이 가지는 자신 만의 히스토리가 데이터에 스며있기 때문에 이 모든 맥락을 이해하며 데이터 분석에 활용할..