본문 바로가기
IT관련도서/📙기술트렌드및견해중심

[IT도서리뷰📙]요즘 당근 AI 개발(2/2)/완독 후기_애매함을 줄이고 기준을 명확히 만드는 것

by Kim성연 2025. 12. 24.

분류 : 📙기술 트렌드 및 견해 중심

제목 : 요즘 당근 AI 개발

지은이 : 천재윤, 권우석, 구경회, 김기혁, 김단, 김수지, 김지욱, 박성준, 이해린, 하상혁, 한소리

총 페이지 수 : 264page

 

확실히 이 책은 " 당근의 LLM 활용까지의 여정과 설계적 판단"이라고 말할 수 있는 책이었다.

글로 이 모든 노고를 담아내지 못한 것은 아쉽지만, 좋은 판단을 위해 노력한 과정은 충분히 볼 수 있다.

 

 

피드백 : 264page중에 60page만 줄였어도 좋았을 것 같다.

1. 임베딩 같은 용어 설명이 반복되어있다.

2. PART4에서 하고 싶은 말을 잘 못찾겠다. 글의 짜임새가 부족하다. 또한 문장이 반복된다. 내용이 퍼지는 느낌이다.

 

1. 모든 과정이 반복의 연속이었습니다. 하지만 그 반복이 쌓이자, 변화는 분명히 나타났습니다. (137p)

어떤 어려움을 겪었고, 어떤 기준을 계속 세웠고, 굉장히 많은 시도를 했다고 한다.

읽다보니 이들의 행동은 2가지로 나눌 수 있는 것 같다.

1. LLM이 읽어들일 수 있게 데이터를 처리하자.

2. LLM이 만든 결과물이 믿을 수 있는지 검증하자.

 

1을 하고 2가 아닌 것 같으면 1을 다시하고, 다시해도 2가 아닌 것 같으면 1을 하고...

책에는 나와있지 않지만, 데이터 성격을 추론하면 아래 표와 같은 것 같다.

정형 데이터 (Structured Data) 반정형 데이터 (Semi-structured Data) 임베딩 데이터 (Embedding / Vector Data)
테이블, 수치, 로그 JSON, 이벤트 데이터 텍스트 의미, 추천·검색·AI 입력용

 

그리고 LLM이 읽어들일 수 있는 방향으로 전처리 및 설계를 계속 하신 것 같다.

1. n8n 워크플로 자동화
2. 복잡한 게시글들을 우리가 필요한 속성 기준에 따라 구조화
3. 파인콘을 도입해서 벡터 서빙을 최적화
파인콘 : 클라우드 기반 벡터 데이터베이스 서비스. 대용량 임베딩 벡터의 저장, 관리, 실시간 유사도 검색을 위한 최적화된 플랫폼
벡터 서빙 : 벡터로 변환된 데이터를 실시간으로 검색하거나 추론 서비스에 제공하는 기술 또는 과정

 

2. 어떻게 읽었는가?

앞에서 순서대로 쭉 읽었다.

이 책은 클로드, 파인콘, AI에이전트 라는 용어는 나와있지만, 그걸 세세히 적용한 방법을 설명하지는 않는다.

그냥 "적재적소에 LLM을 배치했어요!!"의 느낌이 더 강한 편이다.

 

PART4가 좀 아쉽다. 좀 더 설명이 가는 글을 적을 수 있었을 텐데.

 

 

 

그래도 당근의 기업 문화를 잘 볼 수 있었던 책이었다.

그들의 문화를 한 줄로 요약할 수 있을 것 같다.

 

애매함을 줄이고 기준을 명확히 만드는 것