
분류 : 📙기술 트렌드 및 견해 중심
제목 : 요즘 당근 AI 개발
지은이 : 천재윤, 권우석, 구경회, 김기혁, 김단, 김수지, 김지욱, 박성준, 이해린, 하상혁, 한소리
총 페이지 수 : 264page
확실히 이 책은 " 당근의 LLM 활용까지의 여정과 설계적 판단"이라고 말할 수 있는 책이었다.
글로 이 모든 노고를 담아내지 못한 것은 아쉽지만, 좋은 판단을 위해 노력한 과정은 충분히 볼 수 있다.
피드백 : 264page중에 60page만 줄였어도 좋았을 것 같다.
1. 임베딩 같은 용어 설명이 반복되어있다.
2. PART4에서 하고 싶은 말을 잘 못찾겠다. 글의 짜임새가 부족하다. 또한 문장이 반복된다. 내용이 퍼지는 느낌이다.
1. 모든 과정이 반복의 연속이었습니다. 하지만 그 반복이 쌓이자, 변화는 분명히 나타났습니다. (137p)
어떤 어려움을 겪었고, 어떤 기준을 계속 세웠고, 굉장히 많은 시도를 했다고 한다.
읽다보니 이들의 행동은 2가지로 나눌 수 있는 것 같다.
1. LLM이 읽어들일 수 있게 데이터를 처리하자.
2. LLM이 만든 결과물이 믿을 수 있는지 검증하자.
1을 하고 2가 아닌 것 같으면 1을 다시하고, 다시해도 2가 아닌 것 같으면 1을 하고...
책에는 나와있지 않지만, 데이터 성격을 추론하면 아래 표와 같은 것 같다.
| 정형 데이터 (Structured Data) | 반정형 데이터 (Semi-structured Data) | 임베딩 데이터 (Embedding / Vector Data) |
| 테이블, 수치, 로그 | JSON, 이벤트 데이터 | 텍스트 의미, 추천·검색·AI 입력용 |
그리고 LLM이 읽어들일 수 있는 방향으로 전처리 및 설계를 계속 하신 것 같다.
| 1. n8n 워크플로 자동화 |
| 2. 복잡한 게시글들을 우리가 필요한 속성 기준에 따라 구조화 |
| 3. 파인콘을 도입해서 벡터 서빙을 최적화 파인콘 : 클라우드 기반 벡터 데이터베이스 서비스. 대용량 임베딩 벡터의 저장, 관리, 실시간 유사도 검색을 위한 최적화된 플랫폼 벡터 서빙 : 벡터로 변환된 데이터를 실시간으로 검색하거나 추론 서비스에 제공하는 기술 또는 과정 |
2. 어떻게 읽었는가?
앞에서 순서대로 쭉 읽었다.
이 책은 클로드, 파인콘, AI에이전트 라는 용어는 나와있지만, 그걸 세세히 적용한 방법을 설명하지는 않는다.
그냥 "적재적소에 LLM을 배치했어요!!"의 느낌이 더 강한 편이다.
PART4가 좀 아쉽다. 좀 더 설명이 가는 글을 적을 수 있었을 텐데.
그래도 당근의 기업 문화를 잘 볼 수 있었던 책이었다.
그들의 문화를 한 줄로 요약할 수 있을 것 같다.
애매함을 줄이고 기준을 명확히 만드는 것
'IT관련도서 > 📙기술트렌드및견해중심' 카테고리의 다른 글
| [IT도서리뷰📙]요즘 당근 AI 개발(1/2)/작게 시작하고, 빠르게 배우고, 사용자에게 집중하기 (0) | 2025.12.15 |
|---|---|
| [IT도서리뷰📙]디지털저작권관리(DRM)(5/5)/완독 후기 (10) | 2025.07.25 |
| [IT도서리뷰📙]디지털저작권관리(DRM)(4/5)/따라서DRM기술을정의하기위해서는그것이이루고자하는목적을살펴봄으로써답을할수있다고저자는본다+각챕터정리 (11) | 2025.07.24 |
| [IT도서리뷰📙]디지털저작권관리(DRM)(3/5)/MPEG-21,IPMP+어떤 시스템에 상호 호환성을 도입한다는 것은 보안 측면에서 새로운 위험이 될 수 있다. (5) | 2025.07.18 |
| [IT도서리뷰📙]디지털저작권관리(DRM)(2/5)/IMPRIMATUR모델 + 상호호환 (6) | 2025.07.17 |