Comming Soon

파이썬 AI 애플리케이션 개발 [LLM과 벡터 데이터베이스로 구현하는 맞춤형 지능형 서비스]

  • 원서명Building AI Intensive Python Applications: Create intelligent apps with LLMs and vector databases (ISBN 9781836207252)
  • 지은이라셸 파머(Rachelle Palmer), 벤 펄머터(Ben Perlmutter), 아쉬윈 강가다르(Ashwin Gangadhar), 니콜라스 라루(Nicholas Larew), 시그프리도 나르바에스(Sigfrido Narváez), 토마스 뤼크슈티스(Thomas Rueckstiess), 헨리 웰러(Henry Weller), 리치먼드 알라케(Richmond Alake), 슈밤 란잔(Shubham Ranjan)
  • 옮긴이테크 트랜스 그룹 T4
  • 감수자아레크 보루츠키(Arek Borucki), 크리스 부시(Chris Bush), 콜린 데이(Colleen Day), 로뱅 타코네(Robin Taconet)
  • ISBN : 9791194409502
  • 33,000원
  • 2025년 12월 26일 펴냄
  • 페이퍼백 | 396쪽 | 188*235mm
  • 시리즈 : 데이터 과학

책 소개

책 소개

"LLM API만 연동하면 끝일까? 진짜 문제는 그다음부터 시작된다."
MongoDB에서 AI와 벡터 검색을 직접 만들고 운영하는 전문가 9명이 전하는 실전 노하우

ChatGPT가 세상을 바꾸고 있다는 건 누구나 안다. 덕분에 너도나도 LLM API를 자사 서비스에 도입하기 시작했다. 그런데 막상 출시하고 나면 뭔가 이상하다. 분명 똑같은 LLM을 쓰는데, 왜 우리 서비스에서는 엉뚱한 답변이 나오고, 없는 정보를 지어내고, 예상치 못한 오류가 발생하는 걸까?

API를 호출하는 건 어렵지 않다. 하지만 그것만으로 실제 서비스에 투입할 수 있는 AI 애플리케이션을 만들 수 있다고 생각한다면, 조만간 한계에 부딪히게 될 것이다. 이 책은 바로 그 한계를 넘는 방법을 알려준다.

이 책의 강점은 저자진에 있다. MongoDB 머신러닝 연구 그룹을 이끄는 토마스 뤼크슈티스, 아틀라스 벡터 검색을 총괄하는 헨리 웰러, 매주 수천 명이 사용하는 MongoDB AI 챗봇을 직접 구축한 벤 펄머터와 니콜라스 라루 등 MongoDB에서 AI와 벡터 검색을 실제로 만들고 운영하는 전문가 9명이 함께 집필했다. 이론이 아닌, 실제 서비스 현장에서 검증된 노하우가 담겨 있다.

Python 기초 지식만 있으면 충분하다. 생성형 AI 시대에 단순한 API 사용자를 넘어, AI 애플리케이션의 구조를 이해하고 직접 구축할 수 있는 개발자로 성장하고 싶다면 이 책에서 시작해보자.

내용 소개

AI 애플리케이션을 만드는 모범 사례와 실전 기술 완전 정복

이 책은 LLM, 벡터 데이터베이스, 파이썬 프레임워크로 구성된 생성형 AI 스택의 작동 원리를 처음부터 끝까지 설명한다. 단순히 개념을 나열하는 데 그치지 않고, 각 기술이 실제 애플리케이션에서 어떻게 맞물려 돌아가는지를 보여준다.

데이터를 어떻게 준비해야 하는지, 어떤 모델을 선택해야 하는지, 미세 조정은 어떻게 해야 하는지 등 현장에서 바로 적용할 수 있는 모범 사례를 익힌다. 환각 현상이나 데이터 유출 같은 골치 아픈 문제를 해결하기 위해 검색 증강 생성(RAG)을 MongoDB Atlas와 함께 구현하는 방법도 단계별로 안내한다.

무엇보다 이 책은 많은 입문서가 다루지 않는 영역까지 파고든다. LLM이 내놓은 결과를 어떻게 평가해야 하는지, AI 오류는 어떻게 진단하고 수정하는지, 성능은 어떻게 최적화하는지를 구체적으로 설명한다. 이 부분을 알아야 실제 서비스에서 안정적으로 작동하는 AI 애플리케이션을 만들 수 있다.

이 책을 읽고 나면 실제 가치를 제공하는 AI 애플리케이션을 직접 구축할 역량을 갖추게 될 것이다.

이 책에서 다루는 내용

• LLM, 벡터 데이터베이스, 파이썬 프레임워크로 구성된 생성형 AI 스택의 구조와 작동 원리
• 벡터 데이터베이스의 역할과 AI 애플리케이션 성능 향상을 위한 활용법
• MongoDB Atlas를 활용한 벡터 검색과 RAG 구현
• LLM 출력 품질을 측정하고 개선하는 평가 방법
• 환각, 데이터 유출 등 자주 발생하는 문제와 해결 전략

저자/역자 소개

지은이 소개

라셸 파머Rachelle Palmer
MongoDB의 개발자 데이터베이스 경험(Developer Database Experience)과 개발자 교육(Developer Education) 부문의 제품 리더이며 드라이버 클라이언트 라이브러리, 문서, 프레임워크 통합, MongoDB 대학(MongoDB University)을 감독한다. 자바, PHP, Rust, 파이썬, Node.js, 루비(Ruby)로 MongoDB용 샘플 애플리케이션을 구축했다. 2013년 MongoDB에 합류했으며, 이전에는 기술 서비스 엔지니어링 팀의 이사로서 MongoDB 아틀라스(MongoDB Atlas)에 각종 지원과 클라우드 운영(CloudOps)을 제공하는 팀을 구성하고 관리했다.

벤 펄머터Ben Perlmutter
MongoDB 교육 AI 팀의 책임 엔지니어이며 LLM, 임베딩 모델, 벡터 데이터베이스 등의 AI 기술을 사용해 MongoDB 교육 경험을 개선했다. 그의 팀은 MongoDB AI 챗봇을 구축해 검색 증강 생성을 사용함으로써 매주 수천 명의 사용자가 MongoDB를 배울 수 있도록 지원한다. 이전에는 기술 중심 문서를 작성하는 데 특화된 테크니컬 라이터로 일했다.

아쉬윈 강가다르Ashwin Gangadhar
전자상거래, HR 분석, 재무에 관한 데이터 기반 솔루션 분야에서 10년 이상의 경험을 쌓아온 MongoDB의 책임 솔루션 아키텍트다. 제어와 신호 처리 석사 학위를 보유하고 있으며 검색 관련성, 컴퓨터 비전, NLP를 전문으로 한다. 또한 학습에 대한 지속적인 열정을 바탕으로 새로운 기술과 혁신 솔루션을 탐구하고 있다. 인도 벵갈루루에서 태어나고 자랐으며 여행, 요리를 통한 문화 탐구, 기타 연주를 즐긴다.

니콜라스 라루Nicholas Larew
MongoDB의 교육 AI 팀에 몸담고 있는 책임 엔지니어다. MongoDB의 AI 챗봇과 챗봇 기능을 강화하는 오픈소스 프레임워크를 개발하고 있으며 MongoDB의 콘텐츠 생성과 데이터 세트 큐레이션 작업을 담당한다. AI와 관련해 일하기 전에는 문서를 작성하고 유지 관리하는 일을 했으며, MongoDB 제품 개발자의 샘플 애플리케이션을 유지 보수했다.

시그프리도 나르바에스Sigfrido Narváez
MongoDB의 수석 솔루션 아키텍트로서 AI 프로젝트, 데이터베이스 마이그레이션, 애플리케이션 현대화를 담당했다. 그의 고객은 엔터테인먼트, 게임, 금융 등의 분야에서 미국과 라틴 아메리카 전역에 걸쳐 있다. 2015년 ‘MongoDB 마스터’로 선정된 바 있으며 GDC, QCon, re:Invent 콘퍼런스에서 MongoDB 아틀라스와 선도적인 AI 기술을 사용해 파이썬과 다른 언어로 구축한 샘플 앱을 공유했다.

토마스 뤼크슈티스Thomas Rueckstiess
MongoDB의 책임 과학자이자 머신러닝 연구 그룹 책임자다. 신경망과 강화 학습, 트랜스 포머, 정형 데이터 모델링(structured data modeling)을 전문으로 하는 머신러닝 박사 학위를 갖고 있다. 2012년 MongoDB에 입사했으며, 이전에는 MongoDB 컴파스(MongoDB Compass)와 아틀라스 차트(Atlas Charts)의 수석 엔지니어였다.

헨리 웰러Henry Weller
아틀라스 벡터 검색(Atlas Vector Search)의 전담 제품 관리자로, 쿼리 기능과 서비스의 확장성을 담당하고 사용자를 위한 모범 사례를 개발하는 데 주력하고 있다. 아틀라스 벡터 검색을 2023년에 공개 평가판에서 일반 제품으로 전환해 출시하는 데 기여했고, 서비스의 핵심 기능 제공을 계속 주도하고 있다. 2022년 MongoDB에 합류했으며, 이전에는 데이터 엔지니어이자 백엔드 로보틱스 소프트웨어 엔지니어였다.

리치먼드 알라케Richmond Alake
MongoDB의 AI/ML 개발자 애드버케이트(Developer Advocate)로, AI 애플리케이션 구축 개발자를 위한 기술 학습 콘텐츠를 제작했다. 머신러닝 아키텍처, 데이터 파이프라인 최적화, 딥러닝을 통한 모바일 경험 개발 등을 아우르는 기술적 배경 및 경험을 갖고 있다. GenAI와 컴퓨터 비전을 전문으로 하며, AI 도메인 전반에 걸친 실용적인 애플리케이션과 효율적인 구현에 중점을 둔다. 또한 개발자에게 AI 솔루션 모범 사례도 가이드하고 있다.

슈밤 란잔Shubham Ranjan
MongoDB 파이썬 버전의 제품 관리자이자 MongoDB의 AI 이니셔티브에 기여하는 핵심 멤버다. 파이썬 개발자이며, 데이터 과학과 머신러닝에서 경쟁 프로그래밍에 이르기까지 다양한 주제를 다루는 700개 이상의 기술 문서를 게시했다. 2019년 MongoDB에 합류한 이후 소프트웨어 엔지니어를 거쳐 여러 제품의 제품 관리자로 승진하면서 여러 역할을 수행했다.

옮긴이 소개

테크 트랜스 그룹 T4
최신 IT 테크놀로지에 대한 리서치를 목적으로 하는 스터디 그룹이다. 엔터프라이즈 환경에서 오픈소스를 활용한 프레임워크 구축에 관심이 많으며 알고리듬, 양자 컴퓨팅, OpenCV, 머신러닝 등의 기술에 주목하고 있다. 또한 다양한 오픈소스 기반 플랫폼의 개발 및 활용에 많은 관심을 갖고 있다. 역서로는 『그래프 알고리즘』(에이콘, 2021), 『OpenCV 4 마스터 3/e』(에이콘, 2020), 『양자 컴퓨팅 발전과 전망』(에이콘, 2020) 등이 있다.

목차

목차
  • 1장. GenAI 시작하기
  • 기술적 요구 사항
  • 용어 정의
  • GenAI 스택
  • ____파이썬과 GenAI
  • ____OpenAI API
  • ____벡터 검색을 사용한 MongoDB
  • GenAI의 중요 기능
  • ____왜 GenAI를 사용하는가?
  • ____GenAI의 윤리와 위험
  • 요약

  • 2장. 지능형 애플리케이션의 블록 구축
  • 기술적 요구 사항
  • 지능형 애플리케이션 정의
  • ____지능형 애플리케이션 블록 구축
  • LLM - 지능형 애플리케이션의 추론 엔진
  • ____LLM 추론 엔진의 사용 사례
  • ____LLM의 다양한 기능
  • ____멀티모달 언어 모델
  • ____AI 개발의 패러다임 이동
  • 임베딩 모델과 벡터 데이터베이스 - RAG를 위한 외부 지식 저장소
  • ____임베딩 모델
  • ____벡터 데이터베이스
  • ____모델 호스팅
  • 사용자 지능형 애플리케이션
  • ____샘플 애플리케이션 - RAG 챗봇
  • ____소프트웨어 엔지니어링의 지능형 애플리케이션 관련 시사점
  • 요약

  • ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  • 1부. AI의 기초: LLM, 임베딩 모델, 벡터 데이터베이스, 애플리케이션 설계
  • ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  • 3장. 대규모 언어 모델
  • 기술적 요구 사항
  • 확률적 프레임워크
  • ____n-그램 언어 모델
  • 언어 모델링의 머신러닝
  • ____인공 신경망
  • ____인공 신경망 훈련
  • 자연어 처리의 ANN
  • ____토큰화
  • ____임베딩
  • ____확률 분포 예측
  • 순차적 데이터 처리
  • ____순환 신경망
  • ____트랜스포머 아키텍처
  • LLM의 모범 사례
  • ____LLM의 진화 분야
  • ____프롬프트, 미세 조정 및 RAG
  • 요약

  • 4장. 임베딩 모델
  • 기술적 요구 사항
  • 임베딩 모델이란?
  • ____임베딩 모델은 LLM과 어떻게 다를까?
  • ____임베딩 모델과 LLM을 사용해야 하는 경우
  • ____임베딩 모델의 종류
  • 임베딩 모델 선택하기
  • ____작업 요구 사항
  • ____데이터 세트 특성
  • ____계산 리소스
  • ____벡터 표현
  • ____임베딩 모델 리더보드
  • ____임베딩 모델 개요
  • ____항상 임베딩 모델이 필요한가?
  • ____LangChain에서 코드 실행
  • 모범 사례
  • 요약

  • 5장. 벡터 데이터베이스
  • 기술적 요구 사항
  • 벡터 임베딩이란?
  • ____벡터 유사도
  • ____정확한 검색과 대략적인 검색 방법
  • ____검색 측정
  • 그래프 연결성
  • ____작은 세계 탐색
  • ____탐색이 가능한 작은 세계를 검색하는 방법
  • ____계층적 탐색이 가능한 작은 세계
  • 벡터 데이터베이스의 필요성
  • ____벡터 검색이 AI 모델을 개선하는 방법
  • 사례 연구 및 실제 적용 사례
  • ____Okta - 자연어 액세스 요청(시맨틱 검색)
  • ____One AI - 언어 기반 AI(비즈니스 데이터를 사용한 RAG)
  • ____Novo Nordisk - 자동 임상 연구 생성(고급 RAG/RPA)
  • 벡터 검색 모범 사례
  • ____데이터 모델링
  • ____적용
  • 요약

  • 6장. AI/ML 애플리케이션 설계
  • 기술적 요구 사항
  • 데이터 모델링
  • ____임베딩을 사용한 데이터 보강
  • ____검색 사용 예 고려하기
  • 데이터 스토리지
  • ____데이터베이스 클러스터의 유형 판별
  • ____IOPS 결정
  • ____RAM 결정
  • ____최종 클러스터 구성
  • ____성능과 가용성 대 비용
  • 데이터 흐름
  • ____정적 데이터 원본 처리
  • ____벡터 임베딩으로 보강한 운영 데이터 저장하기
  • 신규성과 유지
  • ____실시간 업데이트
  • ____데이터 수명주기
  • ____새로운 임베딩 모델 채택
  • 보안 및 RBAC
  • AI/ML 애플리케이션 설계를 위한 모범 사례
  • 요약

  • ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  • 2부. 사용자 파이썬 애플리케이션 만들기: 프레임워크, 라이브러리, API, 벡터 검색 엔진
  • ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  • 7장. 유용한 프레임워크, 라이브러리, API
  • 기술적 요구 사항
  • AI/ML 파이썬
  • AI/ML 프레임워크
  • ____LangChain
  • ____유사도 점수를 사용한 LangChain 시맨틱 검색
  • ____사전 필터링을 사용한 시맨틱 검색
  • ____LangChain으로 기본 RAG 솔루션 구현하기
  • ____LangChain 프롬프트 템플릿과 체인
  • 주요 파이썬 라이브러리
  • ____pandas
  • ____PyMongoArrow
  • ____PyTorch
  • AI/ML API
  • ____OpenAI API
  • ____허깅 페이스
  • 요약

  • 8장. AI 애플리케이션에서 벡터 검색 구현하기
  • 기술적 요구 사항
  • MongoDB 아틀라스 벡터 검색을 사용한 정보 검색
  • ____파이썬의 벡터 검색 튜토리얼
  • ____LangChain을 사용한 벡터 검색 튜토리얼
  • RAG 아키텍처 시스템 구축
  • ____청크와 문서 분할 전략
  • ____간단한 RAG
  • ____고급 RAG
  • 요약

  • ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  • 3부. AI 애플리케이션의 최적화: 확장, 미세 조정, 문제 해결, 모니터링 및 분석
  • ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  • 9장. LLM 출력 평가
  • 기술적 요구 사항
  • LLM 평가란?
  • ____LLM 구성 요소와 엔드 투 엔드 평가
  • 모델 벤치마킹
  • ____평가 데이터 세트
  • ____기준선 정의
  • ____사용자 피드백
  • ____합성 데이터
  • 평가 메트릭
  • ____어설션 기반 메트릭
  • ____통계 메트릭
  • ____LLM 기반 평가
  • ____RAG 메트릭
  • ____인적 검토
  • ____가드레일로서의 평가
  • 요약

  • 10장. 시맨틱 데이터 모델을 개선해 정확도 향상하기
  • 기술적 요구 사항
  • 임베딩
  • ____다양한 임베딩 모델로 실험하기
  • ____임베딩 모델 미세 조정
  • 임베딩 메타데이터
  • ____메타데이터 형식 지정
  • ____정적 메타데이터 포함
  • ____프로그래밍 방식의 메타데이터 추출
  • ____LLM으로 메타데이터 생성
  • ____쿼리 임베딩 및 수집 콘텐츠 임베딩에서 메타데이터 포함하기
  • 검색 증강 생성 최적화
  • ____쿼리 변형
  • ____사전 필터링을 위한 쿼리 메타데이터 추출
  • ____수집된 데이터 형식 지정
  • ____고급 검색 시스템
  • 요약

  • 11장. GenAI의 일반적인 실패
  • 기술적 요구 사항
  • 환각
  • ____환각의 원인
  • ____환각의 의미
  • 아첨
  • ____아첨의 원인
  • ____아첨의 의미
  • 데이터 유출
  • ____데이터 유출의 원인
  • ____데이터 유출의 의미
  • 비용
  • ____비용 유형
  • ____토큰
  • GenAI 애플리케이션의 성능 문제
  • ____계산 부하
  • ____모델 제공 전략
  • ____높은 I/O 작업
  • 요약

  • 12장. GenAI 애플리케이션 수정 및 최적화
  • 기술적 요구 사항
  • 기준선
  • ____훈련과 평가 데이터 세트
  • ____퓨샷 프롬프팅
  • ____검색과 순위 재지정
  • ____늦은 상호작용 전략
  • ____쿼리 재작성
  • 테스트와 레드 팀 구성
  • ____테스트
  • ____레드 팀 구성
  • 정보 후처리
  • 다른 해결 방법
  • 요약

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안