첫 수업의 목표

AI에게 일을 맡기기 전 알아둘 기본기

바이브코딩은 “대충 말하면 AI가 알아서 해주는 것”이 아니다. 원하는 일, 필요한 자료, 쓰면 안 되는 권한, 확인 방법을 말로 정확히 정리하는 작업이다.

개념부터 보기 LLM 구조 보기

01 AI는 무엇을 보고 답할까? 시스템 프롬프트, 유저 프롬프트, RAG, 웹 검색, MCP가 모두 컨텍스트가 된다.

02 문서는 어떻게 찾아 쓸까? 문서를 청크로 자르고, 임베딩으로 저장한 뒤, 의미가 가까운 조각을 꺼낸다.

03 앱은 어디에 기억할까? DB는 데이터를 규칙 있는 장부로 나누어 저장하는 서버다.

1. 핵심 개념

이 7개만 잡으면 대화가 달라진다

초보자에게 필요한 건 깊은 문법이 아니라 큰 부품의 역할이다. 아래 7개는 AI 앱을 만들 때 거의 매번 등장한다.

LLM

다음 토큰을 예측하는 모델

앞에 놓인 텍스트를 읽고, 다음에 올 말 조각을 이어 붙여 답을 만든다.

Token

AI가 읽고 쓰는 글 조각

컨텍스트 길이와 비용을 재는 단위다. 택시 미터기처럼 많이 쓰면 비용도 늘어난다.

Embedding

의미를 공간 좌표로 바꾸기

문장 뜻을 숫자 위치로 바꾼다. 의미가 비슷하면 공간에서도 가깝다.

RAG

필요한 문서 조각을 찾아 붙이기

AI가 기억만 믿지 않게, 관련 자료를 찾아 컨텍스트에 넣어주는 방식이다.

MCP

AI가 도구를 쓰는 표준 연결

파일, DB, 검색, 업무 도구를 AI가 일정한 규격으로 사용할 수 있게 해준다.

API

앱과 외부 서비스의 약속된 창구

LLM, STT, 캘린더, 이메일 같은 기능을 요청하고 결과를 받는 통로다.

규칙 있는 데이터 장부

엑셀처럼 한 장에 다 우겨 넣지 않고, 사람/조직/기록을 테이블로 나누어 저장한다.

2. LLM과 컨텍스트

LLM은 매번 “현재 창”을 읽고 다음 토큰을 예측한다

LLM의 품질은 모델 이름만으로 결정되지 않는다. 무엇을 컨텍스트 창에 넣고, 무엇을 빼고, 오래된 대화를 어떻게 정리하는지가 거의 전부다.

Context window 모델이 지금 읽는 작업대

System prompt

말투, 금지사항, 도구 사용 규칙

User prompt

이번에 사용자가 요청한 일

Additional context

RAG 문서, 웹 검색 결과, MCP 도구 결과, 파일 내용

Assistant answer

방금 만든 답변도 다음 질문의 컨텍스트에 남을 수 있다

Next user prompt

다음 질문이 들어오면 위 내용 위에 다시 쌓인다

창이 꽉 차면 오래된 내용은 빠지거나 요약되어야 한다.

LLM의 역할

LLM은 앞의 텍스트를 보고 다음 토큰을 예측한다. 토큰 = AI가 읽고 쓰는 글 조각이다. 그래서 질문이 모호하면 답도 흔들린다.

Context management

컨텍스트 관리 = AI가 봐야 할 자료를 작업대 위에 올리고, 불필요한 자료는 치우는 일이다. 좋은 바이브코딩은 이 작업대를 정리하는 능력이다.

실무 감각

`CLAUDE.md`, `AGENTS.md`, RAG, 웹 검색, MCP 결과는 모두 컨텍스트 재료다. 답변 품질은 “모델이 뭘 봤는지”에 크게 좌우된다.

3. 임베딩과 시맨틱 서치

문장의 의미를 공간에 찍으면, 검색이 달라진다

임베딩은 단어나 문장을 의미 공간의 좌표로 바꾸는 일이다. 정확히 같은 단어가 없어도, 의미가 가까운 문장을 찾을 수 있다.

강아지가 귀엽다

고양이가 예쁘다

맛있는 아이스크림은 00가게에 판다

가깝다 = 의미가 비슷하다

멀다 = 주제가 다르다

Semantic search

시맨틱 서치 = 사용자의 질문도 임베딩 공간에 찍고, 미리 저장된 문서 조각 중 가장 가까운 것부터 찾는 검색이다.

사용자 질문을 임베딩한다.
저장된 문서 청크들과 거리를 비교한다.
가장 가까운 상위 몇 개를 고른다.
그 청크를 LLM 컨텍스트에 넣는다.

4. RAG

문서를 잘라 저장하고, 질문과 가까운 조각을 꺼낸다

RAG는 “문서 검색 + LLM 답변”이다. 핵심은 문서를 적당한 청크로 자르고, 각 청크를 임베딩해서 저장해 두는 것이다.

예시 문서

# 회의록 업로드 기능

사용자는 오디오 파일을 올릴 수 있다.
서버는 STT API로 음성을 텍스트로 바꾼다.
긴 회의록은 챕터로 나누어 저장한다.
모든 유료 호출은 사용량 로그에 기록한다.

길이 기준 청킹

사용자는 오디오 파일을 올릴 수 있다. 서버는 STT API로...

...STT API로 음성을 텍스트로 바꾼다. 긴 회의록은...

길이 기준 청킹 = 일정 글자 수로 자르고 조금 겹치게 두는 방식이다.

Markdown 기준 청킹

# 회의록 업로드 기능

오디오 업로드 / STT / 챕터 저장 / 비용 로그

Markdown 기준 청킹 = 제목과 문단 구조를 보고 의미 단위로 자르는 방식이다.

1문서PDF, 회의록, 노트

2Chunk작은 문서 조각

3Embedding의미 좌표로 변환

4Vector DB좌표와 원문 저장

5Top-K 검색질문과 가까운 조각 선택

6ContextLLM에게 참고자료로 전달

한 문장 정리: RAG는 AI를 새로 학습시키는 일이 아니라, 답하기 전에 관련 자료를 찾아 책상 위에 올려주는 일이다.

5. API

API는 다른 서비스에 일을 부탁하는 공식 창구다

앱이 모든 기능을 직접 만들 필요는 없다. 약속된 요청 형식으로 외부 서비스에 일을 보내고, 결과를 받아오면 된다.

내 앱 사용자 요청을 받고 필요한 API를 호출한다

LLM API

초안 작성, 요약, 분류

STT API

음성을 텍스트로 변환

Google Calendar API

일정 조회와 생성

Email API

메일 발송과 상태 확인

왜 쓰나

전문 기능을 직접 만들지 않고 빌려 쓸 수 있다. 대신 인증키, 권한, 비용, 실패 처리가 필요하다.

어떻게 작동하나

내 앱이 요청을 보낸다. 외부 서비스가 처리한다. 결과가 JSON 같은 정해진 형식으로 돌아온다.

무엇을 조심하나

유료 API는 반드시 사용량 로그를 남긴다. 로그 = 어떤 모델을 얼마나 써서 얼마가 들었는지 적는 영수증이다.

6. DB와 스키마

DB를 설계한다는 건 지저분한 엑셀을 장부로 정리하는 일이다

DB = 데이터를 오래 저장하고 여러 사람이 안전하게 조회하는 장부 서버다. 스키마 = 그 장부의 칸, 규칙, 관계를 정한 설계도다.

나쁜 wide form 엑셀

이름	이메일	부서	직책	매니저	매니저 이메일	법인	FTE 1월	FTE 2월
김민수	minsu@example.com	HR	HR Manager	이서연	seoyeon@example.com	KR01	1.0	0.8
김민수	minsu@example.com	HR	People Lead	이서연	seoyeon@example.com	KR01	1.0	0.8

문제: 같은 사람이 반복되고, 직책명이 흔들리고, 월별 칸이 계속 늘어난다.

DB로 나누면

person

person_id	name	email
P01	김민수	minsu@example.com

position

position_id	title	dept
POS7	HR Manager	HR

assignment_fte

person_id	month	fte
P01	2026-02	0.8

좋은 점: 사람, 자리, 월별 기록을 따로 관리해서 중복과 혼선을 줄인다.

DB 서버라는 말

서버 = 상시 실행되며 요청을 기다리는 프로그램이다. DB 서버는 “데이터 저장/조회 요청”을 계속 기다리는 장부 프로그램이라고 보면 된다.

7. 실제 프로젝트로 연결하기

개념은 실제 프로젝트에서 이렇게 보인다

수업에서는 코드를 먼저 보여주지 않는다. “이 프로젝트가 어떤 문제를 어떤 부품으로 풀었는지”부터 잡는다.

뉴스 공장

NewsHub

기사를 모으고, 비슷한 주제로 묶고, 요약해서 뉴스레터로 보내는 시스템이다.

Embedding

기사 의미를 좌표로 바꿔 비슷한 기사끼리 찾는다.

LLM

기사 묶음을 검증하고 요약한다.

Usage log

유료 AI 호출의 토큰과 비용을 DB에 남긴다.

8. 90분 강의안

말보다 그림, 코드보다 구조

첫 수업은 코딩 실습보다 “AI 앱이 어떻게 생각하고 저장하고 연결되는지”를 머릿속에 그리는 데 집중한다.

00-10분

바이브코딩의 기준

AI에게 일을 맡긴다는 말의 의미와 좋은 요청의 조건을 잡는다.

10-30분

LLM과 컨텍스트

시스템 프롬프트, 유저 프롬프트, 추가 정보가 어떻게 쌓이는지 설명한다.

30-45분

임베딩과 검색

문장을 의미 공간에 찍고, 가까운 문서를 찾는 과정을 보여준다.

45-60분

RAG

문서 청킹, 임베딩 저장, Top-K 검색, 컨텍스트 주입을 연결한다.

60-75분

API와 DB

외부 서비스 호출과 스키마 설계를 실제 앱의 기본기로 설명한다.

75-90분

실제 사례

NewsHub, Report Studio, HRIS, Second Brain을 개념 지도에 매핑한다.

수업 후 바로 쓰는 요청 템플릿

이 기능을 만들고 싶어. 먼저 관련 파일과 데이터 흐름을 찾아 설명해줘. LLM 컨텍스트, API 호출, DB 스키마, 비용 로그에 영향이 있는지도 확인해줘.