티스토리 뷰

반응형

STEP3 바로가기

이제 마지막 단계이자 가장 흥미로운 부분인 Step 4: 나만의 데이터 연결하기 (RAG의 기초)입니다.

GPT는 똑똑하지만, 여러분의 컴퓨터에 있는 개인 문서나 어제 발표된 뉴스 같은 최신 정보는 모릅니다. 이 정보를 AI에게 실시간으로 '커닝 페이퍼'처럼 전달해주는 기술이 바로 RAG(Retrieval-Augmented Generation, 검색 증강 생성)입니다.


Step 4: PDF나 메모장 내용을 AI에게 가르치기

전문적인 RAG 시스템은 복잡하지만, 입문 단계에서는 '텍스트 추출 → 프롬프트 주입' 방식으로 원리를 이해할 수 있습니다.

1. 나만의 데이터 준비

예를 들어, my_info.txt라는 파일에 내 회사의 복지 규정이나 나만의 프로젝트 기획안이 들어있다고 가정해 봅시다.

2. 파이썬으로 데이터 읽기

파이썬의 기본 기능을 사용해 텍스트를 읽어옵니다.

Python
 
# 내 문서 읽기
with open("my_info.txt", "r", encoding="utf-8") as f:
    my_data = f.read()

3. 프롬프트에 데이터 주입 (Context Injection)

가장 중요한 핵심입니다. AI에게 질문을 던질 때, 읽어온 데이터를 함께 보냅니다.

Python
 
# 질문과 데이터를 합친 프롬프트
prompt = f"""
아래 제공된 [참고 문서]의 내용을 바탕으로 사용자의 질문에 답변해줘.
만약 문서에 없는 내용이라면 "모르겠습니다"라고 답해줘.

[참고 문서]
{my_data}

사용자 질문: 우리 회사 복지 중에 '자기계발비' 지원 범위가 어떻게 돼?
"""

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": prompt}]
)

print(response.choices[0].message.content)

4. 왜 이렇게 하나요? (RAG의 장점)

  • 할루시네이션(환각) 방지: AI가 아는 척하며 거짓말하는 것을 막고, 오직 제공된 문서 안에서만 답하게 강제할 수 있습니다.
  • 보안: OpenAI를 학습시키는 것이 아니라, 질문할 때만 잠깐 데이터를 빌려주는 방식이라 내 데이터가 모델 학습에 쓰이지 않도록 설정할 수 있습니다.
  • 최신성: 매일 바뀌는 데이터를 실시간으로 반영할 수 있습니다.

🏁 마무리: 당신은 이제 AI 개발의 입구에 섰습니다!

이제 여러분은 다음을 할 수 있습니다:

  1. Windows에서 파이썬 머신러닝 환경을 구축했습니다.
  2. OpenAI API 키를 발급받고 보안 설정을 마쳤습니다.
  3. TemperatureJSON 모드를 통해 AI를 제어하는 법을 배웠습니다.
  4. 나만의 데이터를 AI에게 전달하는 기초 원리를 이해했습니다.

STEP5 바로가기

반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2026/05   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함
반응형