강좌 목록으로 돌아가기
AI030 Professional

파이썬에서의 생성형 AI 기초

생성형 AI와 대규모 언어 모델(LLM)을 이해하고 구현하는 포괄적인 안내서입니다. 이 과정에서는 이론적 기초에서 실용적인 파이썬 기반 개발로의 전환을 다루며, GAN, 확산 모델, 트랜스포머, 미세 조정 및 생산 배포를 포함합니다.

4.8
21.0h
964 학생들
5 좋아요
인공지능
수강 시작하기

강좌 개요

📚 콘텐츠 요약

생성형 AI와 대규모 언어 모델(LLM)을 이해하고 구현하는 종합 가이드. 이 과정은 이론적 기초에서 실용적인 파이썬 기반 개발로의 전환을 다루며, GAN, 확산 모델, 트랜스포머, 미세조정, 그리고 생산 환경 배포를 포함한다.

파이썬을 활용하여 현대적 LLM과 생성 기법의 핵심 원리와 실용적 응용을 마스터하세요.

저자: 카를로스 로드리게스

감사의 말: 저자의 아내 질, 부모님, 그리고 기술 리뷰어인 모건 보이스, 에릭 루이, 사미라 샤이크(서문 작성자)에게 특별한 감사를 드립니다.

🎯 학습 목표

  1. 전통적인(판별형) 머신러닝 패러다임과 생성형 AI 모델 간의 차이를 구분할 수 있다.
  2. 생성형 AI의 기초 아키텍처인 GAN, 확산 모델, 트랜스포머를 식별할 수 있다.
  3. 대규모 언어 모델(LLM)이 전체 인공지능 생태계 내에서 어떻게 역할을 하며 진화해왔는지를 설명할 수 있다.
  4. GAN, 확산 모델, 트랜스포머의 고유한 특징과 아키텍처 패러다임을 구분할 수 있다.
  5. 각 모델 유형의 발전과 한계를 분석하며, 모드 붕괴 또는 샘플링 속도 같은 특정 문제를 이해할 수 있다.
  6. 스테이블 디퓨전 파이프라인을 구현하고, CLIP 기반 로짓과 확률을 사용하여 생성된 출력을 평가할 수 있다.
  7. 초기 카운트 기반 방법과 RNN에서부터 현대적인 분산 표현과 전이학습으로의 자연어 처리(NLP)의 진화를 추적할 수 있다.
  8. 멀티헤드 어텐션(MHA), 자기 어텐션, 마스킹, 피드포워드 네트워크(FFN)의 기술적 메커니즘을 설명할 수 있다.
  9. 데이터 토큰화, 위치 인코딩, 학습/추론 함수를 포함한 완전한 트랜스포머 모델 아키텍처를 구현할 수 있다.
  10. 구글 콜랩 같은 프로토타이핑 도구를 도커와 VS 코드를 사용해 생산 가능한 환경으로 매핑할 수 있다.

🔹 수업 1: 생성형 AI의 기초와 패러다임

개요: 이 수업은 전통적인 머신러닝 패러다임에서 생성형 AI 시대로의 근본적인 전환을 다룹니다. GAN에서 트랜스포머로의 아키텍처 진화를 탐구하며, 합성 이해 및 콘텐츠 생성의 중심축으로서 대규모 언어 모델(LLM)을 소개합니다.

학습 결과:

  • 전통적인(판별형) 머신러닝 패러다임과 생성형 AI 모델 간의 차이를 구분할 수 있다.
  • 생성형 AI의 기초 아키텍처인 GAN, 확산 모델, 트랜스포머를 식별할 수 있다.
  • 대규모 언어 모델(LLM)이 전체 인공지능 생태계 내에서 어떤 역할을 하며 어떻게 진화해왔는지를 설명할 수 있다.

🔹 수업 2: 아키텍처 조사: GAN, 확산 모델, 트랜스포머

개요: 이 수업은 생성형 AI의 세 가지 주요 아키텍처 기둥인 생성적 적대 신경망(GAN), 확산 모델, 트랜스포머에 대한 포괄적인 조사를 제공합니다. 학생들은 이러한 방법의 기술적 분해, 진화적 발전, 내재된 제한점, 그리고 이미지 생성과 평가에 있어 클립 지표를 활용한 실용적 적용을 탐구합니다. 작업 환경은 점지어/콜랩입니다.

학습 결과:

  • GAN, 확산 모델, 트랜스포머의 고유한 특징과 아키텍처 패러다임을 구분할 수 있다.
  • 각 모델 유형의 발전과 한계를 분석하며, 모드 붕괴나 샘플링 속도 같은 특정 문제를 이해할 수 있다.
  • 스테이블 디퓨전 파이프라인을 구현하고, 클립 기반 로짓과 확률을 사용하여 생성된 출력을 평가할 수 있다.

🔹 수업 3: 자연어 처리의 진화와 트랜스포머 아키텍처

개요: 이 수업은 자연어 처리의 역사적 흐름을 다룹니다. 초기 통계적 방법에서 혁명적인 트랜스포머 아키텍처로의 전환을 설명합니다. 순차적인 RNN 기반 모델에서 병렬 처리 가능한 자기 어텐션 메커니즘으로의 전환을 상세히 다루며, 원래 트랜스포머의 구성 요소(엔코더/데코더)를 설명하고, 파이토치를 이용한 번역 파이프라인의 실제 구현을 다룹니다.

학습 결과:

  • 초기 카운트 기반 방법과 RNN에서부터 현대적인 분산 표현과 전이학습으로의 자연어 처리(NLP)의 진화를 추적할 수 있다.
  • 멀티헤드 어텐션(MHA), 자기 어텐션, 마스킹, 피드포워드 네트워크(FFN)의 기술적 메커니즘을 설명할 수 있다.
  • 데이터 토큰화, 위치 인코딩, 학습/추론 함수를 포함한 완전한 트랜스포머 모델 아키텍처를 구현할 수 있다.

🔹 수업 4: 생산 공학 및 책임 있는 AI 배포

개요: 이 수업은 머신러닝 프로토타이핑(실험 단계)에서 안정적인 생산 준비 환경으로의 필수적 전환을 다룹니다. 도커를 통한 컨테이너화와 환경 매핑과 같은 생산 공학 원칙을 책임 있는 AI의 윤리적 요구사항과 결합하여, 편향 완화, 투명성, 그리고 클립 점수와 어휘 유사성 같은 지표를 활용한 엄격한 모델 벤치마킹에 초점을 맞춥니다.

학습 결과:

  • 구글 콜랩과 같은 프로토타이핑 기능을 도커와 VS 코드를 사용해 생산 가능한 환경으로 매핑할 수 있다.
  • 모델의 계산 복잡성과 메모리 요구량을 계산하여 전문화된 하드웨어 필요성을 판단할 수 있다.
  • 정량적 지표(BLEU, ROUGE, METEOR)와 클립에 대한 일치도를 활용하여 생성형 모델을 평가할 수 있다.

🔹 수업 5: 미세조정 기술과 파라미터 효율적 학습

개요: 이 수업은 프롬프트 기반 모델 적응에서 작업 중심의 미세조정으로의 전환을 다룹니다. 인-컨텍스트 학습(제로샷, 페이셔샷), 검색 증강 생성(RAG), 그리고 파이썬을 사용한 파라미터 효율적 미세조정(PEFT)의 실용적 구현을 탐구합니다. 학생들은 질문-답변 파이프라인을 구축하고, 허깅페이스 Trainer 클래스를 활용하며, 학습 손실과 의미 유사도를 통해 결과를 평가하게 됩니다.

학습 결과:

  • 인-컨텍스트 학습(제로샷/페셔샷), RAG, 미세조정 간의 차이를 구분할 수 있다.
  • AdaLoRA와 허깅페이스 Trainer 클래스를 사용한 PEFT 기반 미세조정 워크플로우를 구현할 수 있다.
  • 학습 손실과 의미 유사도 점수를 포함한 모델 성능 지표를 계산하고 해석할 수 있다.

🔹 수업 6: 전문 대규모 언어 모델을 위한 도메인 적응

개요: 이 수업은 일반 목적 도구로서의 대규모 언어 모델(LLM)이 금융 분야의 전문가로 진화하는 과정을 탐구합니다. 학생들은 도메인 적응의 역사적 맥락을 이해하고, 인과 언어 모델링(CLM)과 다음 문장 예측(NSP)과 같은 핵심 학습 방법론을 숙지하며, 파라미터 효율적 미세조정(PEFT)을 사용한 실습 전이학습 프로젝트를 수행합니다. 이 모듈은 ROUGE 지표와 전통적인 분류 점수(정밀도, 재현율, F1)를 활용한 철저한 평가 기법으로 마무리됩니다.

학습 결과:

  • 일반적인 LLM을 전문 도메인에 적응시키는 역사적 중요성과 핵심 개념을 명확히 설명할 수 있다.
  • 금융 도메인 전이학습을 위한 완전한 파이프라인(전처리 및 토큰화 포함)을 실행할 수 있다.
  • CLM과 NSP 학습 방법론 사이의 차이를 구분할 수 있다.

🔹 수업 7: 고급 프롬프트 엔지니어링과 검색 구현

개요: 이 수업은 대규모 언어 모델(LLM) 상호작용의 진화를 탐구하며, 전통적인 미세조정에서 프롬프트 기반 접근 방식으로의 전환을 다룹니다. 성격 설정, 상황적 역할 연기, LlamaIndex를 활용한 검색 증강 생성(RAG) 구현을 통해 맥락 인식 가능하고, 안전하며 브랜드에 부합하는 AI 응답을 만드는 전략적 방법을 설명합니다.

학습 결과:

  • 파라미터 집약적인 미세조정에서 효율적인 프롬프트 기반 추론으로의 전환을 설명할 수 있다.
  • 모델 행동과 출력 분포를 안내하기 위해 성격 설정과 상황적 역할 연기를 설계하고 구현할 수 있다.
  • 파이썬과 LlamaIndex 프레임워크를 사용하여 작동 가능한 RAG 파이프라인을 구축할 수 있다.