EvoClass | Education That Evolves With You

📚 콘텐츠 개요

이 과정은 대규모 언어 모델(LLM)의 진화, 핵심 기술적 아키텍처, 훈련 방식(사전 훈련, 미세 조정, 정렬), 다중 모달 확장, 프롬프트 엔지니어링, 사고 체인(Chain of Thought, CoT), 에이전트, 그리고 모델 안전성과 개인정보 보호와 같은 최전선 주제에 대한 포괄적이고 심층적인 소개를 제공합니다.

전체 스택 대규모 모델의 기술적 진화와 안전성 정렬에 대한 깊이 있는 분석: 사전 훈련에서 일반 에이전트까지.

🎯 학습 목표

모델 아키텍처 구분하기: 인코더만 사용하는, 디코더만 사용하는, 인코더-디코더 아키텍처의 구조적 차이와 활용 사례를 식별한다.
LLM 훈련 파이프라인 설명하기: 자기 지도적 사전 훈련에서부터 감독 미세 조정(SFT) 및 인간 피드백을 통한 강화 학습(RLHF)으로의 전환 과정을 설명한다.
모델 규모 및 행동 분석하기: 규모 법칙, 등장 능력(문맥 내 학습, 사고 체인), 환각 현상 등의 개념을 설명한다.
인코더만 사용하는(BERT), 디코더만 사용하는(GPT), 인코더-디코더(T5) 아키텍처 간의 구조적 차이를 분석한다.
세 단계 훈련 과정 설명하기: 사전 훈련(베이스 모델), 지시 미세 조정(SFT), 정렬(RLHF/PPO).
GPT, Llama, Qwen, DeepSeek 등 주류 LLM들의 성능, 규모 법칙, 아키텍처 혁신을 비교한다.
구조화된 데이터 추출 및 분류를 위한 제로샷 및 패시샷 프롬프트 전략을 구현한다.
창의적 출력과 결정론적 출력 사이의 균형을 위해 모델 하이퍼파라미터(온도, Top P, 패널티)를 조정한다.
수동, 자동, 제로샷("단계적으로 생각해 봅시다") 방법을 활용하여 효과적인 사고 체인(CoT) 프롬프트를 구성한다.
CoT 유형 분석 및 비교하기: 자기 일관성, 사고 프로그램(PoT), 사고 트리(ToT), 사고 그래프(GoT) 아키텍처의 차이점을 구분한다.

개요: 이 수업은 대규모 언어 모델(LLM)의 활용성과 보안 사이의 균형을 다루며, "해킹 공격"의 메커니즘과 스테가노그래피 기술적 구현에 초점을 맞춘다. 공격자가 정교한 프롬프트 엔지니어링을 통해(예: DAN, STAN) 안전 필터를 회피하는 방식과, 토큰 생성 과정에 데이터를 임베딩함으로써 은밀한 통신을 수행할 수 있는 방식을 설명한다. 또한 이미지, 오디오, 비디오와 같은 다양한 데이터 유형을 처리하고 생성하는 다중 모달 대규모 언어 모델(MLLM)의 아키텍처와 기능을 소개한다.

학습 결과:

일반적인 해킹 공격 패턴 식별 및 분석하기: 역할 놀이(DAN), 인지적 강압(PUA), 사이드채널 방법(암호/코드).
LLM 스테가노그래피의 기술적 메커니즘 설명하기: 비트스트림이 다음 토큰 예측의 확률 분포(logits)로 매핑되는 방식.
다양한 모달(텍스트, 이미지, 오디오, 3D)을 인식하고 생성할 수 있는 능력에 따라 MLLM 아키텍처를 분류한다.

대규모 언어 모델 심층 탐구

수업

Lesson

강좌 개요

📚 콘텐츠 개요

🎯 학습 목표

수업