EvoClass | Education That Evolves With You

📚 Riepilogo del contenuto

Questo corso offre un'introduzione completa e approfondita all'evoluzione dei Large Language Models (LLM), alle architetture tecniche fondamentali, ai paradigmi di addestramento (pre-addestramento, fine-tuning e allineamento), alle estensioni multimodali, all'ingegneria dei prompt, al Chain of Thought (CoT), agli agenti, nonché a temi avanzati come la sicurezza dei modelli e la protezione della privacy.

Analisi approfondita dell'evoluzione tecnologica e dell'allineamento alla sicurezza dei grandi modelli full-stack, dal pre-addestramento agli agenti generali.

🎯 Obiettivi didattici

Distinguere tra architetture dei modelli: Identificare le differenze strutturali e i casi d'uso per modelli Encoder-only, Decoder-only e Encoder-Decoder.
Spiegare il flusso di addestramento dei LLM: Descrivere la transizione dal pre-addestramento self-supervised al Supervised Fine-Tuning (SFT) e al Reinforcement Learning from Human Feedback (RLHF).
Analizzare la scalabilità e il comportamento del modello: Spiegare i concetti delle Scaling Laws, delle Abilità Emergenti (apprendimento in contesto, Chain of Thought) e del fenomeno delle Allucinazioni.
Analizzare le differenze strutturali tra architetture Encoder-only (BERT), Decoder-only (GPT) e Encoder-Decoder (T5).
Spiegare il processo di addestramento in tre fasi: Pre-addestramento (modello base), Instruction Tuning (SFT) e Allineamento (RLHF/PPO).
Confrontare prestazioni, leggi di scalabilità e innovazioni architetturali dei principali LLM come GPT, Llama, Qwen e DeepSeek.
Implementare strategie di prompting zero-shot e few-shot per l'estrazione e la classificazione di dati strutturati.
Calibrare i iperparametri del modello (Temperature, Top P, Penalties) per bilanciare output creativi e deterministici.
Costruire prompt efficaci di Chain-of-Thought (CoT) utilizzando metodi manuali, automatici e zero-shot ("Pensiamo passo dopo passo").
Analizzare e confrontare varianti di CoT: Differenziare tra Self-Consistency, Program of Thought (PoT), Tree-of-Thought (ToT) e Graph-of-Thought (GoT).

Panoramica: Questa lezione esplora l'equilibrio critico tra utilità e sicurezza dei Large Language Models (LLM), concentrandosi sui meccanismi degli attacchi "jailbreak" e sull'implementazione tecnica della steganografia. Copre come gli attaccanti eludano i filtri di sicurezza tramite ingegneria dei prompt sofisticata (es. DAN, STAN) e come i LLM possano essere usati per comunicazioni segrete incamerando dati nel processo di generazione dei token. Inoltre introduce l'architettura e le capacità dei Modelli Linguistici Multimodali (MLLM) nel elaborare e generare diversi tipi di dati come immagini, audio e video.

Risultati apprendimento:

Identificare e analizzare schemi comuni di attacco jailbreak, inclusi role-playing (DAN), coercizione cognitiva (PUA) e metodi side-channel (cifratura/codice).
Spiegare il meccanismo tecnico della steganografia LLM, in particolare come i bitstream siano mappati sulla distribuzione di probabilità (logits) delle previsioni del prossimo token.
Categorizzare architetture MLLM in base alla loro capacità di percepire e generare attraverso diverse modalità (Testo, Immagine, Audio, 3D).

Approfondimento sui Grandi Modelli Linguistici

Lezioni

Lesson

Panoramica del corso

📚 Riepilogo del contenuto

🎯 Obiettivi didattici

Lezioni