Quay lại Khóa học
MATH003 Undergraduate

Xác suất và Thống kê: Khoa học của Sự Không Chắc chắn

Một khóa học tổng quan cấp đại học về nền tảng toán học của xác suất và thống kê. Khóa học yêu cầu một năm học giải tích, bao gồm các mô hình xác suất, biến ngẫu nhiên, kỳ vọng, phân bố lấy mẫu, khả năng xảy ra và suy luận Bayesian, cũng như mối quan hệ giữa các biến.

4.9
33.0h
736 học viên
0 lượt thích
Toán học
Bắt đầu học

Tổng quan khóa học

📚 Tóm tắt Nội dung

Một khóa học đại học toàn diện về nền tảng toán học của xác suất và thống kê. Khóa học yêu cầu kiến thức một năm giải tích, bao gồm các chủ đề như mô hình xác suất, biến ngẫu nhiên, kỳ vọng, phân bố lấy mẫu, suy luận khả năng và suy luận Bayesian, cũng như mối quan hệ giữa các biến.

Thành thạo môn khoa học toán học nghiêm ngặt về sự bất định thông qua xác suất dựa trên giải tích và suy luận thống kê.

Tác giả: Michael J. Evans và Jeffrey S. Rosenthal

Lời cảm ơn: Các tác giả xin ghi nhận những đóng góp từ nhiều nhà đánh giá và đồng nghiệp tại các trường đại học như Đại học Toronto, Đại học McMaster và Đại học Purdue. Việc tài trợ và hỗ trợ cơ sở hạ tầng từ Đại học Toronto cũng được ghi nhận.

🎯 Mục tiêu Học tập

  1. Định nghĩa một mô hình xác suất chính thức bằng không gian mẫu, sự kiện và các đo lường xác suất.
  2. Áp dụng các nguyên lý tổ hợp (hoán vị, tập con, hệ số nhị thức) để giải các bài toán xác suất đều.
  3. Sử dụng Luật Tổng Xác suất và Định lý Bayes để phân tích các hệ thống đa giai đoạn và cập nhật niềm tin dựa trên thông tin mới.
  4. Định nghĩa và phân biệt giữa các biến ngẫu nhiên rời rạc và liên tục tuyệt đối cùng các hàm xác suất/hàm mật độ tương ứng.
  5. Nhận diện và áp dụng các phân bố xác suất chính (Bernoulli, Nhị thức, Poisson, Chuẩn, v.v.) để mô hình hóa hiện tượng thực tế.
  6. Tính mật độ biên, phân bố điều kiện và đánh giá độc lập cho các phân bố đa biến.
  7. Tính kỳ vọng, phương sai và hiệp phương sai cho các biến ngẫu nhiên rời rạc, liên tục và hỗn hợp.
  8. Áp dụng Luật Vô ý Thống kê (LOTUS) và tính chất tuyến tính để tính kỳ vọng của các biến được biến đổi.
  9. Dùng Hàm Sinh Xác suất (PGF) và Hàm Sinh Kỳ vọng (MGF) để suy ra các moment.
  10. Định nghĩa và suy ra các phân bố lấy mẫu cho các hàm của dãy biến ngẫu nhiên độc lập và có cùng phân bố (i.i.d.).

🔹 Bài học 1: Cơ sở của Mô hình Xác suất

Tổng quan: Bài học này thiết lập khung toán học nghiêm ngặt cho xác suất, chuyển từ khái niệm trực giác "đo lường sự bất định" sang các mô hình tiên đề chính thức. Bài học bao gồm các thuộc tính cơ bản của các phép đo xác suất, các kỹ thuật đếm tổ hợp cho không gian hữu hạn, và các cơ chế nền tảng của xác suất điều kiện, bao gồm Định lý Bayes và tính liên tục của các phép đo xác suất.

Kết quả học tập:

  • Định nghĩa một mô hình xác suất chính thức bằng không gian mẫu, sự kiện và các đo lường xác suất.
  • Áp dụng các nguyên lý tổ hợp (hoán vị, tập con, hệ số nhị thức) để giải các bài toán xác suất đều.
  • Sử dụng Luật Tổng Xác suất và Định lý Bayes để phân tích các hệ thống đa giai đoạn và cập nhật niềm tin dựa trên thông tin mới.

🔹 Bài học 2: Biến ngẫu nhiên và Phân bố Xác suất

Tổng quan: Bài học này khám phá khung toán học để lượng hóa sự bất định thông qua các biến ngẫu nhiên (RV). Học viên sẽ tiến từ việc định nghĩa RV và phân bố của chúng (rời rạc và liên tục) đến hiểu rõ phân bố hợp, phép biến đổi và các phương pháp mô phỏng các biến này một cách số học. Nội dung nối liền xác suất dựa trên giải tích với các ứng dụng thực tiễn trong mô hình hóa và mô phỏng thống kê.

Kết quả học tập:

  • Định nghĩa và phân biệt giữa các biến ngẫu nhiên rời rạc và liên tục tuyệt đối cùng các hàm xác suất/hàm mật độ tương ứng.
  • Nhận diện và áp dụng các phân bố xác suất chính (Bernoulli, Nhị thức, Poisson, Chuẩn, v.v.) để mô hình hóa hiện tượng thực tế.
  • Tính mật độ biên, phân bố điều kiện và đánh giá độc lập cho các phân bố đa biến.

🔹 Bài học 3: Kỳ vọng Toán học và Moment

Tổng quan: Bài học này khám phá khái niệm cơ bản về kỳ vọng toán học như "trung bình dài hạn" của một biến ngẫu nhiên, mở rộng từ các trường hợp đơn giản rời rạc và liên tục đến các biến tổng quát bất kỳ. Chúng ta sẽ phân tích mức độ biến động của dữ liệu thông qua phương sai và hiệp phương sai, sử dụng các hàm sinh (PGF, MGF, và Hàm Đặc trưng) để đơn giản hóa việc tính moment, và áp dụng các bất đẳng thức xác suất mạnh mẽ để giới hạn các phân bố chưa biết. Cuối cùng, khóa học đề cập đến kỳ vọng điều kiện và Luật Tổng Kỳ vọng, những công cụ cần thiết để phân tích các quá trình ngẫu nhiên phức tạp nhiều giai đoạn.

Kết quả học tập:

  • Tính kỳ vọng, phương sai và hiệp phương sai cho các biến ngẫu nhiên rời rạc, liên tục và hỗn hợp.
  • Áp dụng Luật Vô ý Thống kê (LOTUS) và tính chất tuyến tính để tính kỳ vọng của các biến được biến đổi.
  • Suy ra moment bằng cách dùng Hàm Sinh Xác suất (PGF) và Hàm Sinh Kỳ vọng (MGF).

🔹 Bài học 4: Phân bố Lấy mẫu và Các Định lý Giới hạn

Tổng quan: Bài học này khám phá hành vi của các biến ngẫu nhiên khi chúng là hàm của một mẫu (phân bố lấy mẫu) và cách các phân bố đó hành xử khi kích thước mẫu tăng lên (các định lý giới hạn). Học viên sẽ nắm vững quá trình chuyển đổi từ các phân bố mẫu hữu hạn sang các xấp xỉ tiệm cận như Định lý Giới hạn Trung tâm, và tìm hiểu các phương pháp tính toán như xấp xỉ Monte Carlo và Phương pháp Mẫu Trọng số.

Kết quả học tập:

  • Định nghĩa và suy ra phân bố lấy mẫu cho các hàm của dãy i.i.d.
  • Phân biệt và áp dụng Hội tụ theo Xác suất và Hội tụ theo Phân bố.
  • Sử dụng Định lý Giới hạn Trung tâm và Xấp xỉ Chuẩn cho Nhị thức để ước lượng xác suất.

🔹 Bài học 5: Cơ sở của Suy luận Thống kê

Tổng quan: Bài học này khám phá bước chuyển từ xác suất thuần túy sang suy luận thống kê, thảo luận về cách chúng ta dùng dữ liệu quan sát để đưa ra các khẳng định về các phép đo xác suất thực sự bên trong một hệ thống. Học viên sẽ học cách xây dựng các mô hình thống kê chính thức (Bernoulli và Chuẩn), hiểu rõ các phương pháp thu thập dữ liệu chặt chẽ như lấy mẫu ngẫu nhiên đơn và lấy mẫu phân tầng từ quần thể hữu hạn, và tóm tắt kết quả qua các thống kê mô tả, biểu đồ tần suất và hàm phân bố thực nghiệm.

Kết quả học tập:

  • Định nghĩa vai trò của suy luận thống kê trong việc giải quyết sự bất định do biến động và dữ liệu hạn chế.
  • Xây dựng và diễn giải các mô hình thống kê, xác định tham số và không gian tham số.
  • Phân biệt giữa đặc điểm quần thể và ước lượng mẫu bằng các kỹ thuật lấy mẫu ngẫu nhiên đơn và phân tầng.

🔹 Bài học 6: Suy luận Dựa trên Khả năng

Tổng quan: Bài học này khám phá nền tảng lý thuyết và ứng dụng thực tiễn của suy luận thống kê dựa trên khả năng. Nó đi từ các khái niệm cơ bản như Nguyên lý Khả năng và Tính đủ, đến việc ước lượng tham số bằng Phương pháp Ước lượng Cực đại Khả năng (MLE), và đánh giá các ước lượng này thông qua độ lệch, tính hội tụ và sai số chuẩn. Ngoài ra, bài học còn đề cập đến cả phương pháp tham số (khoảng tin cậy z, khoảng tin cậy t, kiểm định giả thuyết) và phương pháp phi tham số (Phương pháp Moment, Bootstrapping, Thống kê Dấu), kết thúc bằng nghiên cứu nâng cao về Tính Tiệm cận Chuẩn và Thông tin Fisher.

Kết quả học tập:

  • Định nghĩa và áp dụng Hàm Khả năng và Định lý Phân tích để xác định Thống kê Đủ và Đủ Tối thiểu.
  • Tính ước lượng cực đại khả năng (MLE) và đánh giá chất lượng của chúng bằng Sai số Bình phương Trung bình (MSE), Độ lệch và Tính hội tụ.
  • Xây dựng và diễn giải Khoảng tin cậy và Giá trị p cho nhiều mô hình thống kê bằng cả kỹ thuật tham số và phi tham số.

🔹 Bài học 7: Suy luận Thống kê Bayesian

Tổng quan: Bài học này khám phá khung suy luận thống kê Bayesian, nơi các tham số được coi là biến ngẫu nhiên với phân bố xác suất. Học viên sẽ học cách kết hợp niềm tin ban đầu (Phân bố Trước) với dữ liệu quan sát (Khả năng) để tạo ra niềm tin được cập nhật (Phân bố Sau). Chương trình bao gồm các nền tảng lý thuyết, kỹ thuật ước lượng thực tiễn (Tỷ số Bayes, Dự báo), các phương pháp tính toán (Mẫu Gibbs, Tính Tiệm cận Chuẩn), và lựa chọn chiến lược các phân bố trước.

Kết quả học tập:

  • Tính phân bố sau bằng Định lý Bayes cho nhiều mô hình, bao gồm các họ liên hợp.
  • Thực hiện ước lượng Bayesian (trung bình, mode) và kiểm định giả thuyết bằng Tỷ số Bayes.
  • Xây dựng phân bố dự báo sau để dự đoán các quan sát tương lai.

🔹 Bài học 8: Suy luận Tối ưu và Lý thuyết Quyết định

Tổng quan: Bài học này khám phá nền tảng toán học để tìm ra các "phương pháp thống kê tốt nhất". Chúng ta chuyển từ ước lượng cơ bản sang ước lượng không thiên lệch tối ưu (UMVU), phát triển lý thuyết Kiểm định Có hiệu lực Nhất (UMP) qua Định lý Neyman-Pearson, và tích hợp quan điểm Bayesian cùng Lý thuyết Quyết định để đánh giá ước lượng và kiểm định bằng các hàm tổn thất và rủi ro.

Kết quả học tập:

  • Áp dụng Định lý Rao-Blackwell và Định lý Lehmann-Scheffé để suy ra các ước lượng UMVU.
  • Sử dụng Bất đẳng thức Thông tin Cramer-Rao để xác định giới hạn dưới cơ bản cho phương sai của các ước lượng không thiên lệch.
  • Xây dựng Kiểm định Có hiệu lực Nhất (UMP) bằng Định lý Neyman-Pearson và đánh giá chúng qua hàm sức mạnh và các loại sai sót.

🔹 Bài học 9: Kiểm tra Mô hình và Chẩn đoán

Tổng quan: Bài học này khám phá quy trình quan trọng để kiểm chứng các giả định đã đặt ra trong mô hình thống kê. Học viên sẽ học cách dùng các thống kê sai lệch và phụ trợ để kiểm tra mô hình lấy mẫu, sử dụng các công cụ trực quan như biểu đồ phần dư và biểu đồ xác suất, và thực hiện các kiểm định hình thức như Kiểm định Chi-bình phương và Kiểm định Chính xác Fisher. Ngoài ra, bài học còn đề cập đến kiểm tra mô hình Bayesian qua phân tích xung đột giữa phân bố trước và dữ liệu, và cảnh báo về các sai lầm thống kê khi thực hiện nhiều kiểm tra song song.

Kết quả học tập:

  • Định nghĩa và nhận diện các Thống kê Phụ trợ và Thống kê Sai lệch dùng để đo lường sự lệch khỏi mô hình.
  • Xây dựng và diễn giải Phần dư Chuẩn hóa và Biểu đồ Xác suất Chuẩn để đánh giá tính chuẩn và phù hợp mô hình.
  • Áp dụng Kiểm định Phù hợp Chi-bình phương và Kiểm định Chính xác Fisher cho dữ liệu phân loại và nhóm.

🔹 Bài học 10: Mối quan hệ giữa các Biến và Hồi quy

Tổng quan: Bài học này khám phá cách các mô hình thống kê mô tả các mối quan hệ giữa các biến khác nhau. Từ định nghĩa cơ bản về mối quan hệ — dựa trên sự thay đổi trong các phân bố điều kiện — đến các kỹ thuật mô hình hóa tinh vi như Hồi quy tuyến tính đơn và hồi quy tuyến tính đa biến, Phân tích Phương sai (ANOVA) cho các biến dự báo phân loại, và Hồi quy Logistic cho phản hồi nhị phân. Học viên sẽ học cách ước lượng tham số bằng Phương pháp Bình phương bé nhất, đánh giá độ phù hợp mô hình qua R-bình phương và phân tích ANOVA, và kiểm tra giả định qua Phân tích Phần dư.

Kết quả học tập:

  • Định nghĩa và nhận diện mối quan hệ giữa các biến dựa trên các phân bố điều kiện.
  • Áp dụng Phương pháp Bình phương bé nhất để ước lượng tham số trong các mô hình hồi quy tuyến tính đơn và đa biến.
  • Sử dụng phân tích ANOVA và thống kê F để kiểm tra mức độ quan trọng của các biến dự báo và phát hiện tương tác.

🔹 Bài học 11: Giới thiệu về Quá trình Ngẫu nhiên

Tổng quan: Bài học này cung cấp nền tảng toàn diện về quá trình ngẫu nhiên – các hệ thống thay đổi một cách ngẫu nhiên theo thời gian. Học viên sẽ tiến từ các mô hình thời gian rời rạc như Đi bộ ngẫu nhiên đơn giản và Chuỗi Markov, đến các kỹ thuật tính toán nâng cao như MCMC (Mô phỏng Monte Carlo chuỗi Markov), và cuối cùng đến các quá trình thời gian liên tục bao gồm Martingale, Chuyển động Brown, và Quá trình Poisson.

Kết quả học tập:

  • Tính xác suất cho các đi bộ ngẫu nhiên và xác định khả năng "thua cuộc" trong các mô hình cá cược.
  • Phân tích chuỗi Markov về tính bất khả phân, chu kỳ và phân bố dừng.
  • Thiết kế và giải thích các thuật toán Mẫu Metropolis-Hastings và Gibbs cho các phân bố phức tạp.