Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 8: Kiểm định phi tham số - Trần Lộc Hùng

pdf 130 trang huongle 3360
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 8: Kiểm định phi tham số - Trần Lộc Hùng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_hoc_chuong_8_k.pdf

Nội dung text: Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 8: Kiểm định phi tham số - Trần Lộc Hùng

  1. Lý thuyết Xác suất và Thống kê Toán học PGS.TS. Trần Lộc Hùng Tp. Hồ Chí Minh, 10/ 2013 Ngày 27 tháng 10 năm 2013 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 1 / 64
  2. TRƯỜNG ĐẠI HỌC TÀI CHÍNH-MARKETING KHOA CƠ BẢN, BỘ MÔN TOÁN-THỐNG KÊ PGS. TS. TRẦN LỘC HÙNG LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC Tp. Hồ Chí Minh, 10/2013 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 2 / 64
  3. Lý thuyết Xác suất và Thống kê Toán học PGS.TS. Trần Lộc Hùng Tp. Hồ Chí Minh, 10/ 2013 Ngày 27 tháng 10 năm 2013 Chương 8. Kiểm định phi tham số PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 3 / 64
  4. Cặp giả thuyết thống kê Hàm kiểm định Mức ý nghĩa Miền bác bỏ Miền chấp nhận Từ khóa (Key Words) Kiểm định phi tham số PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 4 / 64
  5. Hàm kiểm định Mức ý nghĩa Miền bác bỏ Miền chấp nhận Từ khóa (Key Words) Kiểm định phi tham số Cặp giả thuyết thống kê PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 4 / 64
  6. Mức ý nghĩa Miền bác bỏ Miền chấp nhận Từ khóa (Key Words) Kiểm định phi tham số Cặp giả thuyết thống kê Hàm kiểm định PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 4 / 64
  7. Miền bác bỏ Miền chấp nhận Từ khóa (Key Words) Kiểm định phi tham số Cặp giả thuyết thống kê Hàm kiểm định Mức ý nghĩa PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 4 / 64
  8. Miền chấp nhận Từ khóa (Key Words) Kiểm định phi tham số Cặp giả thuyết thống kê Hàm kiểm định Mức ý nghĩa Miền bác bỏ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 4 / 64
  9. Từ khóa (Key Words) Kiểm định phi tham số Cặp giả thuyết thống kê Hàm kiểm định Mức ý nghĩa Miền bác bỏ Miền chấp nhận PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 4 / 64
  10. 2 Kiểm định sự phù hợp giữa thực nghiệm và lý thuyết 3 Kiểm định tính độc lập 4 Kiểm định nhiều tỷ lệ 5 Phương pháp hạng Mann Whitney (đọc thêm) 6 Phương pháp dấu Wilcoxon (đọc thêm) 7 Bài tập Chương 8. Kiểm định phi tham số 1 Đặt vấn đề PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 5 / 64
  11. 3 Kiểm định tính độc lập 4 Kiểm định nhiều tỷ lệ 5 Phương pháp hạng Mann Whitney (đọc thêm) 6 Phương pháp dấu Wilcoxon (đọc thêm) 7 Bài tập Chương 8. Kiểm định phi tham số 1 Đặt vấn đề 2 Kiểm định sự phù hợp giữa thực nghiệm và lý thuyết PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 5 / 64
  12. 4 Kiểm định nhiều tỷ lệ 5 Phương pháp hạng Mann Whitney (đọc thêm) 6 Phương pháp dấu Wilcoxon (đọc thêm) 7 Bài tập Chương 8. Kiểm định phi tham số 1 Đặt vấn đề 2 Kiểm định sự phù hợp giữa thực nghiệm và lý thuyết 3 Kiểm định tính độc lập PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 5 / 64
  13. 5 Phương pháp hạng Mann Whitney (đọc thêm) 6 Phương pháp dấu Wilcoxon (đọc thêm) 7 Bài tập Chương 8. Kiểm định phi tham số 1 Đặt vấn đề 2 Kiểm định sự phù hợp giữa thực nghiệm và lý thuyết 3 Kiểm định tính độc lập 4 Kiểm định nhiều tỷ lệ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 5 / 64
  14. 6 Phương pháp dấu Wilcoxon (đọc thêm) 7 Bài tập Chương 8. Kiểm định phi tham số 1 Đặt vấn đề 2 Kiểm định sự phù hợp giữa thực nghiệm và lý thuyết 3 Kiểm định tính độc lập 4 Kiểm định nhiều tỷ lệ 5 Phương pháp hạng Mann Whitney (đọc thêm) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 5 / 64
  15. 7 Bài tập Chương 8. Kiểm định phi tham số 1 Đặt vấn đề 2 Kiểm định sự phù hợp giữa thực nghiệm và lý thuyết 3 Kiểm định tính độc lập 4 Kiểm định nhiều tỷ lệ 5 Phương pháp hạng Mann Whitney (đọc thêm) 6 Phương pháp dấu Wilcoxon (đọc thêm) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 5 / 64
  16. Chương 8. Kiểm định phi tham số 1 Đặt vấn đề 2 Kiểm định sự phù hợp giữa thực nghiệm và lý thuyết 3 Kiểm định tính độc lập 4 Kiểm định nhiều tỷ lệ 5 Phương pháp hạng Mann Whitney (đọc thêm) 6 Phương pháp dấu Wilcoxon (đọc thêm) 7 Bài tập PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 5 / 64
  17. 2 Xây dựng thuật toán (các thủ tục) để kiểm định 8.1 Đặt vấn đề Giả sử ωn = {X1, X2, , Xn} là một mẫu ngẫu nhiên sinh bởi biến ngẫu nhiên X nhưng chưa xác định được quy luật xác suất F (x, θ) của X . Đây là sự khác biệt cơ bản giữa kiểm định tham số và kiểm định phi tham số. Vấn đề đặt ra là: 1 Kiểm định giả thuyết thống kê về sự phù hợp giữa các dữ liệu nhận được và quy luật F (x, θ). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 6 / 64
  18. 8.1 Đặt vấn đề Giả sử ωn = {X1, X2, , Xn} là một mẫu ngẫu nhiên sinh bởi biến ngẫu nhiên X nhưng chưa xác định được quy luật xác suất F (x, θ) của X . Đây là sự khác biệt cơ bản giữa kiểm định tham số và kiểm định phi tham số. Vấn đề đặt ra là: 1 Kiểm định giả thuyết thống kê về sự phù hợp giữa các dữ liệu nhận được và quy luật F (x, θ). 2 Xây dựng thuật toán (các thủ tục) để kiểm định PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 6 / 64
  19. 2 Một vài ví dụ Vấn đề khác Giả sử X và Y là hai biến ngẫu nhiên, có các đặc tính x1, x2, , xm và y1, y2, , yn. Vấn đề đặt ra là: 1 Liệu các biến ngẫu nhiên X và Y có độc lập hay không? PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 7 / 64
  20. Vấn đề khác Giả sử X và Y là hai biến ngẫu nhiên, có các đặc tính x1, x2, , xm và y1, y2, , yn. Vấn đề đặt ra là: 1 Liệu các biến ngẫu nhiên X và Y có độc lập hay không? 2 Một vài ví dụ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 7 / 64
  21. 2 Tiêu chuẩn khi-binh phương (Quy tắc Pearson) 3 Thủ tục kiểm định 4 Ví dụ 8.2 Kiểm định tính phù hợp giữa thực nghiệm và lý thuyết 1 Bài toán PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 8 / 64
  22. 3 Thủ tục kiểm định 4 Ví dụ 8.2 Kiểm định tính phù hợp giữa thực nghiệm và lý thuyết 1 Bài toán 2 Tiêu chuẩn khi-binh phương (Quy tắc Pearson) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 8 / 64
  23. 4 Ví dụ 8.2 Kiểm định tính phù hợp giữa thực nghiệm và lý thuyết 1 Bài toán 2 Tiêu chuẩn khi-binh phương (Quy tắc Pearson) 3 Thủ tục kiểm định PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 8 / 64
  24. 8.2 Kiểm định tính phù hợp giữa thực nghiệm và lý thuyết 1 Bài toán 2 Tiêu chuẩn khi-binh phương (Quy tắc Pearson) 3 Thủ tục kiểm định 4 Ví dụ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 8 / 64
  25. Nếu biến X rời rạc, thì tập số liệu ωn = {X1, X2, , Xn} có thể chia thành k khoảng với các cỡ n1, n2, , nk , sao cho n = n1 + n2 + + nk Nếu biến X liên tục, thì xét số liệu trong các khoảng [xj , xj+1], j = 0, 1, 2, n Kiểm định tính phù hợp giữa thực nghiệm và lý thuyết Bài toán 1 Giả sử ωn = {X1, X2, , Xn} là một mẫu dữ liệu sinh từ biến ngẫu nhiên X. Liệu có thể nói dữ liệu nhận được có phù hợp với quy luật xác suất F (x, θ) của biến X hay không? Tức là Kiểm định giả thuyết thống kê (H0 : X ∈ F (x, θ) | H0 : X ∈/ F (x, θ)) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 9 / 64
  26. Nếu biến X liên tục, thì xét số liệu trong các khoảng [xj , xj+1], j = 0, 1, 2, n Kiểm định tính phù hợp giữa thực nghiệm và lý thuyết Bài toán 1 Giả sử ωn = {X1, X2, , Xn} là một mẫu dữ liệu sinh từ biến ngẫu nhiên X. Liệu có thể nói dữ liệu nhận được có phù hợp với quy luật xác suất F (x, θ) của biến X hay không? Tức là Kiểm định giả thuyết thống kê (H0 : X ∈ F (x, θ) | H0 : X ∈/ F (x, θ)) Nếu biến X rời rạc, thì tập số liệu ωn = {X1, X2, , Xn} có thể chia thành k khoảng với các cỡ n1, n2, , nk , sao cho n = n1 + n2 + + nk PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 9 / 64
  27. Kiểm định tính phù hợp giữa thực nghiệm và lý thuyết Bài toán 1 Giả sử ωn = {X1, X2, , Xn} là một mẫu dữ liệu sinh từ biến ngẫu nhiên X. Liệu có thể nói dữ liệu nhận được có phù hợp với quy luật xác suất F (x, θ) của biến X hay không? Tức là Kiểm định giả thuyết thống kê (H0 : X ∈ F (x, θ) | H0 : X ∈/ F (x, θ)) Nếu biến X rời rạc, thì tập số liệu ωn = {X1, X2, , Xn} có thể chia thành k khoảng với các cỡ n1, n2, , nk , sao cho n = n1 + n2 + + nk Nếu biến X liên tục, thì xét số liệu trong các khoảng [xj , xj+1], j = 0, 1, 2, n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 9 / 64
  28. Cặp giả thuyết Cặp (H0 | H0) (H0 : X ∈ F (x, θ) | H0 : X ∈/ F (x, θ)) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 10 / 64
  29. 2 2 Nếu giả thuyết đầu H0 đúng thì χ có phân phối khi bình phương với (k-r-1) bậc tự do χ2 ∈ χ2(k − r − 1) 3 r là số tham số của phân phối F (x, θ) Hàm kiểm định 1 Thống kê k 2 X (nj − npj ) χ2 = npj j=1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 11 / 64
  30. 3 r là số tham số của phân phối F (x, θ) Hàm kiểm định 1 Thống kê k 2 X (nj − npj ) χ2 = npj j=1 2 2 Nếu giả thuyết đầu H0 đúng thì χ có phân phối khi bình phương với (k-r-1) bậc tự do χ2 ∈ χ2(k − r − 1) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 11 / 64
  31. Hàm kiểm định 1 Thống kê k 2 X (nj − npj ) χ2 = npj j=1 2 2 Nếu giả thuyết đầu H0 đúng thì χ có phân phối khi bình phương với (k-r-1) bậc tự do χ2 ∈ χ2(k − r − 1) 3 r là số tham số của phân phối F (x, θ) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 11 / 64
  32. Mức ý nghĩa Với mức ý nghĩa α ∈ (0, 1) cho trước, tra bảng khi-bình phương với (k-r-1) bậc tự do, xác định 2 χα(k − r − 1) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 12 / 64
  33. Miền bác bỏ 2 Với phân vị khi bình phương χα(k − r − 1) đã xác định, miền bác bỏ có dạng sau:   2 1 Miền bác bỏ Wα = χα(k − r − 1), +∞ đối với kiểm định (H0 : X ∈ F (x, θ) | H0 : X ∈/ F (x, θ). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 13 / 64
  34. 2 2 2 Nếu χ ∈/ (χα(k − r − 1), +∞), thì chấp nhận giả thuyết H0. Kiểm định 2 2 So sánh thống kê χ với phân vị khi bình phương χα(k − r − 1), ta có kết luận: 2 2 1 Nếu χ ∈ (χα(k − r − 1), +∞), thì bác bỏ giả thuyết H0. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 14 / 64
  35. Kiểm định 2 2 So sánh thống kê χ với phân vị khi bình phương χα(k − r − 1), ta có kết luận: 2 2 1 Nếu χ ∈ (χα(k − r − 1), +∞), thì bác bỏ giả thuyết H0. 2 2 2 Nếu χ ∈/ (χα(k − r − 1), +∞), thì chấp nhận giả thuyết H0. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 14 / 64
  36. Kiểm định khi bình phương Ví dụ 1 Quan sát số người vào giao dịch ngân hàng (rút tiền, chuyển khoản, sao kê, .) tại một máy ATM trong một thời gian xác định, có số liệu thống kê sau Xj : 0 1 2 3 4 5 6 nj : 17 22 26 20 11 2 2 1 X số người vào giao dịch 2 nj , j = 0, 1, 2, 3, 4, 5, 6 là số lần quan sát 3 Với mức ý nghĩa α = 0.01, có thể coi X có phân phối Poisson được 2 không? Cho biết χ0.01(5) = 15.1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 15 / 64
  37. 2 Ta có bài toán kiểm định sự phù hợp giữa thực nghiệm và lý thuyết (H0 : X ∈ P(λ) | H0 : X ∈/ P(λ)) 3 Cần phải xác định giá trị tham số λ. Chọn λ = X = 2 (Tại sao?) 4 Như vậy cặp giả thuyết thống kê sẽ là (H0 : X ∈ P(2) | H0 : X ∈/ P(2)) Lời giải 1 Gọi X là số người vào giao dịch tại một máy ATM trong một thời gian xác định PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 16 / 64
  38. 3 Cần phải xác định giá trị tham số λ. Chọn λ = X = 2 (Tại sao?) 4 Như vậy cặp giả thuyết thống kê sẽ là (H0 : X ∈ P(2) | H0 : X ∈/ P(2)) Lời giải 1 Gọi X là số người vào giao dịch tại một máy ATM trong một thời gian xác định 2 Ta có bài toán kiểm định sự phù hợp giữa thực nghiệm và lý thuyết (H0 : X ∈ P(λ) | H0 : X ∈/ P(λ)) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 16 / 64
  39. 4 Như vậy cặp giả thuyết thống kê sẽ là (H0 : X ∈ P(2) | H0 : X ∈/ P(2)) Lời giải 1 Gọi X là số người vào giao dịch tại một máy ATM trong một thời gian xác định 2 Ta có bài toán kiểm định sự phù hợp giữa thực nghiệm và lý thuyết (H0 : X ∈ P(λ) | H0 : X ∈/ P(λ)) 3 Cần phải xác định giá trị tham số λ. Chọn λ = X = 2 (Tại sao?) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 16 / 64
  40. Lời giải 1 Gọi X là số người vào giao dịch tại một máy ATM trong một thời gian xác định 2 Ta có bài toán kiểm định sự phù hợp giữa thực nghiệm và lý thuyết (H0 : X ∈ P(λ) | H0 : X ∈/ P(λ)) 3 Cần phải xác định giá trị tham số λ. Chọn λ = X = 2 (Tại sao?) 4 Như vậy cặp giả thuyết thống kê sẽ là (H0 : X ∈ P(2) | H0 : X ∈/ P(2)) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 16 / 64
  41. 2 Khi đó, hàm kiểm định có giá trị 6 2 X (nj − npj ) χ2 = = 3.76925 npj j=0 Lời giải (tiếp tục) 1 Nếu giả thuyết H0 : X ∈ P(2) đúng, thì các xác suất e−22j p = P(X = j) = , j = 0, 1, , 6 j j! PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 17 / 64
  42. Lời giải (tiếp tục) 1 Nếu giả thuyết H0 : X ∈ P(2) đúng, thì các xác suất e−22j p = P(X = j) = , j = 0, 1, , 6 j j! 2 Khi đó, hàm kiểm định có giá trị 6 2 X (nj − npj ) χ2 = = 3.76925 npj j=0 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 17 / 64
  43. 2 Miền bác bỏ W0.01 = (15.1, +∞) 2 3 Do χ ∈/ W0.01, nên chấp nhận giả thuyết ban đầu H0 : X ∈ P(2) 4 Kết luận: số người vào giao dịch tại trạm ATM có phân phối Poisson với tham số 2 (với mức ý nghĩa 0.01) Lời giải (tiếp tục) 1 Với mức ý nghĩa α = 0.01, tra bảng χ2 xác định 2 χ0.01(7 − 1 − 1) = 15.1 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 18 / 64
  44. 2 3 Do χ ∈/ W0.01, nên chấp nhận giả thuyết ban đầu H0 : X ∈ P(2) 4 Kết luận: số người vào giao dịch tại trạm ATM có phân phối Poisson với tham số 2 (với mức ý nghĩa 0.01) Lời giải (tiếp tục) 1 Với mức ý nghĩa α = 0.01, tra bảng χ2 xác định 2 χ0.01(7 − 1 − 1) = 15.1 2 Miền bác bỏ W0.01 = (15.1, +∞) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 18 / 64
  45. 4 Kết luận: số người vào giao dịch tại trạm ATM có phân phối Poisson với tham số 2 (với mức ý nghĩa 0.01) Lời giải (tiếp tục) 1 Với mức ý nghĩa α = 0.01, tra bảng χ2 xác định 2 χ0.01(7 − 1 − 1) = 15.1 2 Miền bác bỏ W0.01 = (15.1, +∞) 2 3 Do χ ∈/ W0.01, nên chấp nhận giả thuyết ban đầu H0 : X ∈ P(2) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 18 / 64
  46. Lời giải (tiếp tục) 1 Với mức ý nghĩa α = 0.01, tra bảng χ2 xác định 2 χ0.01(7 − 1 − 1) = 15.1 2 Miền bác bỏ W0.01 = (15.1, +∞) 2 3 Do χ ∈/ W0.01, nên chấp nhận giả thuyết ban đầu H0 : X ∈ P(2) 4 Kết luận: số người vào giao dịch tại trạm ATM có phân phối Poisson với tham số 2 (với mức ý nghĩa 0.01) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 18 / 64
  47. 2 N < −c(17, 22, 26, 20, 11, 2, 2) - "tạo vector N" 3 tbm < −sum(X ∗ N)/sum(N) - "tính trung bình mẫu" e−2(2)j 4 pj = P(X = xj ) = j! - "tính các xác suất thành phần" 5 P < −c(p0, p1, p2, p3, p4, p5, p6) - " Tạo vector xác suất P" 6 chi1 < −sum((N − sum(N) ∗ P)2/(sum(N) ∗ P)) - "tính giá trị hàm kiểm định" 7 chi1 = 3.76925 - "Kết quả" Sử dụng ngôn ngữ R 1 X < −c(0 : 6) - "tạo vector X có giá trị từ 0 tới 6" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 19 / 64
  48. 3 tbm < −sum(X ∗ N)/sum(N) - "tính trung bình mẫu" e−2(2)j 4 pj = P(X = xj ) = j! - "tính các xác suất thành phần" 5 P < −c(p0, p1, p2, p3, p4, p5, p6) - " Tạo vector xác suất P" 6 chi1 < −sum((N − sum(N) ∗ P)2/(sum(N) ∗ P)) - "tính giá trị hàm kiểm định" 7 chi1 = 3.76925 - "Kết quả" Sử dụng ngôn ngữ R 1 X < −c(0 : 6) - "tạo vector X có giá trị từ 0 tới 6" 2 N < −c(17, 22, 26, 20, 11, 2, 2) - "tạo vector N" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 19 / 64
  49. e−2(2)j 4 pj = P(X = xj ) = j! - "tính các xác suất thành phần" 5 P < −c(p0, p1, p2, p3, p4, p5, p6) - " Tạo vector xác suất P" 6 chi1 < −sum((N − sum(N) ∗ P)2/(sum(N) ∗ P)) - "tính giá trị hàm kiểm định" 7 chi1 = 3.76925 - "Kết quả" Sử dụng ngôn ngữ R 1 X < −c(0 : 6) - "tạo vector X có giá trị từ 0 tới 6" 2 N < −c(17, 22, 26, 20, 11, 2, 2) - "tạo vector N" 3 tbm < −sum(X ∗ N)/sum(N) - "tính trung bình mẫu" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 19 / 64
  50. 5 P < −c(p0, p1, p2, p3, p4, p5, p6) - " Tạo vector xác suất P" 6 chi1 < −sum((N − sum(N) ∗ P)2/(sum(N) ∗ P)) - "tính giá trị hàm kiểm định" 7 chi1 = 3.76925 - "Kết quả" Sử dụng ngôn ngữ R 1 X < −c(0 : 6) - "tạo vector X có giá trị từ 0 tới 6" 2 N < −c(17, 22, 26, 20, 11, 2, 2) - "tạo vector N" 3 tbm < −sum(X ∗ N)/sum(N) - "tính trung bình mẫu" e−2(2)j 4 pj = P(X = xj ) = j! - "tính các xác suất thành phần" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 19 / 64
  51. 6 chi1 < −sum((N − sum(N) ∗ P)2/(sum(N) ∗ P)) - "tính giá trị hàm kiểm định" 7 chi1 = 3.76925 - "Kết quả" Sử dụng ngôn ngữ R 1 X < −c(0 : 6) - "tạo vector X có giá trị từ 0 tới 6" 2 N < −c(17, 22, 26, 20, 11, 2, 2) - "tạo vector N" 3 tbm < −sum(X ∗ N)/sum(N) - "tính trung bình mẫu" e−2(2)j 4 pj = P(X = xj ) = j! - "tính các xác suất thành phần" 5 P < −c(p0, p1, p2, p3, p4, p5, p6) - " Tạo vector xác suất P" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 19 / 64
  52. 7 chi1 = 3.76925 - "Kết quả" Sử dụng ngôn ngữ R 1 X < −c(0 : 6) - "tạo vector X có giá trị từ 0 tới 6" 2 N < −c(17, 22, 26, 20, 11, 2, 2) - "tạo vector N" 3 tbm < −sum(X ∗ N)/sum(N) - "tính trung bình mẫu" e−2(2)j 4 pj = P(X = xj ) = j! - "tính các xác suất thành phần" 5 P < −c(p0, p1, p2, p3, p4, p5, p6) - " Tạo vector xác suất P" 6 chi1 < −sum((N − sum(N) ∗ P)2/(sum(N) ∗ P)) - "tính giá trị hàm kiểm định" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 19 / 64
  53. Sử dụng ngôn ngữ R 1 X < −c(0 : 6) - "tạo vector X có giá trị từ 0 tới 6" 2 N < −c(17, 22, 26, 20, 11, 2, 2) - "tạo vector N" 3 tbm < −sum(X ∗ N)/sum(N) - "tính trung bình mẫu" e−2(2)j 4 pj = P(X = xj ) = j! - "tính các xác suất thành phần" 5 P < −c(p0, p1, p2, p3, p4, p5, p6) - " Tạo vector xác suất P" 6 chi1 < −sum((N − sum(N) ∗ P)2/(sum(N) ∗ P)) - "tính giá trị hàm kiểm định" 7 chi1 = 3.76925 - "Kết quả" PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 19 / 64
  54. 8.3 Kiểm định tính độc lập Bài toán 2 Giả sử biến ngẫu nhiên X có r đặc tính và Y có s đặc tính, s 6= r. Biểu diễn các biến ngẫu nhiên X và Y qua X = (x1, x2, , xr ) và Y = (y1, y2, , ys ). Cần kiểm định giả thuyết đầu H0 : X , Y độc lập PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 20 / 64
  55. Tần số đồng thời nij = (X = xi , Y = yj ), i = 1, 2, r, j = 1, 2, , s Pr Ps Ps Pr Dễ thấy j=1 nij = ni ; i=1 nij = mj ; j=1 mj = n; i=1 ni = n Chú ý Biến ngẫu nhiên X có r đặc tính, biến ngẫu nhiên Y có s đặc tính. Có thể biểu diễn qua bảng (rs) phần tử PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 21 / 64
  56. Pr Ps Ps Pr Dễ thấy j=1 nij = ni ; i=1 nij = mj ; j=1 mj = n; i=1 ni = n Chú ý Biến ngẫu nhiên X có r đặc tính, biến ngẫu nhiên Y có s đặc tính. Có thể biểu diễn qua bảng (rs) phần tử Tần số đồng thời nij = (X = xi , Y = yj ), i = 1, 2, r, j = 1, 2, , s PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 21 / 64
  57. Chú ý Biến ngẫu nhiên X có r đặc tính, biến ngẫu nhiên Y có s đặc tính. Có thể biểu diễn qua bảng (rs) phần tử Tần số đồng thời nij = (X = xi , Y = yj ), i = 1, 2, r, j = 1, 2, , s Pr Ps Ps Pr Dễ thấy j=1 nij = ni ; i=1 nij = mj ; j=1 mj = n; i=1 ni = n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 21 / 64
  58. Cặp giả thuyết Cặp giả thuyết được đưa ra Cặp (H0 | H0) (H0 : X , Y độc lập | H0 : X , Y không độc lập) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 22 / 64
  59. 2 Nếu giả thuyết đầu H0 đúng thì χ có phân phối khi bình phương với (r-1)(s-1) bậc tự do Hàm kiểm định Thống kê r s ni mj 2 2 X X (nij − n ) χ = ni mj i=1 j=1 n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 23 / 64
  60. Hàm kiểm định Thống kê r s ni mj 2 2 X X (nij − n ) χ = ni mj i=1 j=1 n 2 Nếu giả thuyết đầu H0 đúng thì χ có phân phối khi bình phương với (r-1)(s-1) bậc tự do PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 23 / 64
  61. Mức ý nghĩa Với mức ý nghĩa α ∈ (0, 1) cho trước và bậc tự do (r-1)(s-1) xác định, tra bảng khi bình phương, ta có phân vị 2 Phân vị khi bình phương χα(r − 1)(s − 1) cho kiểm định giả thuyết đầu (H0 : X , Y độc lập | H0 : X , Y không độc lập) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 24 / 64
  62. Miền bác bỏ 2 Với các phân vị khi bình phương χα(r − 1)(s − 1) đã xác định, miền bác bỏ có dạng sau: Miền bác bỏ   2 Miền bác bỏ Wα = χα(r − 1)(s − 1), +∞ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 25 / 64
  63.   2 2 2 Nếu χ ∈/ χα(r − 1)(s − 1), +∞ , thì chấp nhận giả thuyết H0, khi đó X và Y độc lập Kiểm định 2 2 So sánh thống kê χ với phân vị χα(r − 1)(s − 1), có kết luận:   2 2 1 Nếu χ ∈ χα(r − 1)(s − 1), +∞ , thì bác bỏ giả thuyết H0, khi đó X và Y không độc lập. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 26 / 64
  64. Kiểm định 2 2 So sánh thống kê χ với phân vị χα(r − 1)(s − 1), có kết luận:   2 2 1 Nếu χ ∈ χα(r − 1)(s − 1), +∞ , thì bác bỏ giả thuyết H0, khi đó X và Y không độc lập.   2 2 2 Nếu χ ∈/ χα(r − 1)(s − 1), +∞ , thì chấp nhận giả thuyết H0, khi đó X và Y độc lập PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 26 / 64
  65. Kiểm định tính độc lập Ví dụ 2 Có 4 phân xưởng A, B, C và D với số công nhân tương ứng là 150, 170, 160 và 120. Sau một đợt cúm các phân xưởng có số công nhân bị ốm phải nghỉ làm lần lượt là 29, 39, 25 và 56. Số công nhân mệt nhưng vẫn làm việc lần lượt là 21, 11, 35, 24. Với α = 0.05 hãy xét xem tìn trạng sức khỏe của công nhân có phụ thuộc vào việc họ làm việc ở phân xưởng nào hay không? PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 27 / 64
  66. 2 Gọi Y là tình trạng sức khỏe của công nhân. Y có ba đặc tính: khỏe, mệt (vẫn làm việc) và ốm (nghỉ việc) 3 Giả thuyết cần kiểm định (H0 : X , Y độc lập | H0 : X , Y không độc lập) Lời giải 1 Gọi X là phân xưởng. X có 4 đặc tính A, B, C và D PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 28 / 64
  67. 3 Giả thuyết cần kiểm định (H0 : X , Y độc lập | H0 : X , Y không độc lập) Lời giải 1 Gọi X là phân xưởng. X có 4 đặc tính A, B, C và D 2 Gọi Y là tình trạng sức khỏe của công nhân. Y có ba đặc tính: khỏe, mệt (vẫn làm việc) và ốm (nghỉ việc) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 28 / 64
  68. Lời giải 1 Gọi X là phân xưởng. X có 4 đặc tính A, B, C và D 2 Gọi Y là tình trạng sức khỏe của công nhân. Y có ba đặc tính: khỏe, mệt (vẫn làm việc) và ốm (nghỉ việc) 3 Giả thuyết cần kiểm định (H0 : X , Y độc lập | H0 : X , Y không độc lập) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 28 / 64
  69. 2 Với mức ý nghĩa α = 0.05, tra bảng khi bình phương, xác định 2 χ0.05(3) = 12.59 3 Miền bác bỏ Wα = (12.59, +∞) 2 4 Do χ ∈ Wα, nên bác bỏ giả thuyết ban đầu H0 5 Kết luận: X và Y phụ thuộc (với mức ý nghĩa 0.05) Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P3 n Hàm kiểm định χ = i=1 j=1 ni mj = 64.45 n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 29 / 64
  70. 3 Miền bác bỏ Wα = (12.59, +∞) 2 4 Do χ ∈ Wα, nên bác bỏ giả thuyết ban đầu H0 5 Kết luận: X và Y phụ thuộc (với mức ý nghĩa 0.05) Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P3 n Hàm kiểm định χ = i=1 j=1 ni mj = 64.45 n 2 Với mức ý nghĩa α = 0.05, tra bảng khi bình phương, xác định 2 χ0.05(3) = 12.59 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 29 / 64
  71. 2 4 Do χ ∈ Wα, nên bác bỏ giả thuyết ban đầu H0 5 Kết luận: X và Y phụ thuộc (với mức ý nghĩa 0.05) Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P3 n Hàm kiểm định χ = i=1 j=1 ni mj = 64.45 n 2 Với mức ý nghĩa α = 0.05, tra bảng khi bình phương, xác định 2 χ0.05(3) = 12.59 3 Miền bác bỏ Wα = (12.59, +∞) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 29 / 64
  72. 5 Kết luận: X và Y phụ thuộc (với mức ý nghĩa 0.05) Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P3 n Hàm kiểm định χ = i=1 j=1 ni mj = 64.45 n 2 Với mức ý nghĩa α = 0.05, tra bảng khi bình phương, xác định 2 χ0.05(3) = 12.59 3 Miền bác bỏ Wα = (12.59, +∞) 2 4 Do χ ∈ Wα, nên bác bỏ giả thuyết ban đầu H0 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 29 / 64
  73. Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P3 n Hàm kiểm định χ = i=1 j=1 ni mj = 64.45 n 2 Với mức ý nghĩa α = 0.05, tra bảng khi bình phương, xác định 2 χ0.05(3) = 12.59 3 Miền bác bỏ Wα = (12.59, +∞) 2 4 Do χ ∈ Wα, nên bác bỏ giả thuyết ban đầu H0 5 Kết luận: X và Y phụ thuộc (với mức ý nghĩa 0.05) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 29 / 64
  74. 8.4 Kiểm định nhiều tỷ lệ Bài toán 3 Giả sử có s đối tượng (s tỷ lệ), mỗi đối tượng được chia theo 2 dấu hiệu đối lập (tốt-xấu, đúng-sai, sống chết, có tác dụng-không tác dụng ) Với mức ý nghĩa α ∈ (0, 1), cần kiểm định giả thuyết thống kê H0 : p1 = p2 = = ps với đối thuyết H0 : p1 6= p2 6= 6= ps PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 30 / 64
  75. Tần số đồng thời nij = (X = xi , Y = yj ), i = 1, 2, s, j = 1, 2 P2 Ps Ps P2 Dễ thấy j=1 nij = ni ; i=1 nij = mj ; j=1 mj = n; i=1 ni = n Chú ý Có thể coi như bài toán 2 với biến ngẫu nhiên X có s đặc tính, biến ngẫu nhiên Y có 2 đặc tính. Như vậy, số liệu có thể biểu diễn qua bảng (2s) phần tử PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 31 / 64
  76. P2 Ps Ps P2 Dễ thấy j=1 nij = ni ; i=1 nij = mj ; j=1 mj = n; i=1 ni = n Chú ý Có thể coi như bài toán 2 với biến ngẫu nhiên X có s đặc tính, biến ngẫu nhiên Y có 2 đặc tính. Như vậy, số liệu có thể biểu diễn qua bảng (2s) phần tử Tần số đồng thời nij = (X = xi , Y = yj ), i = 1, 2, s, j = 1, 2 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 31 / 64
  77. Chú ý Có thể coi như bài toán 2 với biến ngẫu nhiên X có s đặc tính, biến ngẫu nhiên Y có 2 đặc tính. Như vậy, số liệu có thể biểu diễn qua bảng (2s) phần tử Tần số đồng thời nij = (X = xi , Y = yj ), i = 1, 2, s, j = 1, 2 P2 Ps Ps P2 Dễ thấy j=1 nij = ni ; i=1 nij = mj ; j=1 mj = n; i=1 ni = n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 31 / 64
  78. Cặp giả thuyết Cặp giả thuyết được đưa ra Cặp (H0 | H0) H0 : p1 = p2 = = ps với đối thuyết H0 : p1 6= p2 6= 6= ps . PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 32 / 64
  79. 2 Nếu giả thuyết đầu H0 đúng thì χ có phân phối khi bình phương với (s-1) bậc tự do Hàm kiểm định Thống kê 2 s ni mj 2 2 X X (nij − n ) χ = ni mj i=1 j=1 n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 33 / 64
  80. Hàm kiểm định Thống kê 2 s ni mj 2 2 X X (nij − n ) χ = ni mj i=1 j=1 n 2 Nếu giả thuyết đầu H0 đúng thì χ có phân phối khi bình phương với (s-1) bậc tự do PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 33 / 64
  81. Mức ý nghĩa Với mức ý nghĩa α ∈ (0, 1) cho trước và bậc tự do (s-1) xác định, tra bảng khi bình phương, ta có phân vị 2 Phân vị khi bình phương χα(s − 1) cho kiểm định giả thuyết đầu H0 : p1 = p2 = = ps với đối thuyết H0 : p1 6= p2 6= 6= ps . PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 34 / 64
  82. Miền bác bỏ 2 Với các phân vị khi bình phương χα(s − 1) đã xác định, miền bác bỏ có dạng sau: Miền bác bỏ   2 Miền bác bỏ Wα = χα(s − 1), +∞ PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 35 / 64
  83.   2 2 2 Nếu χ ∈/ χα(r − 1)(s − 1), +∞ , thì chấp nhận giả thuyết H0 : p1 = p2 = = ps với đối thuyết H0 : p1 6= p2 6= 6= ps . Kiểm định 2 2 So sánh thống kê χ với phân vị χα(s − 1), có kết luận:   2 2 1 Nếu χ ∈ χα(s − 1), +∞ , thì bác bỏ giả thuyết H0 : p1 = p2 = = ps với đối thuyết H0 : p1 6= p2 6= 6= ps PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 36 / 64
  84. Kiểm định 2 2 So sánh thống kê χ với phân vị χα(s − 1), có kết luận:   2 2 1 Nếu χ ∈ χα(s − 1), +∞ , thì bác bỏ giả thuyết H0 : p1 = p2 = = ps với đối thuyết H0 : p1 6= p2 6= 6= ps   2 2 2 Nếu χ ∈/ χα(r − 1)(s − 1), +∞ , thì chấp nhận giả thuyết H0 : p1 = p2 = = ps với đối thuyết H0 : p1 6= p2 6= 6= ps . PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 36 / 64
  85. Kiểm định nhiều tỷ lệ Ví dụ 3 Có 4 giáo viên dạy cùng một giáo trình xác suất thống kê cho 4 lớp A,B, C và D với số lượng sinh viên lần lượt là 95, 160, 172 và 180. Thống kê số sinh viên bị thi lại của các lớp lần lượt là 18, 32, 34 và 36. Với mức ý nghĩa α = 0.01, chất lượng học tập của sinh viên có phụ thuộc vào chất lượng giảng dạy của các giáo viên hay không? PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 37 / 64
  86. 2 Giả thuyết cần kiểm định (H0 : p1 = p2 = p3 = p4 | H0 : p1 6= p2 6= p3 6= p4 Lời giải 1 Gọi tỷ lệ sinh viên bị thi lại môn xác suất thống kê của các lớp A, B, C và D lần lượt là p1, p2, p3, p4 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 38 / 64
  87. Lời giải 1 Gọi tỷ lệ sinh viên bị thi lại môn xác suất thống kê của các lớp A, B, C và D lần lượt là p1, p2, p3, p4 2 Giả thuyết cần kiểm định (H0 : p1 = p2 = p3 = p4 | H0 : p1 6= p2 6= p3 6= p4 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 38 / 64
  88. 2 Với mức ý nghĩa α = 0.01, tra bảng khi bình phương, xác định 2 χ0.02(3) = 11.34 3 Miền bác bỏ Wα = (11.34, +∞) 2 4 Do χ ∈/ Wα, nên chấp nhận giả thuyết ban đầu H0 : p1 = p2 = p3 = p4 và bác bỏ đối thuyết H0 : p1 6= p2 6= p3 6= p4 5 Kết luận: tỷ lệ sinh viên thi lại như nhau (với mức ý nghĩa 0.05), nên rõ ràng chất lượng học tập của sinh viên có không phụ thuộc (độc lập) vào chất lượng giảng dạy của giáo viên Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P2 n Hàm kiểm định χ = i=1 j=1 ni mj = 0.047 n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 39 / 64
  89. 3 Miền bác bỏ Wα = (11.34, +∞) 2 4 Do χ ∈/ Wα, nên chấp nhận giả thuyết ban đầu H0 : p1 = p2 = p3 = p4 và bác bỏ đối thuyết H0 : p1 6= p2 6= p3 6= p4 5 Kết luận: tỷ lệ sinh viên thi lại như nhau (với mức ý nghĩa 0.05), nên rõ ràng chất lượng học tập của sinh viên có không phụ thuộc (độc lập) vào chất lượng giảng dạy của giáo viên Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P2 n Hàm kiểm định χ = i=1 j=1 ni mj = 0.047 n 2 Với mức ý nghĩa α = 0.01, tra bảng khi bình phương, xác định 2 χ0.02(3) = 11.34 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 39 / 64
  90. 2 4 Do χ ∈/ Wα, nên chấp nhận giả thuyết ban đầu H0 : p1 = p2 = p3 = p4 và bác bỏ đối thuyết H0 : p1 6= p2 6= p3 6= p4 5 Kết luận: tỷ lệ sinh viên thi lại như nhau (với mức ý nghĩa 0.05), nên rõ ràng chất lượng học tập của sinh viên có không phụ thuộc (độc lập) vào chất lượng giảng dạy của giáo viên Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P2 n Hàm kiểm định χ = i=1 j=1 ni mj = 0.047 n 2 Với mức ý nghĩa α = 0.01, tra bảng khi bình phương, xác định 2 χ0.02(3) = 11.34 3 Miền bác bỏ Wα = (11.34, +∞) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 39 / 64
  91. 5 Kết luận: tỷ lệ sinh viên thi lại như nhau (với mức ý nghĩa 0.05), nên rõ ràng chất lượng học tập của sinh viên có không phụ thuộc (độc lập) vào chất lượng giảng dạy của giáo viên Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P2 n Hàm kiểm định χ = i=1 j=1 ni mj = 0.047 n 2 Với mức ý nghĩa α = 0.01, tra bảng khi bình phương, xác định 2 χ0.02(3) = 11.34 3 Miền bác bỏ Wα = (11.34, +∞) 2 4 Do χ ∈/ Wα, nên chấp nhận giả thuyết ban đầu H0 : p1 = p2 = p3 = p4 và bác bỏ đối thuyết H0 : p1 6= p2 6= p3 6= p4 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 39 / 64
  92. Lời giải (tiếp tục) ni mj 2 (nij − ) 1 2 P4 P2 n Hàm kiểm định χ = i=1 j=1 ni mj = 0.047 n 2 Với mức ý nghĩa α = 0.01, tra bảng khi bình phương, xác định 2 χ0.02(3) = 11.34 3 Miền bác bỏ Wα = (11.34, +∞) 2 4 Do χ ∈/ Wα, nên chấp nhận giả thuyết ban đầu H0 : p1 = p2 = p3 = p4 và bác bỏ đối thuyết H0 : p1 6= p2 6= p3 6= p4 5 Kết luận: tỷ lệ sinh viên thi lại như nhau (với mức ý nghĩa 0.05), nên rõ ràng chất lượng học tập của sinh viên có không phụ thuộc (độc lập) vào chất lượng giảng dạy của giáo viên PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 39 / 64
  93. 8.5 Tiêu chuẩn Mann-Whitney Bài toán 4   Giả sử hai mẫu ngẫu nhiên ω1 = x1, x2, , xn1 và   ω2 = y1, y2, , yn2 sinh bởi các biến ngẫu nhiên X và Y, chưa xác định phân phối xác suất. Với mức ý nghĩa α, hãy kiểm định giả thuyết cho rằng X và Y có cùng phân phối, tức là H0 : E(X ) = E(Y ) | H0 : E(X ) 6= E(Y ) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 40 / 64
  94. 2 Phương pháp Mann-Whitney còn được gọi là phương pháp hạng Chú ý 1 Hai biến ngẫu nhiên X và Y không nhất thiết có phân phối chuẩn PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 41 / 64
  95. Chú ý 1 Hai biến ngẫu nhiên X và Y không nhất thiết có phân phối chuẩn 2 Phương pháp Mann-Whitney còn được gọi là phương pháp hạng PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 41 / 64
  96. Hạng của một phần tử trong dãy Định nghĩa Giả sử có một dãy số được sắp thứ tự x[1] < x[2] < . . . < x[j] < x[j+1] < . . . < x[n]. Khi đó, hạng của phần tử thứ j trong dãy chính là số thứ tự vị trí của phân tử đó. Ký hiệu, rank(x[j]) = rj = j. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 42 / 64
  97. Hạng của dãy số Ví dụ Dãy số 3, 1, 4, 6, 8, 5 sau khi xếp thứ tự có dạng 1, 3, 4, 5, 6, 8 nên r(1)=1, r(3)=2, r(4)=3, r(5)=4, r(6)=5, r(8)=6 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 43 / 64
  98. Hạng của một phần tử trong dãy Định nghĩa • Nếu một dãy số được sắp thứ tự x[1] < x[2] < . . . < x[j] = x[j+1] < . . . < x[n]. Khi đó, hạng của phần tử thứ j trong dãy chính là trung bình cộng số thứ tự vị trí của hai phần tử x[j], x[j+1]. Như vậy, j + j + 1 rank(x ) = r = = j + 0.5 [j] j 2 • Nếu một dãy số được sắp thứ tự x[1] < x[2] < . . . < x[j−1] = x[j] = x[j+1] < . . . < x[n]. Khi đó, hạng của phần tử thứ j trong dãy chính là trung bình cộng số thứ tự vị trí của ba phần tử x[j−1], x[j], x[j+1]. Như vậy, j − 1 + j + j + 1 rank(x ) = r = = j [j] j 2 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 44 / 64
  99. 2 Dãy số 3, 1, 4, 4, 4, 8, 5 sau khi xếp thứ tự có dạng 1, 3, 4, 4, 4, 5, 8 nên r(1) = 1, r(3) = 2, r(4) = 4, r(5) = 6, r(8) = 7 Hạng của dãy số 1 Dãy số 3, 1, 4, 4, 8, 5 sau khi xếp thứ tự có dạng 1, 3, 4, 4, 5, 8 nên r(1) = 1, r(3) = 2, r(4) = 3.5, r(5) = 5, r(8) = 6 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 45 / 64
  100. Hạng của dãy số 1 Dãy số 3, 1, 4, 4, 8, 5 sau khi xếp thứ tự có dạng 1, 3, 4, 4, 5, 8 nên r(1) = 1, r(3) = 2, r(4) = 3.5, r(5) = 5, r(8) = 6 2 Dãy số 3, 1, 4, 4, 4, 8, 5 sau khi xếp thứ tự có dạng 1, 3, 4, 4, 4, 5, 8 nên r(1) = 1, r(3) = 2, r(4) = 4, r(5) = 6, r(8) = 7 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 45 / 64
  101. Tiêu chuẩn Mann-Whitney Định nghĩa • Gộp hai mẫu thành một mẫu có thứ tự c1 < c2 < . . . < cn1+n2 Pn1 • Ký hiệu tổng các số hạng của xi là R1 = i=1 rank(xi ) và tổng các số Pn2 hạng của yj là R2 = j=1 rank(yj ) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 46 / 64
  102. Tiêu chuẩn Mann-Whitney Hàm kiểm định K • Đại lượng n (n + 1) n (n + 1) V = n n + 1 1 − R ; V = n n + 2 2 − R 1 1 2 2 1 2 1 2 2 2 • Hàm kiểm định: (V − E(V )) K = pD(V ) trong đó, V = min{V1; V2}, • Kỳ vọng và phương sai n n n n (n + n − 1) E(V ) = 1 2 ; D(V ) = 1 2 1 2 2 12 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 47 / 64
  103. 2 Với mức ý nghĩa α ∈ (0, 1), tra bảng Laplace xác định phân vị chuẩn x α sao cho 2 1 α Φ(x α ) = − 2 2 2 α Phân vị chuẩn mức 2 (V −E(V )) 1 Nếu giả thuyết H0 đúng thì biến ngẫu nhiên K = √ ∼ N(0, 1) D(V ) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 48 / 64
  104. α Phân vị chuẩn mức 2 (V −E(V )) 1 Nếu giả thuyết H0 đúng thì biến ngẫu nhiên K = √ ∼ N(0, 1) D(V ) 2 Với mức ý nghĩa α ∈ (0, 1), tra bảng Laplace xác định phân vị chuẩn x α sao cho 2 1 α Φ(x α ) = − 2 2 2 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 48 / 64
  105. Miền bác bỏ W α 2 Miền bác bỏ Miền bác bỏ hai phía   [   W α = − ∞, −x α x α , +∞ 2 2 2 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 49 / 64
  106. 2 Nếu K ∈/ W α , thì giả thuyết H0 được chấp nhận (H0 bị bác bỏ), tức 2 là X và Y có cùng phân phối hay E(X ) = E(Y ). Kết luận 1 Nếu K ∈ W α , thì giả thuyết H0 bị bác bỏ (H0 được chấp nhận), tức 2 là X và Y không có cùng phân phối hay E(X ) 6= E(Y ). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 50 / 64
  107. Kết luận 1 Nếu K ∈ W α , thì giả thuyết H0 bị bác bỏ (H0 được chấp nhận), tức 2 là X và Y không có cùng phân phối hay E(X ) 6= E(Y ). 2 Nếu K ∈/ W α , thì giả thuyết H0 được chấp nhận (H0 bị bác bỏ), tức 2 là X và Y có cùng phân phối hay E(X ) = E(Y ). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 50 / 64
  108. Quy tắc Mann-Whitney Ví dụ 4 Để nghiên cứu kết quả học tập của nam sinh viên và nữ sinh viên năm thứ nhất, người ta thống kê điểm của 11 nam sinh viên (X) và 12 nữ sinh viên (Y) với số liệu sau Xi : 28 30 35 35 40 40 40 45 45 48 54 Yi : 22 25 25 30 30 32 35 35 36 38 38 38 Bằng phương pháp hạng Mann-Whitney, với α = 0, 05, hãy xem tổng điểm trung bình của nam sinh viên và nữ sinh viên có như nhau hay không? PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 51 / 64
  109. 8.6 Tiêu chuẩn Wilcoxon Bài toán 5   Giả sử hai mẫu ngẫu nhiên ω1 = x1, x2, , xn và   ω2 = y1, y2, , yn sinh bởi các biến ngẫu nhiên X và Y, chưa xác định phân phối xác suất. Với mức ý nghĩa α, hãy kiểm định giả thuyết cho rằng X và Y có cùng phân phối, tức là H0 : E(X ) = E(Y ) | H0 : E(X ) 6= E(Y ) PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 52 / 64
  110. 2 Hai mẫu sinh bởi hai biến ngẫu nhiên X và Y có cùng cỡ n Chú ý 1 Hai biến ngẫu nhiên X và Y không nhất thiết có phân phối chuẩn PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 53 / 64
  111. Chú ý 1 Hai biến ngẫu nhiên X và Y không nhất thiết có phân phối chuẩn 2 Hai mẫu sinh bởi hai biến ngẫu nhiên X và Y có cùng cỡ n PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 53 / 64
  112. 2 Y là hiệu quả của phương pháp thứ hai tác động lên cùng một cá thể 3 Với mức ý nghĩa α kiểm định giả thuyết H0 : X và Y có hiệu quả như nhau, với đối thuyết H0 : X và Y có hiệu quả không như nhau Giải thích 1 Có thể coi X là hiệu quả của phương pháp thứ nhất PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 54 / 64
  113. 3 Với mức ý nghĩa α kiểm định giả thuyết H0 : X và Y có hiệu quả như nhau, với đối thuyết H0 : X và Y có hiệu quả không như nhau Giải thích 1 Có thể coi X là hiệu quả của phương pháp thứ nhất 2 Y là hiệu quả của phương pháp thứ hai tác động lên cùng một cá thể PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 54 / 64
  114. Giải thích 1 Có thể coi X là hiệu quả của phương pháp thứ nhất 2 Y là hiệu quả của phương pháp thứ hai tác động lên cùng một cá thể 3 Với mức ý nghĩa α kiểm định giả thuyết H0 : X và Y có hiệu quả như nhau, với đối thuyết H0 : X và Y có hiệu quả không như nhau PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 54 / 64
  115. 2 Bỏ qua các giá trị di = 0. 3 Tính hạng của |di |(di 6= 0). 4 Gọi n số các giá trị di 6= 0. + − 5 Ký hiệu R là tổng các hạng của |di | với di > 0, R là tổng của các |di | với i di < 0. 6 Chọn R = min(R−; R+). Tiêu chuẩn Wilcoxon 1 Xuất phát từ hai mẫu, tính hiệu di = xi − yi , i = 1, 2, , n. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 55 / 64
  116. 3 Tính hạng của |di |(di 6= 0). 4 Gọi n số các giá trị di 6= 0. + − 5 Ký hiệu R là tổng các hạng của |di | với di > 0, R là tổng của các |di | với i di < 0. 6 Chọn R = min(R−; R+). Tiêu chuẩn Wilcoxon 1 Xuất phát từ hai mẫu, tính hiệu di = xi − yi , i = 1, 2, , n. 2 Bỏ qua các giá trị di = 0. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 55 / 64
  117. 4 Gọi n số các giá trị di 6= 0. + − 5 Ký hiệu R là tổng các hạng của |di | với di > 0, R là tổng của các |di | với i di < 0. 6 Chọn R = min(R−; R+). Tiêu chuẩn Wilcoxon 1 Xuất phát từ hai mẫu, tính hiệu di = xi − yi , i = 1, 2, , n. 2 Bỏ qua các giá trị di = 0. 3 Tính hạng của |di |(di 6= 0). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 55 / 64
  118. + − 5 Ký hiệu R là tổng các hạng của |di | với di > 0, R là tổng của các |di | với i di < 0. 6 Chọn R = min(R−; R+). Tiêu chuẩn Wilcoxon 1 Xuất phát từ hai mẫu, tính hiệu di = xi − yi , i = 1, 2, , n. 2 Bỏ qua các giá trị di = 0. 3 Tính hạng của |di |(di 6= 0). 4 Gọi n số các giá trị di 6= 0. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 55 / 64
  119. 6 Chọn R = min(R−; R+). Tiêu chuẩn Wilcoxon 1 Xuất phát từ hai mẫu, tính hiệu di = xi − yi , i = 1, 2, , n. 2 Bỏ qua các giá trị di = 0. 3 Tính hạng của |di |(di 6= 0). 4 Gọi n số các giá trị di 6= 0. + − 5 Ký hiệu R là tổng các hạng của |di | với di > 0, R là tổng của các |di | với i di < 0. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 55 / 64
  120. Tiêu chuẩn Wilcoxon 1 Xuất phát từ hai mẫu, tính hiệu di = xi − yi , i = 1, 2, , n. 2 Bỏ qua các giá trị di = 0. 3 Tính hạng của |di |(di 6= 0). 4 Gọi n số các giá trị di 6= 0. + − 5 Ký hiệu R là tổng các hạng của |di | với di > 0, R là tổng của các |di | với i di < 0. 6 Chọn R = min(R−; R+). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 55 / 64
  121. Tiêu chuẩn Wilcoxon Hàm kiểm định Tính giá trị của thống kê (R − n¯(¯n+1) ) K = 4 q n¯(¯n+1)(2n¯+1) 24 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 56 / 64
  122. Tiêu chuẩn Wilcoxon α Phân vị chuẩn mức 2 Nếu giả thuyết H0 đúng, thì thống kê K có phân phối chuẩn chính tắc, α K ∼ N(0, 1), khi đó tra bảng Laplace xác định phân vị chuẩn mức là x α 2 2 sao cho 1 α Φ0(x α ) = − 2 2 2 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 57 / 64
  123. Tiêu chuẩn Wilcoxon Miền bác bỏ W α 2     W α = − ∞, −x α S x α , +∞ 2 2 2 PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 58 / 64
  124. 2 Nếu K ∈/ W α , thì giả thuyết H0 được chấp nhận (H0 bị bác bỏ), tức 2 là E(X ) = E(Y ). Kết luận 1 Nếu K ∈ W α , thì giả thuyết H0 bị bác bỏ (H0 được chấp nhận), tức 2 là E(X ) 6= E(Y ). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 59 / 64
  125. Kết luận 1 Nếu K ∈ W α , thì giả thuyết H0 bị bác bỏ (H0 được chấp nhận), tức 2 là E(X ) 6= E(Y ). 2 Nếu K ∈/ W α , thì giả thuyết H0 được chấp nhận (H0 bị bác bỏ), tức 2 là E(X ) = E(Y ). PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 59 / 64
  126. Bài tập chương 8 Bài tập 1 Gieo một con xúc xắc 240 lần, trong đó mặt "lục" xuất hiện 70 lần. Với mức ý nghĩa α = 0.01 hỏi con xúc xắc có cân đối và đồng chất hay không? PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 60 / 64
  127. Bài tập chương 8 Bài tập 2 Gieo một con xúc xắc 240 lần, trong đó mặt "nhất" xuất hiện 56 lần, mặt "nhị" xuất hiện 28 lần, mặt "tam" xuất hiện 52 lần, mặt "tứ" xuất hiện 36 lần, mặt "ngũ" xuất hiện 30 lần và mặt "lục" xuất hiện 38 lần. Với mức ý nghĩa α = 0.05 hỏi con xúc xắc có cân đối và đồng chất hay không? PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 61 / 64
  128. Bài tập chương 8 Bài tập 3 Thống kê số vụ tai nạn (Xj ) và số ngày xẩy ra tai nạn (nj )tại một thành phố, người ta có số liệu trong 2190 ngày như sau Xj : 0 1 2 3 4 nj : 1426 598 132 32 2 Với mức ý nghĩa 0.01 hãy kiểm định ý kiến cho rằng số vụ xảy ra tai nạn có phân phối Poisson PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 62 / 64
  129. Bài tập chương 8 Bài tập 4 Giả sử tuổi đời (X) được chia thành 3 giai đoạn: A (dưới 30), B (từ 30 tới 50) và C (trên 50) và sự đam mê luyện tập thể thao (Y) có các mức độ D (tích cực), E (bình thường) và F (lười biếng). Theo dõi 500 người ở các lứa tuổi khác nhau về sự đam mê luyện tập thể thao, có thống kê sau: với độ tuổi A thì D=45, E=35, F=38; với độ tuổi B thì D=62, E=49, F=95; với độ tuổi C thì D=48, E=49, F=68. Với mức ý nghĩa 0.01 hãy kiểm định xem sự đam mê luyện tập thể thao có phụ thuộc vào độ tuổi hay không? PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 63 / 64
  130. Bài tập chương 8 Bài tập 5 Một điều tra xã hội học cho thấy trong số 1076 sinh viên nam tốt nghiệp đại học có công việc ổn định trong năm đầu tiên là 526, còn trong số 1011 nữ sinh viên tốt nghiệp đại học có công việc ổn định trong năm đầu tiên là 313. Với mức ý nghĩa 0.05 hãy kiểm định giả thuyết cho rằng nữ sinh viên tốt nghiệp khó kiếm việc hơn nam sinh viên. PGS.TS.Trần Lộc Hùng (UFM, 10/2013) Lý thuyết Xác suất và Thống kê Toán học Ngày 27 tháng 10 năm 2013 64 / 64