Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 10: Kiểm định phi tham số - Lê Văn Hòa

pdf 23 trang huongle 3540
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 10: Kiểm định phi tham số - Lê Văn Hòa", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_thong_ke_ung_dung_trong_kinh_doanh_chuong_10_kiem.pdf

Nội dung text: Bài giảng Thống kê ứng dụng trong kinh doanh - Chương 10: Kiểm định phi tham số - Lê Văn Hòa

  1. 1-1 Chương 10 KIỂM ĐỊNH PHI THAM SỐ Ths. Lê Văn Hòa
  2. 1-2 Giới thiệu về KĐ phi tham số ● KĐ Phi tham số (non-parametric tests) là gì? ● Không dựa trên TB, tỷ lệ, PS, độ lệch chuẩn ● Tại sao KĐ phi tham số? ● Tổng thể không có PP bình thường ● Tổng thể có những giá trị bất thường (outliers) ● Cỡ mẫu nhỏ ● DL định tính
  3. Các bài toán và phương pháp KĐ phi tham số 1-3 thường dùng Mục đích PP KĐ phi tham số PP KĐ tham số tương đương So sánh TB của 1 tổng KĐ dấu và hạng Wilcoxon One-sample T- Test thể với một giá trị cố định (Wilcoxon signed rank test) So sánh 2 TB của 2 tổng KĐ dấu và hạng Wilcoxon 2 Paired Samples T- thể với nhau, trường hợp trên hai mẫu Test 2 mẫu cặp So sánh 2 TB của 2 tổng KĐ tổng hạng Wilcoxon 2 Independent Samples thể với nhau, trường hợp (Wilcoxon rank-sum test) TTest 2 mẫu độc lập hoặc KĐ Mann-Whitney U So sánh k TB của k tổng KĐ Kruskal - Wallis ANOVA một yếu tố thể với nhau (k > 2) (one-way ANOVA) KĐ mối liên hệ giữa hai Phân tích tương quan hạng Phân tích tương quan biến định tính Spearman và hồi quy KĐ Chi bình phương (Chisquare Test) KĐ về sự phù hợp của KĐ Chi bình phương trên một phân phối với một một mẫu / KĐ sự phù hợp phân phối lý thuyết (Goodness-of-fit Test)
  4. 1-4 CÁC NỘI DUNG CHÍNH ● 10.1 KĐ dấu và hạng Wilcoxon về trung bình của một tổng thể ● 10.2 KĐ dấu và hạng Wilcoxon trên 2 tổng thể, trường hợp lấy mẫu cặp ● 10.3 KĐ tổng hạng Wilcoxon trên 2 tổng thể, trường hợp lấy mẫu độc lập ● 10.4 KĐ Chi bình phương về mối liên hệ giữa hai biến định tính ● 10.5 KĐ Chi bình phương trên một mẫu
  5. 1-5 10.1 KĐ dấu và hạng Wilcoxon về trung vị của tổng thể Gọi trung vị tổng thể là M, giá trị cần so sánh là M0. ● B1: Thu thập thông tin mẫu ● B2: Tính các chênh lệch di: = − 0 ● B3: Tính giá trị tuyệt đối của các chênh lệch |di| ● B4: Loại bỏ các chênh lệch bằng 0, xếp hạng các |di| còn lại từ nhỏ đến lớn, |di| nhỏ nhất có hạng là 1. ● Nếu có hạng ngang nhau thì tính hạng TB. ● Cỡ mẫu rút gọn n’ = n – số trường hợp có di bằng 0 ● B5: Tách các hạng vừa xếp thành 2 cột Nếu di > 0 thì đặt vào cột R+. Nếu di < 0 thì đặt vào cột R-
  6. 1-6 ● Theo SGK của Hoàng Trọng & Chu Nguyễn Mộng Ngọc thì: ● B6: Tính giá trị của chỉ tiêu KĐ W ● Nếu KĐ bên phải: W = ΣR+ ● Nếu KĐ bên trái: W = ΣR- ● Nếu KĐ hai bên: W = min(ΣR+; ΣR-) ● B7: Tra bảng Wilcoxon tìm Wα (giá trị của CẬN DƯỚI, tương ứng với trường hợp KĐ 1 bên hay 2 bên) và áp dụng quy tắc bác bỏ H0 ● Nếu W < Wα
  7. 1-7 ● Theo quan điểm khác: ● B6: Tính chỉ tiêu KĐ W = ΣR+ ● B7: Tra bảng tìm WL (cận dưới) và WU (cận trên) và áp dụng quy tắc bác bỏ H0. ● Nếu KĐ 2 bên: W WU ● Nếu KĐ bên trái: W WU ● Quy tắc bác bỏ H0: Như KĐ về TB của một tổng thể, trường hợp biết σ
  8. 1-8 Wilcoxon Table
  9. 1-9 VD KĐ về thu nhập TB của SV sau khi tốt nghiệp – Tr. 284 - Bảng 10.1 Tr. 286
  10. 1-10 10.2 KĐ tổng hạng Wilcoxon về TB của 2 mẫu độc lập ● B1: Chọn mẫu làm Mẫu 1 (n1 <n2) và lập cặp giả thuyết TK. Nếu 2 mẫu có cỡ mẫu bằng nhau, thì coi mẫu nào là Mẫu 1 cũng được. Gọi M1, M2 là trung vị của tổng thể thứ nhất và thứ hai ● B2: Gộp chung 2 mẫu thành 1 danh sách chung và sắp xếp từ nhỏ tới lớn. Xác định hạng của các quan sát theo nguyên tắc là QS có giá trị nhỏ nhất sẽ có hạng là 1, giá trị càng lớn thì hạng càng lớn. Nếu có 2 quan sát có giá trị bằng nhau, thì lấy hạng TB.
  11. ● B3: Xác định chỉ tiêu KĐ 1-11 ● Nếu cỡ mẫu nhỏ (n1 WU hoặc T1 WU ● Nếu cỡ mẫu lớn: tương tự như KĐ TB của 1 tổng thể, trường hợp biết σ
  12. 1-12 ● VD: Tác động của kiểu trưng bày hàng hoá tới doanh số ● Mẫu 1: 10 gian hàng trưng bày theo kiểu bình thường ● Mẫu 2: 10 gian hàng khác, trưng bày theo kiểu đặc biệt ● Ghi nhận doanh số và so sánh
  13. 1-13 10.3 KĐ dấu và hạng Wilcoxon với 2 mẫu cặp ● B1: Xác định các chênh lệch di = x1i – x2i và lập cặp giả thuyết KĐ
  14. 1-14 ● B2: Xác định các giá trị tuyệt đối |di| ● B3: Loại bỏ các |di| bằng 0, sắp hạng các |di| từ nhỏ tới lớn. Giá trị |di| nhỏ nhất có hạng là 1. Nếu có nhiều |di| bằng nhau, thì tính hạng trung bình. ● n’ = n – số trường hợp có di = 0 ● B4: Tách riêng các hạng của |di| thành 2 loại, hạng R+ và hạng R- theo dấu của di gốc ● B5: Tính giá trị KĐ W = ΣR+ ● B6: Áp dụng quy tắc bác bỏ H0 ● Nếu n’ ≤ 20 ● KĐ bên trái: W ≤ WL ● KĐ hai bên: W ≤ WL hoặc W ≥ WU ● KĐ bên phải: W ≥ WU
  15. 1-15 ● Nếu n’ > 20 thì W xấp xỉ PP bình thường. Khi đó sẽ biến đổi chuẩn hoá W và kiểm định theo chỉ tiêu z. ● Quy tắc bác bỏ H0 tương tự như bài toán KĐ TB của một tổng thể, trường hợp biết σ
  16. 1-16 VD Trang 292: So sánh tốc độ xử lý của hai phần mềm ● Cài đặt 2 PM trên cùng các máy ● Chạy từng PM một, đo thời gian xử lý các tác vụ ● Chạy thử 2 PM này với 10 tác vụ khác nhau và đã ghi được thời gian xử lý của từng PM. ● DL ở Bảng 10.4 Trang 292. ● Mẫu 1: X1 – thời gian xử lý tác vụ của PM đang dùng ● Mẫu 2: X2 – thời gian xử lý tác vụ của PM mới ● Biến chênh lệch di = x1i – x2i ● Cặp giả thuyết KĐ ● W = 7 + 2 + 6 + 8 + 4,5 + 9 + 4,5 + 3 = 44 ● n’ = n -1 = 9; α =0,05 → Tra bảng có WU = 37 ● Vì W > WU → Bác bỏ H0.
  17. 1-17 10.4 KĐ Kruskal – Wallis trên nhiều mẫu độc lập ● Mục đích: so sánh TB của k mẫu độc lập (k >2) ● Gọi n = n1 + n2 + + nk ● H0: M1 = M2 = = Mk ● Chỉ tiêu KĐ W ● Quy tắc bác bỏ H0 ● VD: Bảng 10.5 Trang 294 – KĐ về tác động của mức độ đi làm thêm tới KQ học tập của SV (k =3)
  18. 1-18 ● Nếu muốn so sánh tuổi thọ của cả 3 loại bóng đèn cùng một lúc? ● Sử dụng Kruskal – Wallis Test
  19. 1-19 10.5 KĐ Chi bình phương về mối liên hệ giữa 2 biến định tính ● Biến 1: Biến hàng ● Biến 2: Biến cột ● Lập bảng tần số liên hợp giữa 2 biến ● Xem VD Trang 297 sách TKƯD ● Muốn tìm hiểu xem liệu giữa thời gian tìm hiểu trước hôn nhân và tình trạng gđ sau hôn nhân có mối liên hệ gì hay không. ● Biến số 1: Thời gian tìm hiểu trước hôn nhân (Bảng 10.6 Trang 298), chia làm 3 mức (ngắn, TB và dài) ● Biến số 2: Tình trạng gia đình sau hôn nhân, chia làm 3 loại (ly dị/ly thân; không hạnh phúc; hạnh phúc)
  20. 1-20 ● Bảng 10.6 mô tả tần số thực tế - Oij – có được từ điều tra, nghiên cứu thực tế ● Bảng 10.7 tính toán ra tần số lý thuyết hay tần số kỳ vọng Eij, căn cứ vào các giá trị của tổng hàng và tổng cột. ● Nếu phân phối của tần số thực tế khác nhiều so với phân phối của tần số kỳ vọng trong bảng, thì có thể sẽ có một mối liên hệ nào đó giữa biến hàng và biến cột ● Nếu muốn khẳng định chắc chắn, phải KĐ. ● P.pháp KĐ là Chi b.phương
  21. 1-21 Ngắn TB Dài Tổng hàng Hạnh phúc E11 = 45 E12 = 60 E13 = 45 R1 = 150 O11=38 O12 = 58 O13 = 54 Không HP E21 = 9 E22 = 12 E23 = 9 R2 = 30 O21 = 12 O22 = 14 O23 = 4 Ly dị/ly thân E31 = 6 E32 = 8 E33 = 6 R3 = 20 O31 = 10 O23 = 8 O33 = 2 Cộng C1 = 60 C2 = 80 C3 = 60 n = 200
  22. 1-22 10.6 KĐ Chi bình phương về sự phù hợp ● Goodness-of-fit Test ● Mục đích: Kiểm tra sự phân phối tần số có phù hợp với một tần số lý thuyết hay không ● VD: Xem Ví dụ 1 Trang 299, sách TKƯD về số tai nạn lao động theo các ngày trong tuần ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0
  23. 1-23 Thứ Số vụ tai nạn Số vụ tai nạn thực tế Oi theo giả thuyết Ei Hai 7 5,33 Ba 3 5,33 Tư 3 5,33 Năm 2 5,33 Sáu 5 5,33 Bảy 12 5,33 Cộng 32 32