Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 9: Suy luận và so sánh về các trị trung bình - Nguyễn Duy Long
Bạn đang xem tài liệu "Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 9: Suy luận và so sánh về các trị trung bình - Nguyễn Duy Long", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_thong_ke_hoc_ung_dung_trong_quan_ly_xay_dung_phan.pdf
Nội dung text: Bài giảng Thống kê học ứng dụng trong quản lý xây dựng - Phần 9: Suy luận và so sánh về các trị trung bình - Nguyễn Duy Long
- 9/8/2010 Phần09 Nguyễn Duy Long, TiếnSỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 1 Các suy luậnvề các trị trung bình So sánh các trị trung bình Mẫu đôi ©2010, Nguyễn Duy Long, Tiến Sỹ 2 1
- 9/8/2010 Inferences about means ©2010, Nguyễn Duy Long, Tiến Sỹ 3 Ta làm việcvớitrị trung bình (means): khoảng tin chắcvàkiểmnghiệmgiả thiếtdựatrênmôhình phân phốimẫu. Định Lý GiớiHạn Trung Tâm (CLT) cho ta biếtrằng mô hình phân phốimẫuchotrị trung bình là mô hình chuẩnvớitrị trung bình μ và độ lệch chuẩnlà: SD y n ©2010, Nguyễn Duy Long, Tiến Sỹ 4 2
- 9/8/2010 Với các phần, có sự liên hệ giữagiátrị củaphần (proportion value) và độ lệch chuẩncủaphầncủa mẫu (sampllie proportion). Vớitrị trung bình thì không! Biếttrị trung bình của mẫu không cho ta biết điềugìvề SD() y Ta làm tấtcả những gì có thể: ướclượng thông số quầnthể σ vớitrị thống kê củamẫu s. Sai số chuẩncủatrị trung bình củamẫu: s SE y n ©2010, Nguyễn Duy Long, Tiến Sỹ 5 Ta có thêm sự biến đổitrongsaisố chuẩntừ s, độ lệch chuẩncủamẫu. ◦ Ta cầnxétsự biến đổithêmnàyđể không lẫn (mess up) với các tính toán về biên sai. Và hình dạng (shape) củamôhìnhmẫuthayđổi– mô hình không còn là mô hình chuẩnnữa. ◦ Vậymôhìnhmẫurasao? ©2010, Nguyễn Duy Long, Tiến Sỹ 6 3
- 9/8/2010 William S. Gosset, nhân viên công ty bia Guinness ở Ireland, tìm ra mô hình mẫu. Mô hình mẫu do Gosset tìm ra đượcgọilàt của Student (Student’s t). ◦ Các mô hình t của Student hình thành mộttập các phân phối liên quan phụ thuộcvàothôngsố bậctự do (degrees of freedom), gọitắclàdf. ◦ Viếttắcmôhìnhnàydướidạng tdf. ©2010, Nguyễn Duy Long, Tiến Sỹ 7 Mô hình phân phốimẫuthựctiễnchocáctrị trung bình Khi các điềukiệnthỏa, trị trung bình mẫu đượcchuẩnhóa: y t SE y ố ủ ớ ậ ự Theo mô hình phân ph it c aStudent v i n s–1b ct do. Ta ướclượng sai số chuẩntheo: SE y n với n là kích thướccủamẫu ©2010, Nguyễn Duy Long, Tiến Sỹ 8 4
- 9/8/2010 Khi Gosset sửamôhìnhchosự không chắcchắnthêm(extra uncertainty), biên sai ME lớnhơn. ◦ Khoảng tin chắc sẽ rộng hơn một chút Các mô hình t (t-models) là mộtmốt, đốixứng, và có hình chuông tựanhư mô hình chuẩn. ◦ Các mô hình t vớivàibậctự do có đuôi dày hơnmôhìnhchuẩn. ◦ Khi df tăng, các mô hình t càng giống mô hình chuẩn. ◦ Mô hình t vớidfvôtậnthìchínhlàmôhìnhchuẩn. Mô hình chuẩn Mô hình t với2 bậctự do ©2010, Nguyễn Duy Long, Tiến Sỹ 9 Mô hình t khác nhau bởi bậctự do (n-1) Bảng tra cho giá trị tới hạn củamôhìnht (t-model critical values) Với n = 16 và C = 95%, t*= +/- 2.131 ◦ Nếu n = 8 và kiểmnghiệm mộtphương đuôi trên với =5%, t*=1.895 MộtphầncủaBảng T (tr.A-58) ©2010, Nguyễn Duy Long, Tiến Sỹ 10 5
- 9/8/2010 1) Giả định tính độclập: ◦ Điềukiệnngẫu nhiên hóa: Dữ liệutừ mẫungẫu nhiên hay thí nghiệm đượcngẫu nhiên hóa thích hợp. ◦ Điềukiện 10% ©2010, Nguyễn Duy Long, Tiến Sỹ 11 2) Giả định quầnthể chuẩn: ◦ Điềukiệngầnchuẩn “Nearly Normal”: Dữ liệutừ phân phốimộtmốtvàđốixứng. Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất. Kích thướcmẫucàngnhỏ (n < 15), dữ liệu càng nên theo mô hình chuẩn. Vớicáckíchthướcmẫu trung bình (n giữa15 và 40), t sẽ hữuhiệukhidữ liệulàmộtmốtvàgần đốixứng. Vớikíchthướcmẫulớnhơn, t sẽ an toàn để dùng thậmchí dữ liệulàbị lệch. ©2010, Nguyễn Duy Long, Tiến Sỹ 12 6
- 9/8/2010 Khi các điềukiệnthỏa, có thể tìm khoảng tin chắc cho trị trung bình củamẫu, μ. ả ắ Kho ng tin ch c: CI y tn 1 SE y Vớisaisố chuẩncủa s ị ủ ẫ SE y tr trung bình c am u: n * Giá trị tới hạnptn 1 hụ thuộcvàomứctin chắc, C, và số bậctự do, n –1. ©2010, Nguyễn Duy Long, Tiến Sỹ 13 Các điềukiệnchokiểmnghiệmmộtmẫu(one-sample t-test) cho trị trung bình giống vớikhoảng t cho mộtmẫu(one-sample t-interval). Kiểm nghiệm giả thiết H0: = 0 dùng trị thống kê kiểm nghiệm: y t 0 n 1 SE y s vớisaisố chuẩncủatrị trung bình củamẫu: SE y n Khi các điềukiệnthỏavàgiả thiếtrỗng đúng, trị thống kê theo mô hình t củaStudent với n –1bậctự do. ©2010, Nguyễn Duy Long, Tiến Sỹ 14 7
- 9/8/2010 Nhà sảnxuấtrượukiểm tra dây chuyền đóng chai 750ml để đảmbảoviệcrótđủ rược, nếukhống phải dùng dây chuyền và kiểm tra mọi thứ, một qui trình mấtthờigianvàtốnkém. Trongkhimộtsố biến đổi là tự nhiên và chấpnhận được, mẫu 15 chai có dung tích trung bình 740ml và độ lệch chuẩn 20ml ◦ Tìm 95% CI cho dung tích trung bình củacácchairượu ◦ Nếutaquantâmviệc đóng chai lớnhơnhay nhỏ hơndung tích trên nhãn và sẽ chấpnhậnmức = 5%, dùng loạikiểm nghiệmnào? Ta có dừng dây chuyền không? ◦ Nếutachỉ quan tâm đóng chai ít rượuhơn, loạikiểm nghiệmgìcầnthựchiện? Nếu = 5%, ta vẫn dùng cùng mứctin chắc ở trên? ©2010, Nguyễn Duy Long, Tiến Sỹ 15 Comparing Means ©2010, Nguyễn Duy Long, Tiến Sỹ 16 8
- 9/8/2010 Các thí nghiệm để so sánh hai nhóm thường xảy ra cả trong khoa họcvàcông nghiệp. So sánh hai trị trung bình không khác mấyso với so sánh hai phần ©2010, Nguyễn Duy Long, Tiến Sỹ 17 Khi các điềukiệnthỏa, sự khác nhau được chuẩnhóacủamẫu giữa các trị trung bình của hai nhóm độclập, t ( y1 y2 ) (1 2 ) SE( y1 y2 ) có thể mô hình bởimôhìnht củaStudent với bậctự do theo công thức đặcbiệt. Sai số chuẩn được ước tính: 2 2 SE(y y ) s1 s2 1 2 n1 n2 ©2010, Nguyễn Duy Long, Tiến Sỹ 18 9
- 9/8/2010 Xác định bậctự do theo: s2 s2 ( 1 2 )2 df n1 n2 s2 s2 1 ( 1 )2 1 ( 2 )2 n1 1 n1 n2 1 n 2 Qui tắcdễ hơn: ◦ df = min(n1, n2) nhưng không lớnhơn (n1 + n2 –2) ©2010, Nguyễn Duy Long, Tiến Sỹ 19 Giả định tính độclập Giả định quần thể chuẩn Giả định các nhóm độclập ©2010, Nguyễn Duy Long, Tiến Sỹ 20 10
- 9/8/2010 Khi các điềukiệnthỏa, khoảng tin chắccho sự khác nhau giữa các trị trung bình củahai nhóm độclập, µ1 -µ2, là: * (y1 y2 ) tdf SE(y1 y2 ) ©2010, Nguyễn Duy Long, Tiến Sỹ 21 Kiểmnghiệm t cho hai mẫu(two-sample t- test) H0: µ1 -µ2 = Δ0 ( y1 y2 ) 0 Trị thống kê kiểmnghiệm: t SE( y1 y2 ) ©2010, Nguyễn Duy Long, Tiến Sỹ 22 11
- 9/8/2010 Paired Samples ©2010, Nguyễn Duy Long, Tiến Sỹ 23 Dữ liệu đôi (paired data) xuấthiệndưới nhiều cách. ◦ Ví dụ: So sánh các đốitượng với chính nó trướcvà sau mộtliệupháp. Không thể dùng các phương pháp hai mẫu ở phầntrênchodữ liệu đôi. ©2010, Nguyễn Duy Long, Tiến Sỹ 24 12
- 9/8/2010 Tên Dặmláixevớituần Dặmláixevớituần Khác nhau làm việc5 ngày làm việc4 ngày Jeff 2798 2914 -116 Betty 7724 6112 1612 Roger 7505 6177 1328 Tom 838 1102 -264 Aimee 4592 3281 1311 Greg 8107 4997 3110 Larry G. 1228 1695 -467 Tad 8718 6606 2112 Larry M. 1097 1063 34 Leslie 8089 6392 1697 Lee 3807 3362 445 Nguồn: De Veaux, 2006, tr.574 ©2010, Nguyễn Duy Long, Tiến Sỹ 25 Vì ta quan tâm đến các sự khác nhau, ta coi tấtcả chúng (cột ngoài cùng bên phải) như thể chúng là dữ liệu, bỏ qua hai cột đầu. Ta chỉ có mộtcột các giá trị để xem xét, ta có thể dùng kiểmnghiệmt mộtmẫu(one- sample t-test). Về tính toán, kiểmnghiệmt đôi (paired t- test) chỉ là kiểmnghiệmt mộtmẫu cho các trị trung bình củasự khác nhau từng đôi (pairwise differences), kích thướcmẫulàsố cặp ©2010, Nguyễn Duy Long, Tiến Sỹ 26 13
- 9/8/2010 Giả định dữ liệu đôi Giả định tính độc lập Giả định quầnthể chuẩn ©2010, Nguyễn Duy Long, Tiến Sỹ 27 Khi các điềukiệnthỏa, ta có thể kiểmnghiệm trị trung bình củasự khác nhau từng đôi có khác nhau đáng kể so với không. Giả thiếtrỗng H0: µ0 = Δ0 d 0 ị ố ố Tr s th ng kê: tn 1 SE(d ) s ố ẩ SE(d ) d Sai s chu n: n ©2010, Nguyễn Duy Long, Tiến Sỹ 28 14
- 9/8/2010 Khi các điềukiệnthỏa, ta có thể tìm khoảng tin chắcchotrị trung bình củasự khác nhau từng đôi: * d tn 1 SE(d ) s ớ SE(d ) d V i n ©2010, Nguyễn Duy Long, Tiến Sỹ 29 ©2010, Nguyễn Duy Long, Tiến Sỹ 30 15