Bài giảng Ôn tập phần thống kê

pdf 8 trang huongle 5240
Bạn đang xem tài liệu "Bài giảng Ôn tập phần thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_on_tap_phan_thong_ke.pdf

Nội dung text: Bài giảng Ôn tập phần thống kê

  1. ThS. Phạm Trí Cao * Chương Thống kê # OTCH 01/04/2016 KHẮC CỐT GHI TÂM Một câu hỏi về Thống kê thường chỉ thuộc 1 trong 2 ÔN TẬP PHẦN THỐNG KÊ dạng: ước lượng hoặc kiểm định. Nếu là ước lượng: UL trung bình hay UL tỷ lệ . UL Phần này chỉ ôn lại một số dạng điểm (không cho độ tin cậy) hay UL khoảng (có cho toán cơ bản thường gặp. độ tin cậy). Các dạng toán còn lại sinh viên/ Xem thuộc dạng toán nào trong 3 dạng toán đã học (có học viên tự xem trong quyển bài 3 tham số; biết 2 tham số, tìm 1 tham số còn lại). UL tỷ lệ thêm 2 dạng toán (biết M tìm N, biết N tìm M). tập XSTK. 1 Nếu là UL trung bình thì xem mẫu lớn hay nhỏ, biết  hay chưa biết , để tra bảng cho đúng. 2 Nếu là UL tỷ lệ thì mẫu phải lớn. KHẮC CỐT GHI TÂM (tt) BÀI 1: Nếu là kiểm định: KĐ trung bình hay KĐ tỷ lệ . Nhà trường muốn đánh giá số giờ tự học của sinh Xem con số cần kiểm định là con số nào. viên trong tuần. Để biết điều này, phòng đào tạo Xem kiểm định 2 phía hay 1 phía. chọn ngẫu nhiên 25 sinh viên và được kết quả sau: Nếu là KĐ trung bình thì xem mẫu lớn hay nhỏ, biết  hay chưa biết , để tra bảng cho đúng. 9 8 7 6 7 Nếu là KĐ tỷ lệ thì mẫu phải lớn. 8 9 4 7 6 6 4 11 5 4 Làm toán về thống kê phải chú ý là đưa về cùng đơn vị tính/ đo. 3 7 8 8 7 3 6 2 2 8 6 4 1
  2. ThS. Phạm Trí Cao * Chương Thống kê # OTCH 01/04/2016 Hướng dẫn : 1) Ước lượng số giờ tự học trung bình của sinh viên trong tuần? Số giờ tự học 2 3 4 5 6 7 8 9 11 2) Ước lượng số giờ tự học trung bình của sinh Số sinh viên 2 1 3 1 5 5 5 2 1 viên trong tuần, với độ tin cậy 95%? (Giả n = 25 , n x = 158 , n x 2= 1118 , x = 1 nx = 158/25 = 6,32 i i i i n i i thiết số giờ tự học của sinh viên trong tuần 2 1 2 s = (nx2 n.(x)2) = (1118–25(6,32) )/24 = 4,9767 tuân theo luật phân phối chuẩn) n 1 i i 3) Một báo cáo trong quá khứ nói rằng: số giờ s = s2= 2,2309 tự học trung bình của sinh viên trong tuần là 1) Gọi  là số giờ tự học trung bình của sinh viên trong tuần của 8. Với mức ý nghĩa 5%, hãy so sánh kết quả toàn trường. Ta dùng x để ước lượng  mới điều tra này với kết quả trong quá khứ? Vậy số giờ tự học trung bình trong tuần của sinh viên là 6,32 giờ. 5 6 2) n = 25 t0,025(24) : bác bỏ H0 65 10 7 8 Vậy số giờ tự học TB của sinh viên trong tuần hiện nay 70 6 ít hơn trong quá khứ ( do x = 6,32 < 0 = 8) 2
  3. ThS. Phạm Trí Cao * Chương Thống kê # OTCH 01/04/2016 1) Ước lượng doanh số bán trung bình trong 1 ngày 5) Trước đây doanh số bán trung bình của siêu thị của siêu thị, với độ tin cậy 95%? là 35 triệu đ/ngày. Số liệu ở bảng trên được thu 2) Những ngày có doanh số bán từ 60 triệu đ trở lên thập sau khi siêu thị áp dụng 1 phương thức bán là những ngày "bán đắt hàng". Hãy ước lượng tỷ lệ hàng mới. Hãy cho nhận xét về phương thức bán những ngày bán đắt hàng của siêu thị? hàng mới, với mức ý nghĩa 5%? 3) Ước lượng tỷ lệ những ngày "bán đắt hàng" của siêu thị, với độ tin cậy 99%? 4) Ước lượng doanh số bán trung bình của 1 ngày "bán đắt hàng" ở siêu thị, với độ tin cậy 95%? (Giả thiết doanh số bán của những ngày bán đắt hàng là đại lượng ngẫu nhiên phân phối theo quy luật chuẩn)  9 10 Hướng dẫn : 3)  = 99% t /2 = 2,58 2 t f(1 f ) Ta có n = 144 , nixi = 6602 , nixi = 321706,  = /2 = (2,58) (0,1944)(1 0,1944) / 144 x = 45,8472 , s2 = 133,0275 , s = 11,5338 n 1) Gọi  là doanh số bán trung bình trong 1 ngày của siêu thị = 0,0851 KTC (0,1093 ; 0,2795) hay 10,93% <p < 27,95%  = 95% t /2 = 1,96 t s 4) Lập bảng sau:  = /2 = (1,96).(11,5338) / 144 = 1,8839 n Khoảng tin cậy (43,9633 <  < 47,7311) Doanh số 60 65 70 Số ngày 12 10 6 2) Tỷ lệ những ngày bán đắt hàng theo mẫu: 2 f = (12+10+6)/ 144 = 0,1944 Ta có n = 28 , nixi = 1790 , nixi = 114850, Gọi p là tỷ lệ những ngày bán đắt hàng của siêu thị x = 1790/28 = 63,9286 ; s = 3,9335 11 12 Vậy tỷ lệ những ngày bán đắt hàng của siêu thị là 19,44% s2 = (114850–28(63,9286)2) / 27 = 15,4724 3
  4. ThS. Phạm Trí Cao * Chương Thống kê # OTCH 01/04/2016 4) Gọi ’ là doanh số bán TB trong 1 ngày bán đắt hàng của siêu thị BÀI 3 t (27) = 2,0518 0,025 Cho X là năng suất lúa ở 1 khu vực (đơn vị tính  = (2,0518).(3,9335)/ 28 = 1,5254 tạ/ha). Điều tra ở 1 số thửa ruộng ta có: Khoảng tin cậy (62,4032 t /2 : bác bỏ H0 là (35 – 40) tạ/ha 13 14 Vậy phương thức bán hàng mới tốt hơn (do x = 45,8472 > 0 = 35) 1) Hãy ước lượng năng suất lúa trung bình của toàn 5) Nếu muốn ước lượng năng suất lúa trung bình với độ vùng, với độ tin cậy 96%? chính xác 0,5 tạ/ha và độ tin cậy 99% dựa trên mẫu đã 2) Những thửa ruộng đạt năng suất trên 45 tạ/ha là cho thì phải điều tra thêm bao nhiêu thửa ruộng nữa? những thửa ruộng đạt năng suất cao. Hãy ước lượng tỷ lệ những thửa ruộng đạt năng suất cao của vùng này, với Hướng dẫn : độ tin cậy 95%? 1) Lập bảng sau: 3) Nếu muốn ước lượng năng suất lúa trung bình của toàn vùng đạt được độ chính xác là 1,4 tạ /ha thì độ tin X 32,5 37,5 42,5 47,5 52,5 cậy là bao nhiêu? N 6 18 28 40 16 4) Người ta nhận định: tỷ lệ những thửa ruộng đạt năng 2 suất cao lớn hơn 50%. Theo bạn nhận định đó đúng n = 108, nixi = 4800, nixi = 216575 không, = 5%? x = 44,4444 , s2 = 30,2999 , s = 5,5045  15 16 4
  5. ThS. Phạm Trí Cao * Chương Thống kê # OTCH 01/04/2016 Hướng dẫn : 4) Lập giả thiết H0 : p = 0,5 ; H1: p > 0,5 1)  = 96% t /2 = 2,05 p : tỷ lệ thửa ruộng đạt năng suất cao thực tế  = (2,05) (5,5045) / 108 = 1,0879 p0 = 0,5: tỷ lệ thửa ruộng đạt năng suất cao theo nhận định Khoảng tin cậy (43,3565 ; 45,5323) = 5% t = 1,65 2) Tỷ lệ thửa ruộng đạt năng suất cao theo mẫu: (f p ) n t = o = (0,5185–0,5) 108 / (0,5)(1 0,5) = 0,3845 f = (40+16)/108 = 0,5185 po(1 po) Gọi p là tỷ lệ thửa ruộng đạt năng suất cao của vùng  = (1,96) (0,5185)(1 0,5185) / 108 = 0,0942 Ta có t < t : chấp nhận H0 . Khoảng tin cậy (0,4243 < p < 0,6127) Vậy nhận định trên sai 2  n 3) t /2 = = (1,4) 108/5,5045 = 2,64 t s s 2 2 5) n = /2 = (2,58 5,5045) / (0,5) = 806,7429 807 (t /2)= 0,4959  = 2(t /2) = 2(0,4959) 17 2 18 = 0,9918 = 99,18% Vậy cần điều tra thêm 807–108 = 699 thửa ruộng nữa BÀI 4. Hướng dẫn : Để thăm dò nhu cầu về một loại hàng ở một TP, 1) Tỷ lệ hộ có nhu cầu về loại hàng này theo mẫu người ta đã tiến hành phỏng vấn 500 hộ gia đình thì thấy có 200 hộ có nhu cầu về loại hàng này. f = 200/500 = 0,4 1) Hãy ước lượng số hộ gia đình có nhu cầu về mặt Gọi p là tỷ lệ hộ có nhu cầu về loại hàng này ở TP hàng này ở thành phố, với độ tin cậy 96%? (Biết tổng  = 2,05 0,4(1 0,4)/ 500 = 0,045 số hộ gia đình của thành phố là 20 000 hộ) Vậy 0,355 < p < 0,445 2) Nếu muốn ước lượng tỷ lệ hộ gia đình có nhu cầu về mặt hàng này đạt được độ chính xác 4% thì độ tin Số hộ gia đình có nhu cầu về loại hàng này ở TP là: cậy là bao nhiêu? 0,355 20 000 < Số hộ < 0,445 20 000 3) Nếu muốn ước lượng tỷ lệ hộ gia đình có nhu cầu 2) t /2 = 0,04 500 / 0,4(1 0,4) = 1,83 về mặt hàng này đạt được độ chính xác 5% và độ tin (t /2) = 0,4664  = 2(t /2) cậy 99% thì cần điều tra bao nhiêu hộ? 19 2 2 20 3) n = (2,58) (0,4)(1–0,4) / (0,05) = 639,014 640 hộ 5
  6. ThS. Phạm Trí Cao * Chương Thống kê # OTCH 01/04/2016 BÀI 5: Kết quả quan sát về hàm lượng Vitamin C Hướng dẫn: của một loại trái cây cho ở bảng sau: 1) H0: µ = 16 ; H1: µ < 16 Hàm lượng 3 - 7 8 - 10 11 - 13 14 - 16 17 - 19 20 - 24 Vitamin C (%) µ: hàm lượng Vitamin C TB trong 1 trái thực tế Số trái 5 10 20 35 25 5 µ0 = 16: hàm lượng Vitamin C TB trong 1 trái 1) Nếu nói hàm lượng Vitamin C trung bình trong 1 theo nhận định trái nhỏ hơn 16% thì tin được không, với = 4%? n = 100 , x = 14,4 , s = 3,8586 2) Qui ước những trái có hàm lượng Vitamin C từ t (14,4 16). 100 4,1466 17% trở lên là trái loại I. Nếu muốn độ chính xác khi 3,8586 ước lượng trung bình hàm lượng vitamin C là 0,5% và α = 4% tα = 1,75 độ chính xác khi ước lượng tỷ lệ trái loại I là 5%, với Ta có t = -4,1466 < -tα = -1,75 : bác bỏ H0 cùng độ tin cậy 95% thì cần mẫu có kích thước 21 22 tối thiểu là bao nhiêu? Vậy nhận định trên tin được. 2) Ước lượng trung bình: BÀI 6. (MẪU 2 CHIỀU) 2 2 X(%) và Y(kg/mm ) là 2 chỉ tiêu chất lượng của 1 1,96*3,8586 n1 2 2 9 0 ,5 loại sản phẩm. Điều tra ở 1 số sản phẩm về (X,Y) ta có kết quả: Ước lượng tỷ lệ: Tỷ lệ mẫu f = (25+5)/100 = 0,3 (2,5) (8,15) (4,15) (4,10) (2,10) (8,25) 2 (2,5) (6,10) (4,10) (8,20) (6,10) (8,15) n 2 1, 9 6 *0,3*0,7 323 0 , 0 5 (6,10) (6,15) (4,15) (6,15) (8,20) (6,15) Cỡ mẫu n = max{229, 323} = 323 (6,20) (6,10) (6,20) (6,15) (6,25) (8,20) Vậy cần khảo sát tối thiểu 323 trái. 23 (6,15) (6,20) (8,15) (6,15) (8,25) (8,15) 24 6
  7. ThS. Phạm Trí Cao * Chương Thống kê # OTCH 01/04/2016 1) Ước lượng trung bình chỉ tiêu Y, với độ tin cậy 98%? Hướng dẫn : 1) Lập bảng sau: 2) Có tài liệu nói: Trung bình chỉ tiêu X là 6,5% . Y Cho nhận xét với mức ý nghĩa 5%? X 5 10 15 20 25 2 2 2 1 3) Quy ước: Sản phẩm có chỉ tiêu Y <= 15(kg/mm ) và 4 2 2 X <= 6(%) là sản phẩm loại A. Ước lượng trung bình chỉ 6 4 6 3 1 8 4 3 2 tiêu Y của sản phẩm loại A, với độ tin cậy 99%? Bảng tần số quan sát của X và Y như sau: (Biết rằng chỉ tiêu Y có quy luật phân phối chuẩn) X 2 4 6 8 Y 5 10 15 20 25 25 26 4) Ước lượng tỷ lệ sản phẩm loại A, với = 5%? n 3 4 14 9 n 2 7 12 6 3 2 2) Lập giả thiết H0 :  = 6,5 ; H1 :  6,5 1) n = 30 , nyy = 455 , nyy = 7725 , y = 15,1667  : trung bình chỉ tiêu X thực tế s 2 = 1 [n y2–n( y)2 ] = 28,4185 , s = 5,3309 y n 1 y y 0 = 6,5 : trung bình chỉ tiêu X theo nhận định = 5% t /2 = 1,96  = 98% t /2 = 2,33 t = (5,9333 – 6,5) 30 / 1,8558 = 1,6726 t sy  = /2 = 2,33 5,3309 / 30 = 2,2639 |t| < t /2 : chấp nhận H0 n 3) Lập bảng sau: Vậy khoảng tin cậy y± là (12,9028 ; 17,4306) Y X 5 10 15 2 2 2 1 2) n = 30 , nxx = 178 , nxx = 1156 , x = 5,9333 4 2 2 2 1 2 2 sx = [nxx – n (x) ] = 3,4441 , sx = 1,8558 27 6 4 6 28 n 1 7
  8. ThS. Phạm Trí Cao * Chương Thống kê # OTCH 01/04/2016 2  BÀI TẬP XSTK. LÊ KHÁNH LUẬN & 3) n = 17 , nyy = 200 , nyy = 2550 , 2 NGUYỄN THANH SƠN & PHẠM TRÍ CAO, y = 11,7647 , sy = 12,3163 , sy = 3,5095 NXB ĐHQG TPHCM 2013. = 99% = 1% t0,005(16) = 2,921 Sách XSTK luyện thi cao học. Bộ môn Toán  = 2,921 3,5095/ 17 = 2,4863 kinh tế, ĐH Kinh tế TP.HCM 2016. Vậy khoảng tin cậy y ± là (9,2784 ; 14,251) Các bạn thân mến! 4) Tỷ lệ sản phẩm loại A theo mẫu: f = 17/30 = 0,5667 Bạn đã “thưởng thức” xong “món” XSTK. Bạn cảm thấy còn “thòm thèm, chưa đã” ư! = 5% t /2 = 1,96 Vậy còn chần chờ gì nữa!  = 1,96 0,5667(1 0,5667) / 30 = 0,1773 Hãy đọc ngay quyển các quyển trên! Khoảng tin cậy f± là (0,3894 ; 0,744) 29 30 MỘT PHÚT DÀNH CHO QUẢNG CÁO !!! Mời ghé thăm trang web: 31   8