Bài giảng Lý thuyết sác xuất và thống kê toán - Lê Trường Giang

pdf 25 trang huongle 3250
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết sác xuất và thống kê toán - Lê Trường Giang", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_ly_thuyet_sac_xuat_va_thong_ke_toan_le_truong_gian.pdf

Nội dung text: Bài giảng Lý thuyết sác xuất và thống kê toán - Lê Trường Giang

  1. TRƢỜNG ĐẠI HỌC TÀI CHÍNH-MARKETING KHOA CƠ BẢN BỘ MƠN TỐN – THỐNG KÊ BÀI GIẢNG LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TỐN Giảng viên ThS. Lê Trƣờng Giang
  2. LÝ THUYẾT XÁC SUẤT & THỐNG KÊ TỐN Chƣơng 5 KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ Bài 1: Tổng quan bài tốn kiểm định giả thiết thống kê Bài 2: Kiểm định giả thiết về tham số của một tổng thể Bài 3: Kiểm định giả thiết về tham số của hai tổng thể
  3. Bài 1. Tổng quan bài tốn kiểm định giả thiết thống kê Bài tốn 1. Xét bài tốn sau, trọng lượng trung bình của mỗi sản phẩm được đĩng gĩi tự động tại một nhà máy M là 50kg. Biết rằng nếu quá trình đĩng gĩi khơng tốt, trọng lượng sản phẩm cao hơn 50kg thì sẽ gây thiệt hại cho nhà sản xuất, ngược lại nếu trọng lượng thấp hơn 50kg sẽ làm mất khách hàng. Sau một thời gian hoạt động, người ta cho rằng việc đĩng gĩi sản phẩm của nhà máy M khơng cịn tốt. Lấy ngẫu nhiên 100 sản phẩm do nhà máy M đĩng gĩi thu được trọng lượng trung bình là 49,98kg với độ lệch chuẩn là 0,01kg. Vấn đề đặt ra là dựa trên mẫu ta cần phải đưa ra nhận xét, bác bỏ hay khơng bác bỏ nghi ngờ trên.
  4. Bài 1. Tổng quan bài tốn kiểm định giả thiết thống kê Bài tốn 2. Một loại thuốc A ban đầu cĩ tỉ lệ chữa khỏi bệnh B là 90%. Sau một thời gian, người ta nghi ngờ tỉ lệ chữa khỏi bệnh B của thuốc A đã giảm xuống dưới 90% do bệnh B đã kháng thuốc. Cho ngẫu nhiên 120 người mắc bệnh B chữa trị bằng thuốc A thấy cĩ 15 người khơng khỏi bệnh. Vai trị của nhà thống kê là dựa trên mẫu quan sát để đưa ra quyết định rằng cĩ bác bỏ nghi ngờ trên được khơng.
  5. Bài 1. Tổng quan bài tốn kiểm định giả thiết thống kê 1. Các khái niệm a. Kiểm định giả thiết thống kê Giả thiết thống kê được hiểu là một mệnh đề (hay một khẳng định) về tham số của tổng thể: kỳ vọng, tỉ lệ, phương sai, phân phối xác suất của tổng thể; tính độc lập giữa các biến ngẫu nhiên tổng thể. Việc tìm ra một kết luận cuối cùng là bác bỏ hay chấp nhận giả thiết được nêu ra từ tổng thể được gọi là kiểm định giả thiết thống kê
  6. Bài 1. Tổng quan bài tốn kiểm định giả thiết thống kê 1. Các khái niệm b. Bài tốn kiểm định giả thiết thống kê Trong bài tốn kiểm định. Ta đặt ra cặp giả thiết – đối thiết Giả thiết H 0 : mang nghĩa là khơng cĩ sự thay đổi. Đối thiết H 1 : là mệnh đề đối của giả thiết. Bài tốn kiểm định giả thiết thống kê được đặt ra như sau: Dựa vào số liệu mẫu chọn được, với một độ tin cậy cho trước chúng ta cần khẳng định giả thiết đúng hay đối thiết đúng.
  7. Bài 1. Tổng quan bài tốn kiểm định giả thiết thống kê 1. Các khái niệm b. Tiêu chuẩn kiểm định và giá trị quan sát Tiêu chuẩn kiểm định giả thiết là một thống kê G phụ thuộc vào tham số đã biết trong giả thiết H0, sao cho nếu giả thiết đúng thì quy luật phân phối xác suất của G hồn tồn được xác định. Với số liệu mẫu cụ thể chọn được x12, x , , xn , ta tính được một giá trị cho thống kê đã chọn G x12, x , , xn . Kết quả tính được này gọi là giá trị quan sát.
  8. Bài 1. Tổng quan bài tốn kiểm định giả thiết thống kê 1. Các khái niệm c. Nguyên lý kiểm định giả thiết Nguyên tắc chung của kiểm định giả thiết thống kê là dựa trên nguyên lý xác suất nhỏ: khi thực hiện một phép thử, một sự kiện cĩ xác suất xuất hiện đủ bé thì coi như khơng xuất hiện. Như vậy, chúng ta quyết định bác bỏ giả thiết nếu xác suất xuất hiện của một sự kiện quan sát được, tính trong điều kiện giả thiết đúng là nhỏ d. Miền bác bỏ Xây dựng một miền W thỏa mãn điều kiện PGH W 0 đúng với rất bé. Miền W được coi là miền bác bỏ giả thiết H0
  9. Bài 1. Tổng quan bài tốn kiểm định giả thiết thống kê 1. Các khái niệm e. Sai lầm và mức ý nghĩa Sai lầm loại 1 là sai lầm khi bác bỏ H0 nhưng thực tế đúng. Xác suất sai lầm loại 1 cho bởi PGH W 0 đúng . Sai lầm loại 2 là sai lầm khi chấp nhận H0 nhưng thực tế sai. Xác suất sai lầm loại 2 được cho bởi PGH W 0 sai  . Khĩ cĩ thể đồng thời giảm cả hai loại xác suất sai lầm này. Do đĩ ta cố định xác suất sai lầm loại 1 trước ở mức rất bé và từ đĩ tìm miền bác bỏ giả thiết H0 sao cho xác suất sai lầm loại 2 nhỏ nhất cĩ thể.
  10. Bài 1. Tổng quan bài tốn kiểm định giả thiết thống kê 2. Các bước cơ bản của một phép kiểm định giả thiết 1. Đặt giả thiết H0 và đối thiết H1 . Tổng thể X cĩ tham số  chưa biết cần kiểm định H00:  H00:  H00:  ; ; . H10:  H10:  H10:  2. Xác định mức ý nghĩa của phép kiểm định. 3. Chọn tiêu chuẩn kiểm định GXXX 12, , , n dựa trên mẫu. 4. Thiết lập miền bác bỏ giả thiết H0 là W . 5. Kiểm định giả thiết. Từ mẫu cụ thể tính giá trị kiểm định g G x12, x , , xn , nếu gW thì bác bỏ giả thiết H0 , khi gW  thì khơng cĩ cơ sở bác bỏ giả thiết .
  11. Bài 2. Kiểm định giả thiết về tham số của một tổng thể 1. Kiểm định giả thiết về trung bình tổng thể Bài tốn. Tổng thể X cĩ kỳ vọng EX  chưa biết. Ta cần kiểm định giả thiết H00: , các đối thiết cĩ thể là H10:  hai phía H10:  phía phải H10:  phíatrái Thực hành tính tốn kiểm định. Bước 1. Nhận định trường hợp bài tốn kiểm định, đặt cặp giả thiết Bước 2. Với mức ý nghĩa đã cho xác miền bác bỏ giả thiết W . Bước 3. Dựa vào mẫu cụ thể tính xs, từ đĩ tính giá trị kiểm định. Bước 4. Kết luận. Bài tốn được giải theo các trường hợp cho trong bảng sau
  12. T.H Điều kiện Chọn cặp giả thiết Giá trị kiểm Miền bác bỏ giả thiết H0 định H00:  ; H1 n 30 W ,, z   z  22 n 30 H :  10 xn 0 Biết X ppc Wz 1 , z  qs   H10:  2 H :  10 Wz , 1  2 W ,, z   z  22 H :  10 xn 0 Wz 1 , z n 30  qs s H10:  2 Chưa biết Wz , 1  2 H :  W ,, tnn 11  t 10 11  xn  n 30 22 z 0 qs s X ppc H10:  n 1 Wt  1 , n 1 Wt  , 1
  13. Bài 2. Kiểm định giả thiết về tham số của một tổng thể 1. Kiểm định giả thiết về trung bình tổng thể Ví dụ 1. Đo chiều cao (đơn vị cm) của 24 trẻ em 2 tuổi tại 1 huyện ta cĩ số liệu: 84,4; 89,9; 89,0; 91,9; 87,0; 78,5; 84,5; 86,3; 80,6; 80,0; 81,3; 86,8; 83,4; 89,8; 85,4; 80,6; 85,0; 82,5; 80,7; 84,3; 95,4; 85,0; 85,5; 81,6 Biết chiều cao của trẻ em hai tháng tuổi chung của đất nước là biến ngẫu nhiên cĩ phân phối chuẩn N (86, 5; 9, 67) . Hỏi với mức ý nghĩa 1% cĩ sự khác biệt đáng kể về chiều cao trung bình của trẻ em huyện này so với chiều cao trung bình chung của đất nước khơng?
  14. Bài 2. Kiểm định giả thiết về tham số của một tổng thể 1. Kiểm định giả thiết về trung bình tổng thể Ví dụ 2. Một trại chăn nuơi gà đã nuơi thí nghiệm bằng khẩu phần thức ăn cĩ bổ sung kháng sinh. Sau 8 tuần lễ nuơi, kiểm tra 81 con gà ta cĩ số liệu: Trọng lượng (kg) 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 Số gà 5 7 9 12 15 10 9 6 5 3 a) Trại chăn nuơi báo cáo trọng lượng trung bình của những con gà nuơi thí nghiệm sau 8 tuần nuơi là 4,3 kg thì cĩ đúng khơng với độ tin cậy 95%? b) Giả sử những con gà sau 8 tuần lễ nuơi cĩ trọng lượng lớn hơn 4,3 kg được xếp loại I và trọng lượng của nĩ cĩ phân phối chuẩn. Với mức ý nghĩa 5%, chúng ta cĩ thể kết luận trọng lượng trung bình của những con gà loại I lớn hơn 4,5 kg được khơng?
  15. Bài 2. Kiểm định giả thiết về tham số của một tổng thể 2. Kiểm định giả thiết về tỉ lệ tổng thể Bài tốn. Tổng thể gồm hai loại phần tử, phần tử cĩ tính chất A và phần tử khơng cĩ tính chất A. Trong đĩ, tỉ lệ phần tử cĩ tính chất A là tham số p chưa biết. Với mức ý nghĩa ta cần kiểm định một trong các cặp giả thiết – đối thiết HH01, H00: p p H00: p p H00: p p ; ; . H10: p p H10: p p H10: p p
  16. Bài 2. Kiểm định giả thiết về tham số của một tổng thể 2. Kiểm định giả thiết về tỉ lệ tổng thể Điều kiện Chọn cặp giả thiết Giá trị kiểm định Miền bác bỏ giả thiết H0 H00: p p ; H1 H: p p W ,, z  z 10   22 H: p p np 5 10 f p n 0 Wz 1 , 0  zqs np15 2 0 H: p p pp00 1 10 Wz , 1  2
  17. Bài 2. Kiểm định giả thiết về tham số của một tổng thể 1. Kiểm định giả thiết về trung bình tổng thể Ví dụ 3. Ở một nước, một đảng chính trị tuyên bố rằng 45% cử tri sẽ bỏ phiếu bầu cho ơng A là ứng cử viên của họ. Chọn ngẫu nhiên 200 người hỏi ý kiến cĩ 80 người sẽ bầu cho ơng A. với mức ý nghĩa 5% hãy cho nhận xét về tuyên bố trên. Ví dụ 4. Giả sử một huyện năm trước cĩ tỷ lệ trẻ em bị suy dinh dưỡng là 10%, năm nay huyện thực hiện nhiều chính sách nhằm làm giảm tỷ lệ này xuống. chọn 400 đứa trẻ, kiểm tra ta thấy cĩ 32 đứa trẻ vẫn cịn bị suy dinh dưỡng. với mức ý nghĩa 1% hãy cho kết luận về việc giảm tỷ lệ trẻ em suy dinh dưỡng của huyện này.
  18. Bài 2. Kiểm định giả thiết về tham số của hai tổng thể 3. Kiểm định trung bình hai tổng thể độc lập (So sánh trung bình của hai tổng thể đ l) Hai tổng thể X, Y độc lập cĩ kì vọng lần lượt là XY, chưa biết, cần kiểm định giả thiết về so sánh X và Y H0 : XY | H1 : XY gọi là kiểm định hai phía; | H1 : XY gọi là kiểm định một phía phải; | H1 : XY gọi là kiểm định một phía trái. Bài tốn được giải theo từng trường hợp sau:
  19. TH Điều kiện Chọn cặp giả thiết Giá trị kiểm định Miền bác bỏ giả thiết H0 H0 : XY ; H1 n 30 X W ,, z   z  nY 30 Biết H1 : XY 22 xy zqs 22 XY, H1 : XY Wz  1/2,  nX 30 XY H1 : XY Wz , nnXY nY 30  1/2 X; Y ppc W ,, z   z  xy z 22 qs ss22 Wz , XY  1/2 nn XY Wz , Chưa  1/2 biết n 30 X n n 22 n n W ,, tXYXY  t n 30 11  xy Y z 22 qs X; Y ppc 2 11 nn 2 s  Wt XY , nn XY 1  XY (Note: nn 2 nn 2 30) Wt , XY XY 1  Lưu ý: n 11 s22 n s 2 XY XY s nnXY 2
  20. Bài 2. Kiểm định giả thiết về tham số của hai tổng thể Ví dụ 5. So sánh mức thu nhập theo tuần giữa nam và nữ tại một cơng ty liên doanh ta cĩ số liệu mẫu như sau: – Nữ: chọn một mẫu 40 người, tính được thu nhập trung bình . – Nam: chọn một mẫu 50 người, tính được thu nhập trung bình . Biết rằng phương sai thu nhập theo tuần của nữ là 80 và của nam là 100. Với mức ý nghĩa 1%, cĩ thể kết luận thu nhập trung bình của nữ thấp hơn nam được khơng?
  21. Ví dụ 6. Khảo sát chiều cao ( đơn vị cm ) của học sinh nữ tại hai trường phổ thơng trung học huyện A và huyện B ta cĩ số liệu: CC 150- 152- 154- 156- 158- 160- 162- 164- 166- 168- 152 154 156 158 160 162 164 166 168 170 A 3 5 7 15 26 25 12 13 10 5 B 5 10 14 18 22 11 9 5 4 2 a) Với mức ý nghĩa 1% cĩ thể xem chiều cao trung bình học sinh trung học nữ của huyện A cao hơn huyện B được khơng? b) Những học sinh cĩ chiều cao từ 154 cm trở xuống được xem là nhĩm thấp. giả sử chiều cao học sinh nhĩm thấp ở hai huyện là biến ngẫu nhiên cĩ phân phối chuẩn cĩ phương sai xấp xỉ bằng nhau. Một người nĩi chiều cao trung bình học sinh nhĩm thấp của hai huyện là như nhau thì cĩ đúng khơng với độ tin cậy là 95%.
  22. Bài 2. Kiểm định giả thiết về tham số của hai tổng thể 4. Kiểm định tỉ lệ hai tổng thể độc lập (So sánh tỉ lệ của hai tổng thể độc lập) Hai tổng thể X, Ycĩ tỉ lệ phần tử tính chất A là ppXY, chưa biết, cần kiểm định giả thiết về so sánh pX và pY H0 : pXY p | H1 : pXY p gọi là kiểm định hai phía; H0 : pXY p | H1 : pXY p gọi là kiểm định một phía phải; H0 : pXY p | H1 : pXY p gọi là kiểm định một phía trái. Bài tốn được giải như sau:
  23. Bài 2. Kiểm định giả thiết về tham số của hai tổng thể 4. Kiểm định tỉ lệ hai tổng thể độc lập (So sánh tỉ lệ của hai tổng thể độc lập) Điều kiện Chọn cặp giả thiết Giá trị kiểm định Miền bác bỏ giả thiết H0 H0 : pXY p ; H1 W ,, z  z H1 : pXY p   ff 22 z XY nnXY; qs H: p p Wz , 11 đủ lớn 1 XY  1/2 ff 1 nn XY H1 : pXY p Wz  , 1/2 nXXYY f n f nA Lưu ý: f , n nXY n , nA là số phần tử tính chất A của 2 tổng thể nXY n n
  24. Bài 2. Kiểm định giả thiết về tham số của hai tổng thể Ví dụ 7. Kiểm tra 100 đứa trẻ của vùng I phát hiện 42 đứa trẻ bị sâu răng, vùng II cĩ 92 đứa trẻ bị sâu răng khi kiểm tra 200 đứa trẻ. Với mức ý nghĩa 5% cĩ thể xem tỷ lệ trẻ bị sâu răng ở 2 vùng bằng nhau được khơng? Ví dụ 8. Kiểm tra chất lượng sản phẩm về một loại hàng do hai nhà máy A và B sản xuất cho kết quả : trong 500 sản phẩm của A cĩ 50 phế phẩm và trong 400 sản phẩm của B cĩ 60 phế phẩm. với mức ý nghĩa 5%, hãy xem chất lượng sản phẩm của A cĩ tốt hơn B khơng ?
  25. XIN CHÂN THÀNH CẢM ƠN!