Bài giảng xác suất thống kê - Chương 4: Tổng thể và mẫu - Chi Bình Minh

pdf 43 trang huongle 2820
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng xác suất thống kê - Chương 4: Tổng thể và mẫu - Chi Bình Minh", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_chuong_4_tong_the_va_mau_chi_bin.pdf

Nội dung text: Bài giảng xác suất thống kê - Chương 4: Tổng thể và mẫu - Chi Bình Minh

  1. Giảng viên: Chu Bình Minh Bài giảng Xác suất thống kê Nam Dinh,Februay, 2008
  2. PHẦN 2 THỐNG KÊ TỐN CHƯƠNG 4: TỔNG THỂ VÀ MẪU
  3. I. Khái niêm lý thuyết mẫu Nhiều bài tốn trong thực tế dẫn đến nghiên cứu một hay nhiều dấu hiệu định tính hoặc địnhlượng đặc trưng cho các phần tử của một tập hợp nào đĩ. Chẳng hạn nếu muốn điều tra thu nhập bình quân của các gia đình ở Hà Nội thì tập hợp cần nghiên cứu là các hộ gia đình ở Hà Nội, dấu hiệu nghiên cứu là thu nhập của từng mỗi gia đình.
  4. I. Khái niêm lý thuyết mẫu Một doanh nghiệp muốn nghiên cứu các khách hàng của mình về dấu hiệu định tính cĩ thể là mức độ hài lịng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp, cịn dấu hiệu định lượng là số lượng sản phẩm của doanh nghiệp mà khách hàng cĩ nhu cầu được đáp ứng. Khi khảo sát một tín hiệu là quá trình ngẫu nhiên người ta tiến hành lấy mẫu tại những thời điểm nào đĩ và thu được các tín hiệu mẫu.
  5. I. Khái niêm lý thuyết mẫu Để xử lý dấu hiệu cần nghiên cứu đơi khi người ta sử dung phương pháp nghiên cứu tồn bộ, đĩ là điều tra tồn bộ các phần tử của tập hợp theo dấu hiệu cần nghiên cứu để rút ra các kết luận cần thiết. Tuy nhiên trong thực tế việc áp dụng phương pháp này gặp phải những khĩ khăn sau: - Do qui mơ của tập hợp cần nghiên cứu quá lớn nên việc nghiên cứu tồn bộ sẽ địi hỏi nhiều chi phí về vật chất và thời gian, cĩ thể khơng kiểm sốt được dẫn đến bị chồng chéo hoặc bỏ sĩt.
  6. I. Khái niêm lý thuyết mẫu - Trong nhiều trường hợp khơng thể nắm được tồn bộ các phần tử của tập hợp cần nghiên cứu, do đĩ khơng thể tiến hành tồn bộ được. - Cĩ thể trong quá trình điều tra sẽ phá hủy đối tượng nghiên cứu Vì thế trong thực tế phương pháp nghiên cứu tồn bộ thường chỉ áp dụng đối với các tập hợp cĩ qui mơ nhỏ, cịn chủ yếu người ta sử dụng phương pháp khơng tồn bộ mà đặc biệt là phương pháp nghiên cứu chọn mẫu.
  7. II. Tổng thể. Tồn bộ các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hay định lượng nào đĩ là một tổng thể. Số lượng phần tử của tổng thể gọi là kích thước của tổng thể. Dấu hiệu nghiên cứu của tổng thể được mơ tả bằng biến ngẫu nhiên X gọi là biến ngẫu nhiên gốc. Do đĩ, ta cĩ thể áp dung các cơng thức xác suất để áp dụng vào việc nghiên cứu tổng thể.
  8. II. Tổng thể. Ví dụ 1 Nghiên cứu thời gian tự học của sinh viên một trường đại học thì tổng thể là tồn bộ các sinh viên của trường này. Do trường đại học này cĩ 5000 sinh viên nên tổng thể cĩ kích thước 5000. Dấu hiệu nghiên cứu là thời gian tự học trong ngày của mỗi sinh viên trường này (Dấu hiệu nghiên cứu định lượng).
  9. II. Tổng thể. Ta cĩ thể mơ hình hĩa dấu hiệu nghiên cứu bằng cách. Chọn ngẫu nhiên 1 sinh viên của trường và gọi X là thời gian tự học của sinh viên này, X gọi là biến ngẫu nhiên gốc. Do vậy thay vì nghiên cứu thời gian tự học trong ngày của mỗi sinh viên ta sẽ sử dung các kiến thức về xác suất nghiên cứu biến ngẫu nhiên gốc X ví dụ như muốn biết thời gian tự học trung bình trong ngày của mỗi sinh viên ta cần tìm EX (trung bình tổng thể), cần biết tỉ lệ sinh viên cĩ thời gian tự học trong ngày lớn hơn 5 giờ ta cần tìm P(X>5),
  10. II. Tổng thể. Ví dụ 2 Nghiên cứu tỉ lệ khách hàng khơng hài lịng với sản phẩm A thì tổng thể là tồn bộ khách hàng dùng sản phẩn A. Trường hợp này thường khĩ xác định được kích thước chính xác của tổng thể. Dấu hiệu nghiên cứu ở đây là mỗi khách hàng dùng sản phẩm A cĩ hài lịng hay khơng (dấu hiệu nghiên cứu định tính). Ta mơ hình hĩa dấu hiệu trên bằng cách chọn ngẫu nhiên 1 khách hàng dùng sản phẩm A và gọi X là số khách hàng khơng hài lịng chọn được. X chỉ nhận hai giá trị 0 và 1 và (X=1) chính là biến cố chọn được khách hàng khơng hài lịng nên P(X=1) = p là tỉ lệ khách khơng hài lịng với sản phẩm A. Vậy biến ngẫu nhiên X cĩ quy luật A(p).
  11. III. Mẫu ngẫu nhiên. Ta gọi một mẫu là ngẫu nhiên nếu trong phép lấy mẫu đĩ mỗi phần tử được chọn một cách độc lập và cĩ xac suất như nhau. Do đĩ tá khái niệm:
  12. III. Mẫu ngẫu nhiên. Định nghĩa: Mẫu ngẫu nhiên kích thước n là tập hợp gồm n biến ngẫu nhiên độc lập 1, 2, , 푛 được thành lập từ biến ngẫu nhiên gốc X trong tổng thể và cĩ cùng quy luật phân phối xác suất với X. Ký hiệu: 푊 = ( 1, 2, , 푛 ) Tức là các biến ngẫu nhiên 1, 2, , 푛 độc lập và 푖~
  13. III. Mẫu ngẫu nhiên. Khi 푖 nhận giá trị cụ thể 푖 thì ta cĩ mẫu cụ thể: 푤 = ( 1, 2, , 푛 ) Để mơ tả số liệu của một mẫu cụ thể ta thường sử dụng: + Bảng phân bố tần số: 푖 1 2 푛 푛푖 푛1 푛2 푛푛 Với 푛푖 là tần số xuất hiện của 푖 trong mẫu. + Bảng phân bố tần suất: 푖 1 2 푛 푖 1 2 푛 Với 푖 là tần suất xuất hiện của 푖 trong mẫu.
  14. III. Mẫu ngẫu nhiên. Ví dụ 1 Từ tập hợp các sinh viên của trường chọn ngẫu nhiên 100 sinh viên và gọi: 1 là thời gian tự học trong ngày của sinh viên chọn lần 1. Hiển nhiên 1~ . 2 là thời gian tự học trong ngày của sinh viên chọn lần 2. Hiển nhiên 2~ và 1, 2 độc lập. 100 là thời gian tự học trong ngày của sinh viên chọn lần 100. Hiển nhiên 100 ~ và 1, 2, , 100 độc lập.
  15. III. Mẫu ngẫu nhiên. Khi đĩ một bộ gồm 100 biến ngẫu nhiên độc lập và cĩ cùng quy luật phân phối với biến ngẫu nhiên gốc X : 푊 = ( 1, 2, , 100 ) Gọi là mẫu ngẫu nhiên kích thước 100. Giả sử trong trường hợp chọn cụ thể ta được: Lần 1 chọn được sinh viên tự học 2 giờ/1 ngày nên 1 = 2 Lần 2 chọn được sinh viên tự học 6 giờ/1 ngày nên 2 = 6 Lần 100 chọn được sinh viên tự học 5 giờ/1 ngày nên 100 = 5
  16. III. Mẫu ngẫu nhiên. Khi đĩ ta cĩ một mẫu cụ thể 푤 = (2; 6; ; 5) Do khi liệt kê 100 phần tử trên một hàng gây cảm giác giắc rối mà ta lại nhận thấy nhiều phần tử trên hàng đĩ cĩ giá trị bằng nhau (chẳng hạn cĩ 10 phần tử bằng 2, 15 phần tử bằng 6, 5 phần tử bằng 5) ta cĩ thể biểu diễn mẫu cụ thể trên dạng: 푖 2 6 5 푛푖 10 15 5 Thì bảng trên gọi là bản phân phối tần số của mẫu. Hoặc ta cĩ thể lập bảng phân phối tần suất của mẫu với 푛 = 푖 푖 푛 푖 2 6 5 푖 10/100 15/100 5/100
  17. III. Mẫu ngẫu nhiên. Ví dụ 2 Do khơng xác định được tồn bộ các khách hàng nên cơng ti sẽ khơng thể hỏi ý kiến của tồn bộ khách hàng về sản phẩm A được nên cơng ti tiến hành thăm dị bằng cách hỏi ý kiến của 50 khách hàng dùng sản phẩn A (Ngay cả khi xác định được nhưng do số lượng quá nhiều cũng làm như trên) và gọi: 1 là là số khách hàng khơng hài lịng chọn được lần 1 nên 1~ ( ) 2 là là số khách hàng khơng hài lịng chọn được lần 2 nên 2~ ( ) và 1, 2 độc lập
  18. III. Mẫu ngẫu nhiên. 50 là là số khách hàng khơng hài lịng chọn được lần 50 nên 50~ ( ) và 1, 2, , 50 độc lập Khi đĩ một bộ gồm 50 biến ngẫu nhiên độc lập và cĩ cùng quy luật phân phối A(p) với biến ngẫu nhiên gốc X : 푊 = ( 1, 2, , 50) Là một mẫu ngẫu nhiên kích thước 50.
  19. III. Mẫu ngẫu nhiên. Giả sử trong trường hợp chọn cụ thể ta được: Lần 1 chọn được khách hàng hài lịng với sản phẩm A nên 1 = 0 Lần 2 chọn được khách khơng hàng hài lịng với sản phẩm A nên 2 = 1 Lần 50 chọn được khách khơng hàng hài lịng với sản phẩm A nên 50 = 1
  20. III. Mẫu ngẫu nhiên. Khi đĩ ta cĩ một mẫu cụ thể 푤 = (0; 1; ; 1) Giả sử trong mẫu cĩ 5phần tử bằng 1. Khi đĩ ta cĩ bảng phân phối tần số của mẫu 푖 0 1 푛푖 45 5 5 = gọi là tỉ lệ mẫu 50
  21. III. Mẫu ngẫu nhiên. Mẫu cĩ thể cho dưới dạng khoảng 푖 ( 1; 1) ( 2; 2) ( 푛 ; 푛 ) 푛푖 푛1 푛2 푛푛 Co thể chuyển về dạng điểm bằng cách đơn giản là đặt: + = 푖 1 푖 2 Ta cĩ: 푖 1 2 푛 푛푖 푛1 푛2 푛푛
  22. IV. Thống kê. 1. Khái niệm Cho mẫu 푊 = ( 1, 2, , 푛 ) , thống kê G là việc tổng hợp mẫu đã cho dưới dạng mơt hàm nào đĩ theo các biến 1, 2, , 푛 . Tức là = ( 1, 2, , 푛 ) Sau đây là một số thống kê quan trọng
  23. IV. Thống kê. 2. Trung bình mẫu 푛 1 = 푛 푖 푖=1 Ta cĩ: = và = 3. Phương sai mẫu 푛 푛 1 1 푆 2 = ( − )2 = 2 − ( )2 푛 푖 푛 푖 푖=1 푖=1 푛−1 Ta cĩ: 푆 2 = 푛
  24. IV. Thống kê. 4. Phương sai mẫu hiệu chỉnh 푛 푛 1 1 푛 푆2 = ( − )2 = 2 − ( )2 푛 − 1 푖 푛 − 1 푖 푛 − 1 푖=1 푖=1 Ta cĩ: 푆2 =
  25. IV. Thống kê. Chú ý: Khi mẫu cụ thể cho dưới dạng tần số ta cĩ thể rút gọn: 1 = 푛 푛 푖 푖 푖=1 1 푠 2 = 푛 2 − ( )2 푛 푖 푖 푖=1 1 푛 푠2 = 푛 2 − ( )2 푛 − 1 푖 푖 푛 − 1 푖=1
  26. IV. Thống kê. Ví dụ Cho mẫu dưới dạng bảng phân phối tần số. 푖 3 4 5 6 7 8 푛푖 5 10 15 20 15 5 Tính , 푠 2, 푠2 Giải
  27. IV. Thống kê. 1 = 3.5 + 4.10 + 5.15 + 6.20 + 7.15 + 8.5 70 = 5,643 1 푠 2 = 32. 5 + 42. 10 + 52. 15 + 62. 20 + 72. 15 70 + 82. 5 − (5,643)2 = 1,3422 1 푠2 = 32. 5 + 42. 10 + 52. 15 + 62. 20 + 72. 15 69 70 + 82. 5 − (5,643)2 = 1,3522 69
  28. IV. Thống kê. Ta cĩ thể lập bảng đề tính cho giảm sai sĩt. 2 푖 푛푖 푖푛푖 푖 푛푖 3 5 15 45 4 10 40 160 5 15 75 375 6 20 120 720 7 15 105 735 8 5 40 320 2 n = 70 푖푛푖= 푖 푛푖 = 395 2355 Suy ra 푛 2푛 2푛 푛 = 푖 푖 ; 푠 2 = 푖 푖 − ( )2, 푠2 = 푖 푖 − ( )2 푛 푛 푛 − 1 푛 − 1
  29. IV. Thống kê. Hoặc ta sử dụng máy tính CASIOfx500 để tính Thực hiện theo các bước : 1. Vào chế độ thống kê (SD) : mode 2 2. Nhập mẫu : Lặp lại quá trình 푖 shift ; 푛푖 DT. Cu thể đối với mẫu đã cho là 3 shift ; 5 DT 4 shift ; 10 DT 8 shift ; 5 DT
  30. IV. Thống kê. 3. Xem kết quả Xem : shift S-var 1 = Xem 푠 : shift S-var 2 = Xem 푠 : shift S-var 3 =
  31. V. Phân phối xác suất của một số thống kê đặc trưng. 1. Trường hợp biến ngẫu nhiên gốc cĩ quy luật chuẩn Từ tổng thể ta rút ra mẫu 푊푛 = ( 1, 2, , 푛 ) thì các biến ngẫu nhiên 1, 2, , 푛 độc lập và cĩ cùng quy luật phân phối với ~ (휇, 휎2) 2 ( 푡ứ 푙à 푖~ 휇, 휎 , 푖 = 1 , 푛 ). Do là tổ hợp tuyến tính của 1, 2, , 푛 nên nĩ cũng cĩ quy luật phân phối chuẩn 휎2 휎2 và = 휇, = nên ~ (휇, ) 푛 푛 suy ra 푿 − 흁 푼 = 풏 ~ 푵( , ) 흈
  32. V. Phân phối xác suất của một số thống kê đặc trưng. 1. Trường hợp biến ngẫu nhiên gốc cĩ quy luật chuẩn Do 푛 푛 1 푆 2 = ( − 휇)2 ⟺ 푛푆 2 = ( − 휇)2 푛 푖 푖 푖=1 푖=1 nên 풏 풏푺 푿 − 흁 흌 = = ( 풊 ) ~흌 흈 흈 (풏) 풊=
  33. V. Phân phối xác suất của một số thống kê đặc trưng. 1. Trường hợp biến ngẫu nhiên gốc cĩ quy luật chuẩn Tương tự (풏 − )푺 흌 = ~흌 흈 (풏− ) Nếu ta xây dựng tiếp thống kê − 휇 푈 푛 = = 휎 = 2 푛 − 1 푆2 휒 푛 − 1 푛 − 1 휎2 푿 − 흁 푻 = 풏 ~ 푻 푺 (풏− )
  34. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp cĩ hai biến ngẫu nhiên gốc cĩ cùng phân phối chuẩn Giả sử ta xét một lúc hai tổng thể. Ở tổng thể thứ nhất ta 2 xét biến ngẫu nhiên gốc ~ (휇1, 휎1 ), ở tổng thể thứ hai 2 ta xét biến ngẫu nhiên gốc 푌~ (휇2, 휎2 ) . Từ hai tổng thể nĩi trên rút ra hai mẫu ngẫu nhiên độc lập cĩ kích thước tương ứng 푛1 và 푛2: 푊 = ( 1, 2, , 푛1 ) 푊푌 = (푌1, 푌2, , 푌푛2 )
  35. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp cĩ hai biến ngẫu nhiên gốc cĩ cùng phân phối chuẩn Xét − 푌 : 2 2 휎1 휎2 Do ~ (휇1, ) và 푌 ~ (휇2, ) nên − 푌 ~ ( − 푛1 푛2 푌 , − 푌 ) và − 푌 = − 푌 = 휇1 − 휇2, − 푌 = + 휎2 휎2 푌 = 1 + 2 푛1 푛2 suy ra 2 2 휎1 휎2 − 푌 ~ (휇1 − 휇2, + ) 푛1 푛2
  36. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp cĩ hai biến ngẫu nhiên gốc cĩ cùng phân phối chuẩn nên 푿 − 풀 − (흁 − 흁 ) 푼 = ~푵( , ) 흈 흈 + 풏 풏
  37. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp cĩ hai biến ngẫu nhiên gốc cĩ cùng phân phối chuẩn Mặt khác ta cĩ các thống kê (푛 − 1)푆 2 휒2 = 1 ~휒2 2 (푛1−1) 휎1 (푛 − 1)푆 2 휒2 = 2 푌 ~휒2 푌 2 (푛2−1) 휎2 nên 흌 = 흌푿 + 흌풀~흌풏 +풏 −
  38. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp cĩ hai biến ngẫu nhiên gốc cĩ cùng phân phối chuẩn suy ra 푈 = ~ (푛 +푛 −2) 휒2 1 2 푛1 + 푛2 − 2
  39. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp biến ngẫu nhiên gốc tuân theo quy luận phân phối khơng - một Ở trong những trường hợp này ta thường xử dụng định lý giới hạn trung tâm là : Khi 푛 ≫ 0, thì − 푈 = 푛~ (0,1) 휎 và − 푈 = 푛~ (0,1) 푆
  40. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp biến ngẫu nhiên gốc tuân theo quy luận phân phối khơng - một Giả sử trong tổng thể, biến ngẫu nhiên gốc X tuân theo quy luật khơng-một 푃 = 1 = , 푃 = 0 = 1 − = 푞 Từ tổng thể lập mẫu ngẫu nhiên kích thước n: 푊푛 = ( 1, 2, , 푛 ), 푛 1 = = = 푛 푖 푛 푖=1
  41. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp biến ngẫu nhiên gốc tuân theo quy luận phân phối khơng - một 푛 Với = 푖=1 푖 ~ ( ; 푛) nên = 푛 , = 푞 푛 푞, suy ra = = , = = 푛 푛 푛 Khi n lớn và p khơng quá nhỏ thì 푿 − 풑 푼 = 풏~푵( , ) 풑풒
  42. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp 2 biến ngẫu nhiên gốc tuân theo quy luận phân phối khơng - một Giả sử ta xét một lúc hai tổng thể. Ở tổng thể thứ nhất ta xét biến ngẫu nhiên gốc tuân theo quy luật khơng-một với 푃 = 1 = 1, 푃 = 0 = 1 − 1 = 푞1 ở tổng thể thứ hai ta xét biến ngẫu nhiên gốc 푌 tuân theo quy luật khơng-một với 푃 푌 = 1 = 2, 푃 = 0 = 1 − 2 = 푞2 Từ hai tổng thể nĩi trên rút ra hai mẫu ngẫu nhiên độc lập cĩ kích thước tương ứng 푛1 và 푛2: 푊 = ( 1, 2, , 푛1 ) 푊푌 = (푌1, 푌2, , 푌푛2 )
  43. V. Phân phối xác suất của một số thống kê đặc trưng. 2. Trường hợp 2 biến ngẫu nhiên gốc tuân theo quy luận phân phối khơng - một 1 푛1 1 푛2 Xét − 푌, với = 푖=1 푖 , 푌 = 푖=1 푌푖. Do 푛1 푛2 − 푌 = − 푌 = 1 − 2, − 푌 = + 푞 푞 푌 = 1 1 + 2 2 suy ra 푛1 푛2 푿 − 풀 − (풑 − 풑 ) 푼 = ~푵( , ) 풑 풒 풑 풒 + 풏 풏