Giáo trình Thống kê trong khoa học xã hội

pdf 110 trang huongle 2350
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Thống kê trong khoa học xã hội", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_thong_ke_trong_khoa_hoc_xa_hoi.pdf

Nội dung text: Giáo trình Thống kê trong khoa học xã hội

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC ĐỒNG THÁP ———————– THỐNG KÊ TRONG KHOA HỌC XÃ HỘI Dùng cho các lớp thuộc ngành xã hội ĐỒNG THÁP 2014-2015
  2. MỞ ĐẦU "Giáo trình Lý thuyết xác suất thống kê" là tài liệu được biên soạn cho các sinh viên ngành Khoa học Xã hội như: Công tác Xã hội, Việt Nam học, Thư viện Thông tin, Giáo dục Thể chất, Mục đích của bài giảng là trang bị cho các sinh viên kiến thức về thống kê trong khoa học xã hội từ đó nghiên cứu, thu thập và xử lý thông tin kinh tế - xã hội Bài giảng bao gồm 4 chương. Chương 1: Khái quát những khái niệm cơ bản về lý thuyết xác suất để làm nền tảng cho việc nhiên cứu phần thống kê. Bao gồm: xác suất cổ điển, xác suất theo quan điểm thống kê, tính chất của xác suất, các biến ngẫu nhiên, hàm phân phối và một số phân phối quan trọng. Chương 2: Mẫu ngẫu ngẫu nhiên và ước lượng tham số. Chương này mục đích đưa ra các khái niệm về mẫu ngẫu nhiên, các đặc trưng mẫu và các ước lượng tham số. Chương 3: Kiểm định giả thiết. Chương này trình bày một số bài toán kiểm định giả thiết như: kiểm định trung bình, kiểm định tỷ lệ, kiểm định phương sai, kiểm định tính độc lập, quy luật phân phối và các bài toán so sánh.Chương 4 trình bày về tương quan và hồi quy tuyến tính. Trong tất cả các chương đưa ra đều có những ví dụ minh họa cụ thể cho từng dạng bài toán, sau cuối của mỗi chương đều có hệ thống bài tập khá đa dạng và phong phú. Vì nhiều lý do, chắc chắn bài giảng không tránh khỏi những sai xót. Chúng tôi mong được sự đóng góp của đồng nghiệp và các bạn sinh viên. Tác giả 2
  3. MỤC LỤC Trang MỞ ĐẦU 2 MỤC LỤC 3 Chương 1. Các khái niệm cơ bản về xác suất 6 1.1. Bổ túc về giải tích tổ hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.1.1. Các nguyên lý cơ bản . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.1.2. Hoán vị 6 1.1.3. Chỉnh hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.1.4. Chỉnh hợp lặp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.1.5. Tổ hợp 7 1.1.6. Công thức nhị thức Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2. Phép thử ngẫu nhiên và biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2.1. Phép thử ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2.2. Biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8 1.2.3. Quan hệ và phép toán giữa các biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3. Các định nghĩa về xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.3.1. Định nghĩa xác suất theo cổ điển. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9 1.3.2. Định nghĩa xác suất theo tần suất và thống kê . . . . . . . . . . . . . . . . . . . . . . 9 1.3.3. Tính chất của xác suất. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10 1.4. Các công thức xác suất. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10 1.5. Biến ngẫu nhiên và hàm phân phối . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.5.1. Khái niệm biến ngẫu nhiên và hàm phân phối . . . . . . . . . . . . . . . . . . . . . 12 1.5.2. Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.5.3. Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.6. Các đặc trưng của biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.6.1. Kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.6.2. Phương sai. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17 1.6.3. Mod 17 1.6.4. Median . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.7. Một số phân phối thường gặp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.7.1. Phân phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
  4. 1.7.2. Phân phối Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.7.3. Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.7.4. Tính gần đúng phân phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.8. Véc tơ ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.8.1. Biến ngẫu nhiên rời rạc. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.8.2. Biến ngẫu nhiên liên tục. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.8.3. Các đặc trưng của véctơ ngẫu nhiên. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27 Bài tập chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30 Chương 2. Lý thuyết chọn mẫu và ước lượng tham số 37 2.1. Mẫu ngẫu nhiên và hàm phân phối . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.1.1. Mẫu ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.1.2. Hàm phân phối - Đa giác tần số và tổ chức đồ . . . . . . . . . . . . . . . . . . . .38 2.1.3. Mẫu ngẫu nhiên hai chiều. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41 2.1.4. Các đặc trưng mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.2. Ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.2.1. Ước lượng không chệch. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46 2.2.2. Ước lượng vững. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.2.3. Ước lượng hiệu quả . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2.2.4. Ước lượng hợp lý cực đại. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2.2.5. Ước lượng điểm cho kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49 2.2.6. Ước lượng điểm cho phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.2.4. Ước lượng điểm cho xác suất. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.3. Ước lượng khoảng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 2.3.1. Ước lượng khoảng đối với giá trị trung bình . . . . . . . . . . . . . . . . . . . . . . . . 50 2.3.2. Ước lượng khoảng đối với giá trị tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 2.3.3. Ước lượng khoảng đối với phương sai. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .57 Bài tập chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .58 Chương 3. Kiểm định giả thiết 65 3.1. Đặt vấn đề 65 3.2. Kiểm định giả thiết về giá trị trung bình . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 3.2.1. Trường hợp phương sai σ2 đã biết 66 3.2.2. Trường hợp phương sai σ2 chưa biết n ≥ 30 68 3.2.3. Trường hợp phương sai σ2 chưa biết n < 30 71 3.3. Kiểm định tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 4
  5. 3.3.1. Kiểm định hai phía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.3.2. Kiểm định một phía. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.4. Kiểm định phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 3.4.1. Trường hợp chưa biết µ 75 3.4.2. Trường hợp đã biết µ 76 3.5. Kiểm định về tính độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.6. Kiểm định giả thiết về luật phân phối . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.7. Bài toán so sánh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.7.1. Bài toán so sánh hai giá trị trung bình. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.7.2. Bài toán so sánh hai giá trị tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90 Bài tập chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92 Chương 4. Tương quan và hồi quy tuyến tính 99 4.1. Tương quan tuyến tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.1.1. Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.1.2. Tính chất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.1.3. Hệ số tương quan mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 4.1.4. Ý nghĩa của hệ số tương quan mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.2. Hồi quy tuyến tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 Bài tập chương 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 Các bảng số thông dụng 106 Tài liệu tham khảo 111 5
  6. Chương 1 Các khái niệm cơ bản về xác suất 1.1 Bổ túc về giải tích tổ hợp 1.1.1 Các nguyên lý đếm cơ bản a) Nguyên lý cộng Giả sử có k công việc, việc thứ nhất có n1 scách làm, việc thứ hai có n2 cách làm, , việc thứ k có nk cách làm, các công việc này không làm đồng thíi. Khi đó ta có n1 + n2 + + nk cách làm k công việc trổn. b) Nguyên lý nhân. Giả sử hành động H được thực hiện qua k giai đoạn liên tiếp H1,H2,H3, , Hk. Giai đoạn H1 có n1 cách làm, ,Hk có nk cách làm. Khi đó n1.n2 nk cách làm công việc H. 1.1.2 Hoán vị Định nghĩa 1.1.1. Cho tập M có n phần tử, mỗi cách sắp xếp n phần tử này theo một thứ tự nhất định gọi là một hoán vị của tập M. Gọi số các hoán vị của tập M là: Pn = n! = 1.2.3 (n − 1)n Ví dụ 1. a) Ta có 3 người A, B, C xếp vào 3 chỗ ngồi. Khi đó ta có 3! = 3.2.1 = 6 cách xếp như sau: ABC, ACB, BAC, BCA, CAB, CBA b) Số cách sắp xếp cho 80 sinh viên vào 80 chỗ ngồi là P80 = 80! 1.1.3 Chỉnh hợp Định nghĩa 1.1.2. Cho tập M có n phần tử, 0 ≤ k ≤ n, một chỉnh hợp chập k của n phần tử là một bộ sắp thứ tự (phân biệt) lấy từ n phần tử đã cho và được ký hiệu là n! Ak = n (n − k)! 6
  7. Ví dụ 2. a) Cho ba phần tử 2,3,5. Các chỉnh hợp chập 2 của ba phần tử đó là: 23, 25, 32, 35, 52, 53 b) Mỗi lớp phải học 6 môn, mỗi ngày học 2 môn. Hỏi có bao nhiêu cách xắp xếp thời khóa biểu cho mỗi ngày. HD: Vì mỗi cách xắp xếp thời khóa biểu trong một ngày là ghép 2 môn trong 6 môn. Các cách này do ít nhất 1 môn khác nhau hoặc chỉ do thứ tự sắp xếp trước sau giữa hai môn. Vì thế mỗi cách sắp xếp ứng với một chỉnh hợp chập 2 của 6. 2 A6 = 30 1.1.4 Chỉnh hợp lặp Định nghĩa 1.1.3. Chỉnh hợp lặp chập k của n phần tử là 1 nhóm thứ tự gồm k phần tử lấy từ n phần tử đã cho trong đó mỗi phần tử có thể có mặt 1,2, 3, k lần trong k k nhóm tạo thành. Ký hiệu An = n Ví dụ 3. a) Cho ba phần tử 2,3,5. Các chỉnh hợp lặp chập 2 của ba phần tử đó là: 22, 23, 25, 32, 33, 35, 52, 53, 55 b) Để đăng ký mỗi loại máy mới người ta dùng 3 con số trong 9 con số 1,2, 9. Hỏi có thể đánh số được bao nhiêu máy. k 3 Mỗi số của máy là chỉnh hợp lặp chập 3 của 9 số: An = 9 = 729 1.1.5 Tổ hợp Định nghĩa 1.1.4. Tổ hợp chập k của n phần tử, 0 ≤ k ≤ n là một tập con của k phần tử lấy từ n phần tử đã cho và được ký hiệu là Ak n! Ck = n = n k! k!(n − k)! Ví dụ 4. Có 10 đội bóng đá thi đấu với nhau theo thể thức vòng tròn một lượt. Hỏi có bao nhiêu trận đấu? HD: Ta thấy mỗi trận đấu giữa 2 đội đấu với nhau là 1 tổ hợp chập 2 của 10 phần tử 2 (Vì hai đội đấu với nhau không cần xếp thứ tự) C10 = 45 1.2 Phép thử ngẫu nhiên và biến cố 1.2.1 Phép thử ngẫu nhiên Phép thử ngẫu nhiên là một hành động mà ta chưa biết trước được kết quả của nó. Tuy chưa biết trước được kết quả của phép thử nhưng biết được tập tất cả các khả 7
  8. năng và ký hiệu là Ω và gọi là không gian biến cố sơ cấp. Mỗi ω ∈ Ω gọi là biến cố sơ cấp. Ta ký hiệu phép thử là G Ví dụ 5. a) Tung đồng tiền thì Ω = {S, N} b) Tung con xúc xắc: Ω = {1, 2, 3, 4, 5, 6} 1.2.2 Biến cố Khi thực hiện một phép thử có rất nhiều câu hỏi liên quan đến kết quả của nó. Một sự kiện liên quan đến phép thử mà việc nó xảy ra hay không xảy ra phụ thuộc hoàn toàn vào phép thử gọi là một biến cố ngẫu nhiên. Ký hiệu A, B, C, Biến cố sơ cấp ω gọi là thuận lợi cho biến A nếu khi kết quả của phép thử là ω thì A xảy ra Biến cố không thể là biến cố không thể xảy ra và ký hiệu là: ∅ Biến cố chắc chắn: là biến cố luôn xảy ra khi thực hiện phếp thử, ký hiệu là: Ω Ví dụ 6. Tung con xúc xắc ⇒ Ω = {1, 2, 3, 4, 5, 6} Biến cố xuất hiện mặt chấm lẻ là A ⇒ A = {1, 3, 5} Biến cố xuất hiện mặt chấm nhỏ hơn 5 là B: ⇒ B = {1, 2, 3, 4} 1.2.3 Quan hệ và phép toán giữa các biến cố. a. Quan hệ kéo theo Biến cố A gọi là kéo theo biến cố B nếu A xảy ra thì B xảy ra. Ký hiệu A ⊂ B b. Quan hệ bằng Hai biến cố A, B gọi là bằng nhau. Ký hiệu A=B nếu A ⊂ B, A ⊃ B c. Giao của hai biến cố Giao của haibiến cố là một biến cố xảy ra khi và chỉ khi A, B đồng thời xảy ra. Ký hiệu A ∩ B hoặc AB TQ: A1 ∩ A2 ∩ ∩ An là một biến cố xảy ra khi và chỉ khi với mọi Ai xảy ra. d. Hợp của hai biến cố Hợp của haibiến cố là một biến cố xảy ra khi và chỉ khi A hoặc B xảy ra. Ký hiệu A ∪ B TQ: A1 ∪ A2 ∪ ∪ An là một biến cố xảy ra khi và chỉ khi ít nhất một Ai xảy ra. e. Hiệu của hai biến cố. Hiệu của hai biến cố A và B ký hiệu là A \ B là một biến cố xảy ra khi và chỉ khi A xảy ra và B không xảy ra. g. Biến cố đối Biến cố đối của biến cố A là A, là biến cố xảy ra khi và chỉ khi A không xảy ra. h. Biến cố xung khắc Hai biến cố A và B là xung khắc nếu chúng không đồng thời xảy ra, tức là AB = ∅. Biến cố đối thì xung khắc. h. Nhóm đầy đủ các biến cố Nhóm n biến cố A1,A2, , An gọi là nhóm đầy đủ các biến cố nếu. 8
  9. i) Chúng xung khắc với nhau đôi một AiAj = ∅, (i 6= j) ii) Hợp của chúng là biến cố chắc chắn A1 ∪ A2 ∪ ∪ An = Ω Ví dụ 7. Hai xạ thủ mỗi người bắn một viên đạn vào đích. Gọi Ai là biến cố người thứ i trúng đích. Hãy viết biến cố sau qua A1,A2 a. Biến cố chỉ người thứ nhất trúng đích: A1A2 b Có 1 người bắn trúng đích: A1A2 ∪ A2A1 c. Có ít nhất một người bắn trúng đích: A1 ∪ A2 d. Không có ai bắn trúng: A1 A2 1.3 Các định nghĩa về xác suất 1.3.1 Định nghĩa xác suất theo cổ điển Giả sử không gian biến cố sơ cấp Ω của phép thử G có n kết quả đồng khả năng và có m kết quả thuận lợi cho biến cố A. Khi đó xác suất của biến cố A được ký hiệu và được định nghĩa là m P (A) = n Ví dụ 8. Một hộp có 16 quả cầu đen và 4 quả cầu đỏ lấy ngẫu nhiên 2 quả cầu. Hãy tính xác suất a) Lấy được hai quả cầu đen. b) Lấy được 1 quả cầu đen, một quả đỏ. HD: a) Gọi A là biến cố lấy được hai quả cầu đen. Khi đó 2 2 2 C16 n = C20, m = C16 ⇒ P (A) = 2 C20 b) Gọi B là biến cố lấy được 1 quả đen, 1 quả đỏ thì 1 1 C16C4 P (B) = 2 C20 Ví dụ 9. Một nhóm học tập có 10 hs, trong đó có 7 hs yếu. Kiểm tra ngẫu nhiên 3 em. Tính xác suất để: a) Ba em kiểm tra là học sinh yếu b) Trong 3 em được kiểm tra có 1 em yếu c) Có ít nhất 1 học sinh yếu được kiểm tra. 1.3.2 Định nghĩa xác suất theo tần suất và thống kê Một phép thử được thực hiện n lần mà có m biến cố A xuất hiện thì tỷ số m/n gọi là tần suất của biến cố A Khi n thay đổi, tần suất m/n cũng thay đổi nhưng nó luôn dao động quanh một số cố định nào đó, n càng lớn thì m/n càng gần số cố định đó. Số cố định này được gọi là 9
  10. xác suất của biến cố A theo nghĩa thống kê. Trên thực tế khi n đủ lớn ta xấp xỉ P (A) bởi m/n tức là m P (A) = n 1.3.3 Tính chất của xác suất 1) 0 ≤ P (A) ≤ 1,P (∅) = 0,P (Ω) = 1 2) P (A) = 1 − P (A). 3) Nếu A ⊂ B thì P (A) ≤ P (B) với P (B/A) = P (B) − P (A). 4) P (A ∪ B) = P (A) + P (B) − P (AB) Ví dụ 10. Một hộp cứa 5 cầu trắng, 3 cầu xanh và 4 cầu đen cùng kích thước, chọn ngẫu nhiên cùng lúc 3 cầu. Tìm xác suất để. a) Cả 3 cầu cùng mầu (A) b) Có đúng 2 cầu cùng mầu(B) c) Có ít nhất hai cầu cùng mầu(C) d) Cả 3 cầu khác mầu nhau(D) HD: a) Gọi A1 = { 3 quả cầu rút ra đều mầu trắng} A2 = { 3 quả cầu rút ra cùng mầu đen} A3 = { 3 quả cầu rút ra đều mầu xanh} Khi đó: A = A1 + A2 + A3 =⇒ P (A1) + P (A2) + P (A3 3 3 3 C5 + C3 + C4 3 =⇒ P (A) = 3 = C12 44 b) Gọi B1 = { 2 quả cầu rút ra cùng mầu trắng} B2 = { 2 quả cầu rút ra cùng mầu đen} B3 = { 2 quả cầu rút ra cùng mầu xanh} 2 1 2 1 2 1 C5 C7 + C4 C8 + C3 C9 29 =⇒ P (B) = P (B1) + P (B2) + P (B3) = 3 = C12 44 32 c) P (C) = P (A) + P (B = 44 d) Cách1: P (D) = 1 − P (C) Cách2: làm trực tiếp 1 1 1 C5 C3 C4 3 P (D) = 3 = C12 11 1.4 Dãy phép thử Bernoulli và công thức nhị thức Hai biến cố A và B gọi là độc lập với nhau nếu việc xảy ra biến cố này không ảnh hưởng đến khả năng xảy ra của biến cố khác Hai phép thử gọi là độc lập với nhau nếu việc thực hiện và kết quả của phép thử này không ảnh hưởng và không phụ thuộc vào phép thử kia 10
  11. Định nghĩa 1.4.1. Dãy n phép thử gọi là dãy n phép thử Bernoulli đối với biến cố A nếu thoả mãn các điều kiện sau: • Chúng là n phép thử lặp. • Các phép thử đó là độc lập. • Mỗi phép thử biến cố A xuất hiện với xác suất đều bằng p. Công thức nhị thức Xác suất để trong n phép thử Bernoulli biến cố A xuất hiện đúng k lần là: k k n−k k k n−k Pn(k) = Cnp (1 − p) = Cnp (q) = Pn(k, p) Công thức trên gọi là công thức xác suất nhị thức. Số khả năng nhất Giả sử G1,G2, , Gn là n phép thử Bernoulli, xác suất xuất hiện A k lần là k k n−k Pk = Cnp q , (0 ≤ k ≤ n) Khi đó số k0, (0 ≤ k0 ≤ n) được gọi là số có khả năng nhất nếu Pk0 = max Pk 0≤k0≤n trong đó k0 được tính theo công thức sau: ( np − q và np − q + 1 nếu np − q nguyên k0 = [p(n + 1)] nếu np − q không nguyên Ví dụ 11. Tung đồng tiền 5 lần. Tính xác suất để mặt sấp xuất hiện k lần. 1 HD: Đây là 5 phép thử Bernoulli đối với biến cố A xuất hiện mặt sấp với p = 2 . • Xác suất biến cố A xuất hiện 0 lần là: 1 1 1 P (0) = C0( )0( )5 = 5 5 2 2 32 • Xác suất để A xuất hiện 1, 2, 3, 4, 5 lần 1 1 5 1 1 10 P (1) = C1( )1( )4 = ; P (2) = C2( )2( )3 = 5 5 2 2 32 5 5 2 2 32 1 1 10 1 1 5 P (3) = C3( )3( )2 = ; P (4) = C4( )4( )1 = 5 5 2 2 32 5 5 2 2 32 1 1 1 P (5) = C5( )5( )0 = 5 5 2 2 32 Ta thấy k = 2 hoặc k = 3 thì P5(k) lớn nhất và ta nói 2, 3 là số có khả năng nhất. 11
  12. Ví dụ 12. Kết quả điều tra về bệnh lao, tỷ lệ người bị lao ở vùng nọ là 0, 001. Tìm xác suất để khi khám cho 10 người. a. Không có ai bị lao. b. 5 người bị lao. c. Ít nhất một người bị lao. d. Số người không bị lao có khả năng nhất. HD: Ta có 10 phép thử Bernoulli, với biến cố A là " người được khám bị lao" suy ra P (A) = 0.001 a. P10(n, p) = P10(0, 0.001) 0 0 10 10 = C10(0.001) (1 − 0.001) = (0.999) b. 5 5 5 P10(5, 0.001) = C10(0.001) (0.999) c. 10 X 10 k 10−k P10(k ≥ 1, 0.001) = Ck (0.001) (0.999) k=1 10 = 1 − P10(0, 0.001) = 1 − (0.999) d. Ta có q = 1 − p = 1 − 0.001 = 0.999 mà q(1 + n) = 11.0, 999 = 10, 989 không phải là số nguyên do đó số người không bi bệnh lao có khả năng cao nhất là 10. 1.5 Biến ngẫu nhiên và hàm phân phối 1.5.1 Khái niện biến ngẫu nhiên và hàm phân phối Khái niệm biến ngẫu nhiên Một đại lượng mà giá trị của nó là ngẫu nhiên, không dự đoán trước được gọi là một đại lượng ngẫu nhiên (biến ngẫu nhiên) và ký hiệu bằng chữ X, Y, Z, Hoặc một đại lượng ngẫu nhiên nhận các giá trị của nó với xác suất tương ứng nào đó gọi là đại lượng ngẫu nhiên hay là biến ngẫu nhiên Có hai loại biến ngẫu nhiên chính đó là: Biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục Hàm phân phối xác suất Hàm phân phối xác suất của biến ngẫu nhiên X được ký hiệu và xác định như sau: FX (x) = P [X < x]; x ∈ R • Nếu biến ngẫu nhiên rời rạc thì X FX (x) = P (X < x) = pi xi<x 12
  13. • Nếu biến ngẫu nhiên liên tục thì Z x FX (x) = p(t)dt −∞ 1.5.2 Biến ngẫu nhiên rời rạc Định nghĩa 1.5.1. Biến ngẫu nhiên X được gọi là rời rạc nếu tập giá trị của nó là hữu hạn hoặc đếm được. Bảng phân phối xác suất Giả sử X là biến ngẫu nhiên rời rạc nhận các giá trị x1, , xn, Khi đó pi = P (X = xi) thì bảng sau gọi là bảng phân phối xác suất của X. X x1 x2 xn P p1 p2 pn X Chú ý: pi = 1 i Hàm phân phối xác suất  0 nếu x ≤ x1  p nếu x xn Tính chất của hàm phân phối Giả sử F (x) là hàm phân phối của biến ngẫu nhiên X i) F (x) là hàm không giảm tức nếu x1 < x2 thì F (x1) ≤ F (x2) ii) P (a ≤ X < b) = F (b) − F (a) iii) F (−∞) = lim F (x) = 0,F (+∞) = lim F (x) = 1 x→−∞ x→+∞ iv) F (x) liên tục trái lim F (x) = F (x0) − x→x0 v) P (X ≤ x) = F (x + 0) ⇒ P (X = x) = F (x + 0) − F (x) Ví dụ 13. Một xí nghiệp có hai ô tô vận tải. Xác suất bị hỏng trong thời gian t của hai ô tô tương ứng là: 0, 1; 0, 2. Gọi X là số ô tô bị hỏng trong thời gian t. Hãy lập bảng phân phối xác suất và tính hàm phân phối xác suất của X. HD: 13
  14. Gọi Ai là biến cố ô tô thứ i hỏng (i=1, 2). Khi đó ta có X nhận 3 giá trị:0, 1, 2. P (X = 0) = P (A1 A2) = P (A1)P (A2) = 0, 9.0, 8 = 0, 72 P (X = 1) = P (A1A2 + A1A2) = P (A1A2) + P (A1A2) = P (A1)P (A2) + P (A1)P (A2) = 0, 1.0, 8 + 0, 9.0, 2 = 0, 26 P (X = 2) = P (A1A2) = 0, 1.0, 2 = 0, 02 Ta có bảng phân phối xác suất của X là X 0 1 2 P 0, 72 0, 26 0, 02 Hàm phân phối là: 0 nếu x ≤ 0  0, 72 nếu 0 2 Ví dụ 14. Chọn ngẫu nhiên 3 đứa trẻ từ 1 nhóm gồm 6 bé trai và 4 bé gái. Gọi X là số bé gái trong nhóm. Lập bảng phân phối xác suất của X. HD: X nhận các giá trị 0, 1, 2, 3. Khi đó ta có 3 C6 5 P {X = 0} = 3 = C10 30 1 2 C4 C6 15 P {X = 1} = 3 = C10 30 2 1 C4 C6 9 P {X = 2} = 3 = C10 30 3 C4 1 P {X = 2} = 3 = C10 30 Từ đó suy ra bảng phân phối hàm phân phối. 1.5.3 Biến ngẫu nhiên liên tục Định nghĩa 1.5.2. Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu: i) FX (x) là hàm liên tục. ii) Tồn tại hàm số p(x) ≥ 0, ∀x ∈ R sao cho Z x FX (x) = p(t)dt x ∈ R −∞ 14
  15. p(x) được gọi là hàm mật độ xác suất. Tính chất hàm mật độ R +∞ i) −∞ p(x)dx = 1 R b ii) P (a ≤ X π/2 → F (x) = −∞ p(x)dx + 0 p(x)dx + π/2 p(x)dx = 1 Vậy  0 nếu x ≤ 0  F (x) = 1 − cosx nếu 0 π/2 Ví dụ 16. cho biến ngẫu nhiên có hàm phân phối F (x) = 1/2 + 1/πarctgx a) Tính xác suất của biến cố {0 < x < 1} b) Tìm hàm mật độ của X. HD: a) Ta có: P (0 < x < 1) = P (0 ≤ x < 1) − P (x = 0) = P (0 ≤ x < 1) = F (1) − F (0) = 1/π(arctg1 − arctg0) = 1/π(π/4 − 0) = 1/4 0 1 b) Ta có hàm mật độ: p(x) = F (x) = π(x2+1) 15
  16. Ví dụ 17. Cho X là biến ngẫu nhiên có hàm mật độ p(x) như sau:  1 + x nếu x ∈ [−1, 0)  p(x) = 1 − x nếu x ∈ [0, 1) 0 nếu |x| > 1 1 Tính P {− 2 < X < 1}), tìm hàm phân phối F (x) 1.6 Các đặc trưng của biến ngẫu nhiên 1.6.1 Kỳ vọng Định nghĩa 1.6.1. Kỳ vọng của biến ngẫu nhiên X được ký hiệu EX và xác định bởi: • Nếu X là biến ngẫu nhiên rời rạc có bảng phân phối xác suất X x1 x2 xn P p1 p2 pn X thì EX = xipi i • Nếu X liên tục với hàm mật độ xác suất p(x) thì Z +∞ EX = xp(x)dx −∞ Tính chất của kỳ vọng. a) EC = C;(c = const) b) E(X ± Y ) = EX ± EY , (nếu hai vế có nghĩa) c) E(aX) = aEX; a là hằng số. d) EXY = EXEY ; nếu X, Y độc lập. Ý nghĩa của kỳ vọng Kỳ vọng của một biến ngẫu nhiên là giá trị trung bình theo xác suất, nếu đối với hệ cơ học thì kỳ vọng là trọng tâm của hệ, nếu nó nhận xác suất như nhau thì kỳ vọng chính là trung bình số học. Ví dụ 18. Cho X có bảng phân phối xác suất X x1 x2 xn 1 1 1 P n n n Khi đó x + x + + x EX = 1 2 n n 16
  17. Ví dụ 19. Cho X liên tục có hàm mật độ ( 0 nếu x∈ / [a, b] p(x) = 1 b−a nếu x ∈ [a, b] Khi đó Z +∞ Z b 2 1 1 x b a + b EX = xp(x)dx = EX = x dx = |a= −∞ a b − a b − a 2 2 1.6.2 Phương sai Định nghĩa 1.6.2. Phương sai của biến ngẫu nhiên X ký hiệu là DX được xác định DX = E(X − EX)2 X (x − EX)2p nếu X rời rạc và có bảng phân phối  i i  i DX = Z +∞  2  (x − EX) f(x)dx nếu X liên tục có hàm mật độ f(x) −∞ Tính chất của phương sai • DX = EX2 − (EX)2 •D(aX) = a2DX, (a=const) •D(X + a) = DX •D(X ± Y ) = DX + DY , nếu X, Y độc lập. • DX ≥ 0 Ý nghĩa của phương sai Phương sai của biến ngẫu nhiên là độ lệch trung bình của X xung quanh gia trị kỳ vọng EX nếu DX bé thì giá trị của X tập trung xung quanh kỳ vọng, ngược lại DX lớn thì giá trị của X phân tán xung quanh kỳ vọng 1.6.3 Mod Mốt là giá trị của biến ngẫu nhiên X, ký hiệu là xmod mà tại đó hàm mật độ f(x) đạt cực đại, trường hợp X là biến ngẫu nhiên rời rạc, xmod là giá trị, mà xác suất để X = xmod. 1.6.4 Median Trung vị (Međian) là giá trị của biến ngẫu nhiên X, ký hiệu xMe hoặc m(X), mà tại đó • Nếu X là rời rạc thì F (xi) ≤ 1/2 ≤ F (xi+1) ⇒ m(X) = xi 1 1 • Nếu X là liên thục thì F (xMe) = 2 hoặc F [m(X)] = 2 17
  18. 1.7 Một số phân phối thường gặp 1.7.1 Phân phối nhị thức Định nghĩa 1.7.1. Biến ngẫu nhiên X gọi là phân phối nhị thức với tham số n, p ký hiệu X ∼ B(n, p) nếu X nhận các giá trị 0, 1, , n với xác suất k k n−k Pk = P (X = k) = Cnp q Các số đặc trưng. Nếu X ∼ B(n, p) thì EX = np, DX = npq, (n + 1)p − 1 ≤ ModX ≤ (n + 1)p Ví dụ 20. Tỷ lệ phế phẩm của một loại sản phẩm là 1% , người ta lấy ngẫu nhiên có hoàn lại 100 sản phẩm để kiểm tra. 1. Tính xác suất có 2 sản phẩm 2. Hỏi trung bình có bao nhiêu sản phẩm 3. Khả năng có bao nhiêu sản phẩm(Mod) Có 2-5 sản phẩm HD 1. Gọi X là số sản phẩm suy ra X ∼ (100; 0, 01) 2 2 9 P [X = 2] = C100(0.01) (0, 99) 98 2. EX = np = 0, 01 × 100 3. np − q ≤ ModX ≤ np + q ⇒ 0, 01 × 100 − 0, 99 ≤ ModX ≤ 0, 01 × 100 + 0, 99 ⇒ ModX = (∈ Z) 4. P [2 ≤ X ≤ 5] = P [X = 2] + P [X = 3] + P [X = 4] + P [X = 5] 1.7.2 Phân phối Poisson Định nghĩa 1.7.2. Biến ngẫu nhiên X gọi là có phân phối theo quy luật Poisson với tham số λ > 0. Ký hiệu X ∼ f(λ), nếu X nhận các giá trị 0, 1, với xác suất tương ứng λk P (X = k) = e−λ k! Tức là ta có bảng: X 0 k n −λ −λ λk −λ λn P e e k! e n! 18
  19. k X λi Chú ý: Ta có bảng tính sẵn P (X ≤ k) = e−λ i! i=0 Các đặc trưng Nếu X ∼ f(λ) thì EX = DX = λ; ModX = [λ] Ví dụ 21. Một ga ra cho thuê ô tô, thấy rằng số người đến thuê ô tô vào ngầy thứ 7 là một biến ngẫu nhiên có phân phối Poisson với tham số λ = 2. Giả sử ga ra có 4 chiếc ô tô. Hãy tính xác suất. a) Không phải cả 4 chiếc đều được thuê. b) Tất cả 4 ô tô đều được thuê c) Ga ra không đáp ứng được nhu cầu d) Trung bình có bao nhiêu ô tô được thuê? 1.7.3 Phân phối chuẩn a) Phân phối chuẩn tắc Định nghĩa 1.7.3. Biến ngẫu nhiên X gọi là có phân phối chuẩn tắc, ký hiệu X ∼ N(0, 1) nếu X có hàm mật độ 2 1 − x ϕ(x) = √ e 2 , (x ∈ R) 2π Đặc trưng Nếu X ∼ N(0, 1) thì EX = 0, DX = 1 Hàm phân phối chuẩn tắc của X được ký hiệu là: Z x Z x 2 1 − t φ(x) = ϕ(t)dt = √ e 2 dt −∞ 2π −∞ Chú ý i) φ(−x) = 1 − φ(x) ii) φ(x > 3, 9) = 1 b) Phân phối chuẩn Định nghĩa 1.7.4. Biến ngẫu nhiên gọi là có phân phối chuẩn với tham số (µ, σ2), ký 2 X−µ hiệu là X ∼ N(µ, σ ), nếu σ có phân phối chuẩn tắc. Đặc trưng: Nếu X ∼ N(µ, σ2) thì EX = µ, DX = σ2 Xác suất để biến ngẫu nhiên có phân phối chuẩn nhận giá trị trong một đoạn. Nếu X ∼ N(µ, σ2). Khi đó 19
  20. a − µ X − µ b − µ P (a 30; np > 5) Ta có thể tính xấp xỉ phân phối nhị thức B(n, p) bằng phân phối chuẩn N(µ; σ2) với µ = np, σ2 = npq. Cụ thể là: (x−np) k k n−k √ 1 √ • pk = p(X = k) = Cnp q ≈ npq ϕ(z) với z = npq b−µ a−µ • p(a ≤ X 75 b)Số lần xảy ra A không quá 74 c) số lần xảy ra A trong khoảng 75-90. HD Gọi X là số lần xảy ra A: X ∼ B(100, 0, 8) a) Ta có µ = 0, 8.100 = 80; σ2 = 0, 2.0, 8.100 = 16 ⇒ σ = 4. Khi đó P [X > 75] = P [75 < X < 100] = φ(5) − φ(−1, 25) = φ(5) − 1 + φ(1, 25) = 0, 8944 b) 74 − 80 0 − 80 P [0 ≤ X ≤ 74] = φ[ ] − φ[ ] 4 4 c) 90 − 80 75 − 80 P [75 ≤ X ≤ 90] = φ[ ] − φ[ ] 4 4 Ví dụ 23. Chiều cao của của một loại cây lấy gỗ là biến ngẫu nhiên có phân phối chuẩn với chiều cao trung bình là 20m, độ lệch chuẩn là 2,5m. Cây đạt tiêu chuẩn khai thác là cây có chiều cao tối thiểu 15m. Hãy tính tỷ lệ cây đạt tiêu chuẩn khai thác, nếu cây đạt tiêu chuẩn sẽ lãi 10000 đồng, ngược lại cây không đạt tiêu chuẩn lỗ 50.000 đồng. Người ta khai thác một lô 100 cây, tính tiền lãi trung bình cho lô cây đó. 20
  21. HD Ta có µ = 20m, σ = 2, 5m. Gọi X là cây đạt tiêu chuẩn: X ∼ N(20, 2, 52) Tỷ lệ cây đạt tiêu chuẩn P [≥ 15] = φ(2) = 0, 9772 Gọi Y là tiền lãi khai thác/cây Y = {−50000; 10000} Y -50000 10000 P 0, 0228 0, 9772 Tiền lãi trung bình khai thác/cây EY = 8632d Tiền lãi trung bình khai thác lô cây 8632 × 100 = 863200d Ví dụ 24. Lãi suất (%) đầu tư vào một dự án là BNN có phân phối chuẩn. Theo đánh giá giới đầu tư với xác suất là 0,1587 cho lãi suất cao hơn 20% và với xác suất 0,0228 cho lãi suất cao hơn 25%. Vậy khả năng đầu tư để không bị lỗ là bao nhiêu? HD Gọi X là lãi suất đầu tư vào dự án +∞ − µ 20 − µ P [X > 20] = φ[ ] − φ[ ] σ σ 20 − µ = 1 − φ[ ] = 0, 1587 (1) σ +∞ − µ 25 − µ P [X > 25] = φ[ ] − φ[ ] σ σ 25 − µ = 1 − φ[ ] = 0, 0228 (2) σ Khi đó ta có ( 20−µ ( 20−µ φ[ σ ] = 0, 8413 = φ(1) (1) σ = 1 (1) 25−µ ⇔ 25−µ φ[ σ ] = 0, 9772 = φ(2) (2) σ = 2 (2) Suy ra µ = 15; σ = 5 ⇒ N(15; 52) Do đó P [X > 0] = φ(3) = 0, 9987 Ví dụ 25. Một ngân hàng dự định áp dụng 1 trong 2 phương án liên doanh đầu tư vào 1 công ty lợi nhuận thu được từ 2 phương án là BNN co pp chuẩn(đơn vị triệu đồng/tháng), ước tính lợi nhuận trung bình mỗi tháng của hai phương án thứ tự la 140, 180 và độ lêch chuẩn là 40 và 60. 21
  22. Biết rằng để phát triển liên doanh thì lợi nhuận phải đạt ít nhất 80 triệu đ/tháng. Hãy cho biết nên chọn phương án đầu tư nào? HD Gọi X là lợi nhuận từ phương án I, suy ra X ∼ N(140, 402) Gọi Y là lợi nhuận từ phương án II, suy ra Y ∼ N(180, 602) P [X ≥ 80] = φ(1, 5) = 0, 9332 P [Y ≥ 80] = φ(1, 67) = 0, 9515 Vậy nên chọn phương án II 1.8 Véc tơ ngẫu nhiên Định nghĩa 1.8.1. Cho không gian xác suất (Ω, F,P ), ánh xạ đo dược X :Ω → (Rn,Bn) gọi là biến ngẫu nhiên n chiều hay véc tơ ngẫu nhiên n chiều. Phân loại biến ngẫu nhiên n chiều. Biến ngẫu nhiên X = (X1, , Xn) gọi là rời rạc nếu tất cả các Xi rời rạc. Gọi là liên tục nếu tất cả các Xi liên tục. Gọi là hỗn hợp nếu có cả thành phần liên tục và cả thành phần rời rạc. Ta hạn chế xét biến ngẫu nhiên n chiều liên tục hoặc rời rạc, chỉ xét n = 2. 1.8.1 Biến ngẫu nhiên rời rạc 2 chiều a) Bảng phân phối xác suất của biến ngẫu nhiên 2 chiều. Cho (X, Y ) là biến ngẫu nhiên 2 chiều rời rạc, trong đó X = {x1, x2, , xn, } Y = {y1, y2, , ym, } pij = P (X = xi,Y = yj). Khi đó có bảng sau đây gọi là bảng phân phối xác suất của biến ngẫu nhiên 2 chiều (X, Y ). Y X x1 x2 xn y1 p11 p21 pn1 ym p1m p2m pnm b) Chú ý: X i) pij = 1 ij ii) Nếu từ bảng phân phối xác suất của (X, Y ) ta suy ra được bảng phân phối xác suất của X và Y. 22
  23. Thật vậy: X P (X = xi) = pij cộng theo cột j X P (X = yj) = pij cộng theo hàng i iii) Nói chung tư bảng phân phối xác suất của X và Y không suy ra được bảng phân phối xác suất của (X, Y ). Chỉ ra được trong trường hợp X và Y độc lập vì: nếu X, Y độc lập thì pij = p(X = xi,Y = yj) = p(X = xi)p(Y = yj) = piqj Ví dụ 26. Một hộp có 2 bi đỏ, 3 bị xanh, 2 bi trắng. Lấy ngẫu nhiên 2 viên bi, gọi X là số bi đỏ lấy ra, Y là số bi xanh lấy ra. Tìm bảng phân phối xác suất của (X, Y ). HD Ta có X, Y nhận 3 giá trị 0, 1, 2 Y X 0 1 2 1 4 1 0 21 21 21 6 6 1 21 21 0 3 2 21 0 0 Vì: 2 C2 1 P (X = 0,Y = 0) = P (lấy được 2 bi trắng) = 2 = C7 21 1 1 C2 C3 6 P (X = 0,Y = 1) = P (lấy 1 trắng 1 xanh) = 2 = C7 21 2 C3 3 P (X = 0,Y = 2) = P (lấy được 2 bi xanh) = 2 = C7 21 1 1 C2 C2 4 P (X = 1,Y = 0) = P (lấy 1 đỏ 1 trắng) = 2 = C7 21 1 1 C2 C3 6 P (X = 1,Y = 1) = P (lấy 1 đỏ 1 xanh) = 2 = C7 21 Ta có bảng phân phối xác suất của X là: X 0 1 2 10 10 1 P 21 21 21 Ta có bảng phân phối xác suất của Y là: Y 0 1 2 6 12 3 P 21 21 21 23
  24. 1.8.2 Biến ngẫu nhiên liên tục 2 chiều a) Hàm mật độ của biến ngẫu nhiên liên tục 2 chiều. Giả sử (X, Y ) là biến ngẫu nhiên liên tục 2 chiều. Hàm 2 biến f(x, y) ≥ 0 gọi là hàm mật độ xác suất của (X, Y ) ham hàm mật độ đồng thời của X và Y, nếu thoả mãn Z x Z y P (X < x, Y < y) = f(u, v)dudv −∞ −∞ b) Chú ý: Z +∞ Z +∞ i) f(x, y)dxdy = 1 −∞ −∞ ii) Từ hàm mật độ của (X, Y) ta suy ra được hàm mật độ của X và Y. Thật vậy: Ta có P (X < x) = P (X < x, Y < +∞) Z x Z +∞ = f(u, v)dudv −∞ −∞ Z x  Z +∞  = f(u, v)dv du −∞ −∞ Đặt Z +∞ fX (x) = f(x, y)dy −∞ thì Z x P (X < x) = fX (u)du −∞ Vậy hàm mật độ của X là Z +∞ fX (x) = f(x, y)dy −∞ Tương tự hàm mật độ cảu Y là Z +∞ fY (y) = f(x, y)dx −∞ iii) Nói chung hàm mật độ của X và Y không suy ra được hàm mật độ của (X, Y), chỉ đúng khi X, Y độc lập và ta có X, Y độc lập khi và chỉ khi f(x, y) = fX (x)fY (y) Ví dụ 27. Cho véc tơ ngẫu nhiên (X, Y) có hàm mật độ: ( C(x2 + 1 xy) nếu 0 < x < 1, 0 < y < 2 f(x, y) = 2 0 nếu ngược lại 24
  25. Tính C, fX (x), fY (y). HD Z +∞ Z +∞ Z 1 Z 2 1 Ta có f(x, y)dxdy = 1 ⇔ C(x2 + xy)dxdy = 1. −∞ −∞ 0 0 2 Từ đó suy ra 6 C = 7 Hàm mật độ của X là: Z +∞ ( R 2 2 1 C 0 (x + 2 xy)dy nếu 0 < x < 1, fX (x) = f(x, y)dy = −∞ 0 nếu x∈ / (0, 1) ( 6 (2x2 + x) nếu x ∈ (0, 1), = 7 0 nếu x∈ / (0, 1) Tương tự ta cũng có hàm mật độ của Y là: Z +∞ ( R 1 2 1 C 0 (x + 2 xy)dx nếu y ∈ (0, 2), fY (x) = f(x, y)dx = −∞ 0 nếu y∈ / (0, 2) ( 6 ( 1 + y ) nếu y ∈ (0, 2), = 7 3 4 0 nếu y∈ / (0, 2) c) Hàm phân phối của véc tơ ngẫu nhiên. Định nghĩa 1.8.2. Hàm số F(x, y) thoả mãn X X F (x, y) = P (X < x, Y < y) = pij xi<x yj <y gọi là hàm phân phối của véc tơ ngẫu nhiên (X, Y) hay gọi là hàm phân phối đồng thời của X và Y. Tính chất: Gọi F, FX ,FY là hàm phân phối của (X, Y), X, Y tương ứng. Khi đó ta có tính chất sau: i) F(x,y) không giảm theo từng đối số. ii) F (+∞, +∞) = 1,F (−∞, y) = F (x, −∞) = 0 iii) F (x, +∞) = lim F (x, y) = FX (x) = P {X < x} y→+∞ F (+∞, y) = lim F (x, y) = FY (y) = P {Y < y} y→+∞ 25
  26. iv) F (x1 0, y > 0 F (x, y) = 0 nếu ngược lại 1. Tìm hàm mật độ đồng thời của (X, Y) 2. Tìm hàm phân phối của X, của Y 3. Tính xác suất P [0 ≤ X 0, y > 0 = ∂x 0 nếu ngược lại ( ∂F (x, y) e−(x+y) nếu x > 0, y > 0 p(x, y) = = ∂x∂y 0 nếu ngược lại 2. Hàm phân phối của X là: ( 1 − e−x nếu x > 0 FX (x) = lim F (x, y) = y→+∞ 0 nếu x ≤ 0 Hàm phân phối của Y là: ( 1 − e−y nếu y > 0 FY (y) = lim F (x, y) = x→+∞ 0 nếu y ≤ 0 3. Z 2 Z 2 Z 2 Z 2 P [0 ≤ X < 2; 0 ≤ Y < 2] = p(x, y)dxdy = e−(x+y)dxdy 0 0 0 0 Z 2  Z 2  Z 2 = e−x e−ydy dx = e−x(1 − e−2)dx 0 0 0 Z 2 = (1 − e−2) e−xdx = (1 − e−2)2 0 26
  27. 1.8.3 Các đặc trưng của véctơ ngẫu nhiên a) Véc tơ kỳ vọng. Cho véc tơ ngẫu nhiên n chiều (X1, , Xn) khi đó véc tơ (EX1, EX2, , EXn) gọi là véc tơ kỳ vọng của (X1, , Xn). b) Moment tương quan(Covarian). Cho véc tơ ngẫu nhiên X = (X1, , Xn) Đặt λij = Cov(Xi,Xj) = E(Xi − EXi)(Xj − EXj) gọi là mô men tương quan của Xi và Xj. Ta có E(Xi − EXi)(Xj − EXj) = EXiXj − EXiEXj Nếu Xi,Xj độc lập thì Cov(Xi,Xj) = 0 . Điều ngược lại luôn không đúng. Ma trận   λ11 λ12 . . . λ1n  λ λ . . . λ   21 22 2n  A =  . . .  = (λij).  . . .  λm1 λm2 . . . λmn gọi là ma trận tương quan của (X1, , Xn). trong đó 2 λij = E(Xi − EXi)(Xj − EXj); λii = E(Xi − EXi) = DXi Chú ý: Ma trận A là ma trận đối xứng và xác định dương. Thật vậy: Đối xứng: λij = EXiXj − EXiXj = EXjXi − EXjEXi = λji Xác đinh dương: n X 2 0 ≤ E( (Xi − EXi)xi) i=1 n X = E( (Xi − EXi)xi(Xj − EXj)xj) i,j=1 n X = (Xi − EXi)(Xj − EXj)xixj i,j=1 n X = λijxixj i,j=1 Suy ra A là xác đinh dương. c) Hệ số tương quan. • Định nghĩa: Hệ số tương quan giữa X và Y được xác định Cov(X, Y ) ρ(X, Y ) = √ DXDY 27
  28. • Tính chất của hệ số tương quan. i) Hệ số tương quan |ρ(X, Y )| ≤ 1 ii) Nếu X, Y độc lập thì ρ(X, Y ) = 0 iii) Nếu |ρ(X, Y )| = 1 thì X, Y phụ thuộc tuyến tính, tức là ∃a2 + b2 6= 0, c là hằng số: aX + bY + c = 0 iv) D(X + Y ) = DX + DY ⇔ ρ(X, Y ) = 0 Chứng minh(xem tai liệu) • Ý nghĩa của hệ số tương quan Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa X và Y. ρ(X, Y ) càng gần 1 thì mối quan hệ tuyến tính càng chặt ρ(X, Y ) khá gần 0 thì mối quan hệ tuyến tính càng ít ρ(X, Y ) = 0 thì X, Y không tương quan. Chú ý: + Nếu X, Y rời rạc thì n n X X EXY = xiyjpij i=1 j=1 + Nếu X, Y liên tục thì Z −∞ Z −∞ EXY = xyf(x, y)dxdy −∞ −∞ • Một số ví dụ: Ví dụ 29. Giả sử X, Y là hai biến ngẫu nhiên rời rạc có cùng phân phối đồng thời Y \ X 2 5 8 0,4 0,15 0,3 0,35 0,8 0,05 0,12 0,03 1. Tìm kỳ vọng và phương sai của X và của Y. 2. Tính ma trận tương quan của X, Y. 3. Tìm hệ số tương quan của X, Y. HD: 1)+ Phân phối xác suất của biến X là X 2 5 8 P 0,2 0,42 0,38 + Phân phối của biến ngẫu nhiên Y là: X 0,4 0,8 P 0,8 0,2 28
  29. + Kỳ vọng của biến ngẫu nhiên X là: E(X) = 2 × 0, 2 + 0, 42 × 5 + 8 × 0, 38 = 5, 54 + Kỳ vọng của biến ngẫu nhiên Y là: E(Y ) = 0, 4 × 0, 8 + 0, 8 × 0, 2 = 0, 48 Tương tự ta cũng tìm được DX = 4, 9084; DY = 0, 0256 2) Ma trận tương quan λ λ  D = 11 12 λ21 λ22 trong đó λ11 = DX; λ22 = DY λ12 = λ21 = E(XY ) − (EX)(EY ) và E(XY ) = 2 × 0, 4 × 0, 15 + + 8 × 0, 8 × 0, 03 = 2, 592 vậy λ12 = λ21 = −0, 0672. Do đó ma trận tương quan là  4, 9084 −0, 0672 D = −0, 0672 0, 0256 3) Hệ số tương quan. Cov(X, Y ) E(XY ) − (EX)(EY ) ρ(X, Y ) = √ = √ = −0, 1895 DXDY DXDY 29
  30. BÀI TẬP CHƯƠNG I. Bài tập 1. Gieo đồng thời hai con xúc sắc. Tính xác suất để: a) Tổng số nốt xuất hiện trên hai con là 7. b) Tổng số nốt xuất hiện trên hai con là 8. Bài tập 2. Một khách sạn có 6 phòng đơn. Có 10 khách đến thuê phòng, trong đó có 6 nam, 4 nữ. Người quản lý chọn ngẫu nhiên 6 người. Tính xác suất để: a) Cả 6 người đều là nam. b) Có 4 nam và 2 nữ. c) Có ít nhất 2 nữ. Bài tập 3. Một chiếc hộp đựng 6 quả cầu trắng, 4 cầu đỏ và 2 quả cầu đen. Chọn ngẫu nhiên 6 quả cầu. Tìm xác suất để tìm được 3 quả trắng, 2 quả đỏ, 1 quả đen. Bài tập 4. Có 30 tấm thẻ đánh số từ 1 đến 30. Chọn ngẫu nhiên ra 10 tấm thẻ. Tính xác suất để: a) Tất cả 10 tấm thẻ đều mang số chẵn. b) Có đúng 5 số chia hết cho 3. c) Có 5 tấm thẻ mang số lẻ, 5 tấm thẻ mang số chẵn trong đó chỉ có 1 số chia hết cho 10. Bài tập 5. Một hòm có 9 tấm thẻ đánh số từ 1 đến 9. Chọn ngẫu nhiên ra hai tấm thẻ. Tính xác suất để tích của hai số trên tấm thẻ là một số chẵn. Bài tập 6. Ta kiểm tra lần lượt 10 sản phẩ. Mỗi sản phẩm thuộc 1 trong 2 loại: Chính phẩm hoạc hoặc phế phẩm. Ký hiệu Ak = sản phảm kiểm tra thứ k là chính phẩm, k = 1, 10. Hãy biểu diễn qua Ak các biến cố sau: a. Cả 10 sản phẩm đều là chính phẩm . b. Có ít nhất một sản phẩm là phế phẩm. c. Các sản phẩm kiểm tra theo thúe tự chẵn là chính phẩm. d. Có 1 phế phẩm và 9 chính phẩm. e. Có 2 phế phẩm và 8 chính phẩm (chỉ ra 1 biến cố đại diện và số các biến cố dạng như thế) Bài tập 7. Ba người cùng bắn vào bia, mỗi người bắn 1 viên. Ai = Người thứ i bắn trúng bia. Hãy biểu diễn các biến cố sau qua A1,A2,A3: a. Chỉ có người thứ nhất bắn trúng. b. Có ít nhất một người bắn trúng. c. Cả 3 người cùng bắn trúng. d. Người đầu bắn trúng, người thứ 3 bắn trượt. e. Có đúng 1 người bắn trúng. g. Có đúng 2 người bắn trúng. h. Có ít nhất 2 người bắn trúng. i. Không có ai bắn trúng. k. Có không quá 2 người bắn trúng. Bài tập 8. Một lô hàng gồm 100 sản phẩm, trong đó có 10 phế phẩm. Lấy ngẫu nhien ra 20 sản phẩm. Tìm xác suất để cho trong 20 sản phẩm lấy ra: a. Có 5 phế phẩm. b. Bị cả 10 phế phẩm. c. Có đúng 5 chính phẩm. 30
  31. Bài tập 9. Lớp học môn xác suất gồm 70 sinh viên trong đó có 25 nữ. Chọn ngẫu nhiên ra một nhóm gồm 10 sinh viên. Tìm xác suất để trong nhóm chọn ra có 4 sinh viên nữ. Bài tập 10. Một sọt cam rất lớn được phân loại theo cách sau. Chọn ngẫu nhiên 20 quả cam làm mẫu đại diện. Nếu mẫu không có quả cam hỏng nào thì sọt cam được xếp loại 1. Nếu mẫu có 1 hoặc 2 quả hỏng thì sọt cam được xếp loại 2. Trong trường hợp còn lại (có từ 3 quả hỏng trở lên) thì sọt cam được xếp loại 3. Giả sử tỷ lệ cam hỏng của một sọt cam là 3%. Hãy tính xác suất để: a) Sọt cam được xếp loại 1. b) Sọt cam được xếp loại 2. c) Sọt cam được xếp loại 3. 1 Bài tập 11. Trong một lớp học có 6 bóng đèn, mỗi bóng có xác suất bị cháy là 4 . Lớp học đủ ánh sáng nếu có ít nhất có 4 bóng đèn sáng. Tính xác suất để lớp học không đủ ánh sáng? Bài tập 12. Một bài thi trắc nghiệm (multiple choice test) gồm 12 câu hỏi , mõi câu hỏi cho 5 câu trả lời, trong đó chỉ có một câu đúng. Giả sử mỗi câu trả lời đúng được 4 điểm, và mõi câu trả lời sai bị trừ đi 1 điểm. Một học sinh kém làm bài bằng cách chọn 1 câu hú hoạ một câu trả lời. Tính xác suất để: a) Anh ta được 13 điểm. b) Anh ta bị điểm âm. Bài tập 13. Một người say rượu bước 8 bước. Mỗi bước anh ta bước tiến lên phía trước 1 mét hoặc lùi lại phía sau 1 mét với xác suất như nhau. Tính xác suất để sau 8 bước: a) Anh ta trở lại điểm xuất phát. b) Anh ta cách điểm xuất phát 4m. Bài tập 14. Hai đấu thủ chơi cờ ngang tài ngang sức thi đấu với nhau. Hỏi rằng khả năng nào cao hơn giữa hai khả năng: - Thắng 2 ván trong 4 ván. - Thắng 3 ván trong 6 ván. Bài tập 15. Một lô hàng có tỷ lệ chính phẩm là 95%. Lấy liên tiếp ra 2 sản phẩm. Tìm xác suất để nhận được a. Cả 2 chính phẩm. b. Its nhất 1 chímnh phẩm. c. Có dúng 1 chính phẩm. Bài tập 16. Một nhóm có 10 người gồm 6 nam và 4 nữ. Chọn ngẫu nhiên ra 3 người. Gọi X là số nữ ở trong nhóm. Lập bảng phân bố xác suất của X và tính EX, DX và modX. Bài tập 17. Một túi chứa 10 tấm thẻ đỏ và 6 tấm thẻ xanh. Chọn ngẫu nhiên ra 3 tấm thẻ. a) Gọi X là số thẻ đỏ. Tìm phân phối xác suất của X. b) Giả sử rút mỗi tấm thẻ đỏ được 5 điểm và rút mỗi tấm thẻ xanh được 8 điểm. Gọi Y là số điểm tổng cộng trên 3 thẻ rút ra. Tìm phân phối xác suất của Y. Bài tập 18. gieo một con xúc xắc cân đối và đồng chất. Gọi X là số chắm ở mặt trên của con xúc xắc. 31
  32. a. Lập bẳng phân phối xác suất của X. b. Viết biểu thức hàm phân phối. Vẽ đồ thị của nó. Bài tập 19. Gieo đồng thời 2 con xúc xắc cân đối và đồng chất. Gọi Y là tổng số chấm ở mặt trên của 2 con xúc xắc. a. Lập bảng phân phối xác suất cảu Y. b. Viết biểu thức hàm phân phối của Y. Bài tập 20. Trong một cái bát có để 5 hạt đậu trong đó có 2 hạt đỏ. Lấy ngẫu nhiên ra 2 hạt. Gọi X là số hạt đậu đỏ dược lấy ra. a. Lập bảng phân phối xsc suất cảu X. b. Viết biểu thức hàm phân phối của X. c. Tính P{0< X <2} bằng cách tính trực tiếp và bằng cách thông qua hàm phân phối. Bài tập 21. Một thiết bị gồm 3 bộ phận hoạt động độc lập với nhau, xác suất trong khoảng thời gian t các bộ phận hỏng tương ứng bằng 0,2; 0,3; 0,25. Gọi X là số bộ phận bị hỏng trong khoảng t. a. Tìm phân phối xác suất của X. b. Viết biểu thức hàm phân phối của X. c. Tính P{0< X <4} theo 2 cách. Bài tập 22. Một xạ thủ dùng 5 viên đạn để thử súng. Anh ta bắn từng viên vào bia với xác suất trúng tâm là 0,95. Nếu có 2 viên liên tiếp trúng tâm thì thôi không bắn nữa. Gọi A là số đạn còn thừa ra. a. Lập bảng phân phối xác suất của X. b. Viết biểu thức hàm phân phối của X. Bài tập 23. Một xạ thủ đem 6 viên đạn để bắn kiểm tra trước ngày thi băn. Anh ta bắn từng viên vào bia với xác suất trúng vòng 10 là 0,85. Nếu bắn được 3 viên liên tiểptúng vòng 10 thì thôi không bắn nuẵ. Gọi X là số đạn anh ta đã bắn. a. Lập bảng phân phối xác suất của X. b. Viết biểu thức hàm phân phối của X. c. Xét trường hợp anh ta bắn 3 viên trúng vòng 10 thì ngừng bắn. Gọi Y là số đạn còn lại. Tìm quy luật phân phối của Y. Bài tập 24. Cho 2 biến ngẫu nhiên X và Y độc lập với csc phân phối xác suất như sau: X -1 0 1 2 P 0,2 0,3 0,3 0,2 Y -1 0 1 P 0,3 0,4 0,3 Lập bảng phân phối xác suất của X2,X + Y, 2Y, X − 2Y và XY. Bài tập 25. Cho biến ngẫu nhiên Cauchy với hàm phân phối: 1 1 F (x) = + arctgx 2 π a. Tìm xác suất của biến cố: 0 < X < 1. b. Tìm hàm mật độ của X. 32
  33. Bài tập 26. Cho biến ngẫu nhiên X có phân phối đề trên [0;1]. Tìm xác suất sao cho trong 100 lần quan sát về X có 60 lần X nhận giá trị trong (0,2; 0,7). Bài tập 27. Biến ngẫu nhiên X nhận giá trị tập trung trong [−π/2, π/2]. Với hàm mật độ có dạng p(x) = Ccosx. a. Xác định hằng số C. b. Viết biểu thức hàm phân phối của X. c.Tìm P {0 ≤ X ≤ π/4}. d. Nếu quan sát X 5 lần thì bao nhiêu lần X nhận giá trị trong [0, π/4] là có khả năng nhất. Tính xác suất đó. Bài tập 28. Biến ngẫu nhiên X có phân phối Pareto, đặc trưng sự tăng dân số, có hàm phân phối sau: ( 0 nếux 0, x0 > 0 1 − x nếux ≥ x0 a. Tìm hàm mật độ của X. b. Tìm EX và DX. Bài tập 29. Trong ca làm việc, một máy tự động sản xuất được 100 sản phẩm. Xác suất để 1 sản phẩm được sản xuất và thuộc loại phế phẩm là 0,02. Ta xem quá trình sản xuất các sản phẩm tiến hành đọc lập với nhau. a. Tìm quy luật phân phối xác suất của số phế phẩm trong ca. b. Trung bình trong ca có bao nhiêu phế phẩm và xác suất có số phế phẩm đó. Bài tập 30. Chiều cao của nam giới đã trưởng thành là một biến ngẫu nhiên có phân phối chuẩn là N(160;36). Tìm xác suất để khi lấy ngẫu nhiên bốn nam thì có ít nhất một người có chiều cao trong khoảng (158; 162). Bài tập 31. Cho 2 biến ngẫu nhiên X và Y độc lập, giả sử X ' N(2; 0, 09,Y ' phân phối mũ với λ = 1/5. Tìm: a. E(−3X + 2Y − 5). b. D(−3X + 2Y − 5). c. E(2X2 − 3Y 2 + 2XY − 3Y + 2X − 3). Bài tập 32. Xác suất để hạt thóc giống bị lép là 0,006. Tìm xác suất sao cho trong 1000 hạt thóc giống có: a. Không bé hơn 3 hạt lép. b. Có đúng 6 hạt lép. c. Có không lớn hơn 16 hạt lép. Bài tập 33. Gieo một conn xúc xắc cân đối và đồng chất 12000 lần. Tìm xác suất để cho số lần xuất hiện mặt 1 nốt ở phía trên con xúc xắc gồm giữa 1900 và 2150. Bài tập 34. Mỗi người góp vào x nghìn đồng, tham gia trò chơi như sau: gieo đồng thời 2 con xúc xắc cân đôi, đồng chất, nếu được 2 mặt lục thì nhận 14 nghìn, 1 mặt lục thì nhận 4 nghìn. a. Hỏi x là bao nhiêu để về trung bình là trò chơi vô thưởng vô phạt (không lỗ, không lãi). b. Cần tối thiểu bao nhiêu người tham gia trò chơi để tổng số tiền góp vào là ≥ 14 nghìn đồng? 33
  34. Bài tập 35. Tiêm một loại vácxin chống toi gà. Khả năng nhiễm dịch là 80%. Một tổ kiểm tra bắt ngẫu nhiên ra từng con cho đến khi nào gặp được con không miễn dịch thì thôi. a. Mô tả phân phối xác suất của biến ngẫu nhiên chỉ số gà mà tổ kiểm tra đã bắt ra. b. Trung bình tổ phải bắt nao nhiêu con gà? c. Tính xác suất phải bắt không quá 3 con gà. Bài tập 36. Cho hai biến ngẫu nhiên X và Y có phân phối xác suất như sau: X 0 1 2 3 4 5 P 0,15 0,3 0,25 0,2 0,08 0,02 và Y 0 1 2 3 4 5 P 0,3 0,2 0,2 0,15 0,1 0,05 a) Tính EX và EY. b) Tính P {X + Y ≤ 3} nếu X và Y độc lập. Bài tập 37. Cho biến ngẫu nhiên liên tục X có hàm mật độ ( kx2(1 − x) nếu 0 ≤ x ≤ 1 p(x) = 0 nếu ngược lại a) Tìm hằng số k. b) Tìm mod. c) Tính P (0, 4 2). c) Tính Median của X. 3 d) Tìm a để P {X < a} = 4 . 34
  35. Bài tập 41. Cho biến ngẫu nhiên X có hàm mật độ sau: ( 3 x(2 − x) nếu 0 ≤ x ≤ 2 p(x) = 4 0 nếu ngược lại a) Vẽ đồ thị của p(x). b) Tính P {X > 1, 5} và P {0, 1 ≤ x ≤ 1, 1} Bài tập 42. Cho biến ngẫu nhiên X có hàm mật độ sau:  x 1  4 + 2 nếu − 2 ≤ x ≤ 0  x 1 p(x) = − 4 + 2 nếu 0 ≤ x ≤ 2 0 nếu x còn lại Tính kỳ vọng và phương sai của X. Bài tập 43. Cho biến ngẫu nhiên X có hàm mật độ sau: ( k(1 − x2) nếu |x| ≤ 1 p(x) = 0 nếu trái lại Tìm k và tính kỳ vọng phương sai của biến ngẫu nhiên Y = 2X2. Bài tập 44. Cho biến ngẫu nhiên X có hàm mật độ sau: ( kx2 nếu |x| ≤ 1 p(x) = 0 nếu trái lại √ trong đó k là hằng số. Xét biến ngẫu nhiên Y = 2 X. Hãy tính 1 3 a) P { 2 1}. Bài tập 45. Trọng lượng của một con bò là một biến ngẫu nhiên có phân phối chuẩn với giá trị trung bình 250kg là độ lệch tiêu chuẩn là 40kg. Tìm xác suất để một con bò chọn ngẫu nhiên có trọng lượng: a) Nặng hơn 300kg. b)Nhẹ hơn 175kg. c) Nằm trong khoảng từ 260kg đến 270kg. Bài tập 46. Các biến ngẫu nhiên X và Y có bảng phân phối xác suất đồng thời như sau: X \ Y 1 2 3 1 0,12 0,15 0,03 2 0,28 0,35 0,07 a) Chứng minh rằng X và Y độc lập. b) Tìm quy luật phân phối của biến ngẫu nhiên Z = XY . c) Tính EZ bằng hai cách cách và kiểm tra EZ = EXEY . 35
  36. Bài tập 47. Cho X và Y là hai biến ngẫu nhiên có phân phối xác suất đồng thời như sau: X \ Y -1 1 1 1 -1 6 4 1 1 0 6 8 1 1 1 6 8 Hãy tính EX, EY, cov(X, Y) và ρ(X, Y ). Bài tập 48. Cho X và Y là hai biến ngẫu nhiên có phân phối xác suất đồng thời như sau: X \ Y -1 0 1 4 1 4 -1 15 15 15 1 2 1 0 15 15 15 2 1 0 15 0 a) Hãy tính EX, EY, cov(X, Y) và ρ(X, Y ). b) X và Y có độc lập hay không? 36
  37. Chương 2 Lý thuyết chọn mẫu và ước lượng tham số 2.1 Mẫu ngẫu nhiên, hàm phân phối và đặc trưng mẫu 2.1.1 Mẫu ngẫu nhiên Giả sử ta cần nghiên cứu một tính chất nào đó của các cá thể trong một đám đông M (Tập hợp tất cả các phần tử mà ta cần nghiên cứu được gọi là đám đông, kí hiệu là M). Trên thực tế số phần tử của đám đông rất lớn hoặc vì một số khó khăn nào đó mà ta không thể khảo sát được tất cả các phần tử của nó, nhưng lại muốn có một kết luận chính xác về tính chất của các cá thể trong đám đông đó. Để giải quyết vấn đề này ta phải chọn ra một tập hợp các phần tử đại diện cho đám đông đó, tập hợp các phần tử đại diện này được gọi là tập mẫu. Định nghĩa 2.1.1. Dãy biến ngẫu nhiên X1, , Xn độc lập cùng phân phối với biến ngẫu nhiên X được gọi là mẫu ngẫu nhiên cỡ n lấy từ X. Ký hiệu (X1,X2, , Xn) Các giá trị x1, x2, , xn nhận được từ X1,X2, , Xn. Khi đó ta gọi bộ số (x1, x2, , xn) là mẫu cụ thể kích thước n a) Phương pháp chọn mẫu ∗ Chọn mẫu có hoàn lại: Giả sử từ tập chính Ω gồm n phần tử, ta muốn xét một đặc trưng nào đó của các phần tử trong Ω, chọn ngẫu nhiên một phần tử ra để quan sát và thu được giá trị x1 sau đó hoàn lại, tiếp tục cho đến n lần ta thu được dãy các kết quả x1, x2, , xn mãu này gọi là mẫu ngẫu nhiên đơn giản. ∗ Chọn mẫu không hoàn lại. Ta cũng chọn ngẫu nhiên các phần tử từ tập chính Ω nhưng mỗi lần rút một phần tử từ tập chính ra quan sát không hoàn lại về tập chính nữa, cứ như vậy sau n lần quan sát ta cũng thu được dãy các kết quả x1, x2, , xn mẫu này gọi là mẫu ngẫu nhiên đơn giản. ∗ Chọn mẫu cơ học. Thực hiện đánh số các phần tử của Ω, ấn định kích thước mẫu, chọn ngẫu nhiên các phần tử được đánh số để quan sát. ∗ Chọn mẫu theo tỷ lệ (đặc trưng). Chia các phần tử của tập chính Ω theo tỷ lệ, chẳng hạn 20%, 15%, sau đó chọn mẫu trong các tỷ lệ được phân chia. 37
  38. b) Các loại mẫu • Mẫu đơn giản xi x1 x2 xn ni 1 1 1 • Mẫu rút gọn xi x1 x2 xk ni n1 n2 nk với X ni = n i • Mẫu ghép nhóm. xi [a1, a2) [a2, a3) [ak, ak+1) 0 0 0 Ptử đd x1 x2 xk ni n1 n2 nk với X ai + ai+1 n = n, x0 = i i 2 i 2.1.2 Hàm phân phối, đa giác tần suất và tổ chức đồ tần suất a) Hàm phân phối mẫu. Định nghĩa 2.1.2. Hàm phân phối mẫu (hay còn gọi là phân phối thực nghiệm) là tỷ số m/n, trong đó n là kích thước mẫu, m là số giá trị mẫu Xi 8 38
  39. b) Đa giác tần số và tổ chức đồ Phần này chủ yếu dùng cho việc dùng đồ thị và biểu đồ để minh họa mật độ phân bố của các hiện tượng ngẫu nhiên dựa trên cơ sở mẫu ngẫu nhiên (X1,X2, , Xn) đã cho. • Đa giác đồ Giả sử cho bảng sau: xi x1 x2 xk ni n1 n2 nk với X ni = n i Bảng này được gọi là bảng tần số. Khi đó đa giác tần số là đường nối các điểm (x1, n1); (x2, n2), , (xk, nk) Giả sử cho bảng: xi x1 x2 xk fi f1 f2 fk với X ni n = n, f = i i n i Bảng này được gọi là bảng tần suất. Khi đó đa giác tần suất là đường nối các điểm n1 n2 nk (x1, n ); (x2, n ), , (xk, n ) Ví dụ 2. Cho bảng số liệu sau: xi 31 34 35 36 38 40 42 44 Tần số(ni) 10 20 30 15 10 10 5 20 1 2 3 1 1 1 1 1 Tần suất(fi) 12 12 12 8 12 12 24 6 Ta có biểu đồ tần số và tần suất là: 39
  40. • Tổ chức đồ Dạng biểu đồ này cũng mô tả mật độ phân bố của biến ngẫu nhiên X trên cơ sở mẫu quan sát cho dưới dạng ghép nhóm. Tổ chức đồ tần suất là một hình bậc thang gồm nhiều hình chữ nhật có đáy trùng với trục hoành, độ dài và chiều cao tương ứng với lớp ghép nhóm đó. Ví dụ 3. Cho bảng số liệu sau: xi Tần số(ni) Tần suất(fi) 26, 5 − 48, 5 2 0,04 48, 5 − 70, 5 8 0,16 70, 5 − 92, 5 12 0,24 92, 5 − 114, 5 12 0,24 114, 5 − 136, 5 8 0,16 136, 5 − 158, 5 7 0,04 158, 5 − 180, 5 1 0,02 180, 5 − 202, 5 1 0,02 Tổng 51 1 Ta có biểu đồ tần số và tần suất là: 40
  41. 2.1.3 Mẫu ngẫu nhiên hai chiều Giả sử từ tổng thể mẫu ta chọn ra một mẫu ngẫu nhiên 2 chiều kích thước n. Trong đó thành phần X nhận các giá trị x1, x2, , xk và thành phần Y nhận các giá trị y1, y2, , yh, trong đó giá trị (xi, yj) xuất hiện với tần số nij(i = 1, k; j = 1, h). Sau khi các giá trị xi và yj được xắp xếp theo thứ tự tăng dần, ta có bảng phân phối tần số thực nghiệm sau: X Y y1 y2 yh ni x1 n11 n12 n1l n1 xk nk1 nk2 nkh nk mj m1 m2 mh n Trong đó: h X ni = nij là tần số của xi(i = 1 k) j=1 41
  42. k X mj = nij là tần số của yj(j = 1 h) Từ đó ta suy ra i=1 Bảng phân phối thực nghiệm của thành phần X X x1 x2 xk ni n1 n2 nk Bảng phân phối thực nghiệm của thành phần Y Y y1 y2 yh mj m1 m2 mh 2.1.4 Đặc trưng mẫu a) Trung bình mẫu  n  1 X  n Xi nếu mẫu đơn giản   i=1  k  1 X X = n niXi nếu mẫu rút gọn  i=1  k  1 X 0  niX nếu mẫu ghép nhóm  n i i=1 Trường hợp mẫu cụ thể  n  1 X  n xi nếu mẫu đơn giản   i=1  k  1 X x = n nixi nếu mẫu rút gọn  i=1  k  1 X 0  nix nếu mẫu ghép nhóm  n i i=1 b) Mômen cấp K.  n  1 X k  n xi nếu mẫu đơn giản   i=1  k  1 X k mk = n nixi nếu mẫu rút gọn  i=1  k  1 X k  nic nếu mẫu ghép nhóm  n i i=1 42
  43. c) Phương sai mẫu chưa hiệu chỉnh.  n n  1 X 2 1 X 2 2  n (Xi − X) = Xi − X nếu mẫu đơn giản  n  i=1 i=1  k n  X 1 X 2 S2 = 1 n (X − X)2 = n X2 − X nếu mẫu rút gọn b n i i n i i  i=1 i=1  k n  1 X 0 2 1 X 02 2  ni(X − X) = niX − X nếu mẫu ghép nhóm  n i n i i=1 i=1 Trường hợp mẫu cụ thể  n n X 1 X  1 (x − x)2 = x2 − x2 nếu mẫu đơn giản  n i n i  i=1 i=1  k n  X 1 X s2 = 1 n (x − x)2 = n x2 − x2 nếu mẫu rút gọn b n i i n i i  i=1 i=1  k n  1 X 0 2 1 X 0 2 2  ni(x − x) = nix − x nếu mẫu ghép nhóm  n i n i i=1 i=1 Ta có thể viết gọn lại là 2 2 2 sb = x − x d) Phương sai mẫu có hiệu chỉnh  n  1 X 2  n−1 (Xi − X) nếu mẫu đơn giản   i=1  k 2  1 X 2 S = n−1 ni(Xi − X) nếu mẫu rút gọn  i=1  k  1 X 2  ni(Xi − X) nếu mẫu ghép nhóm  n−1 i=1 Trường hợp mẫu cụ thể  n  1 X 2  n−1 (xi − x) nếu mẫu đơn giản   i=1  k 2  1 X 2 s = n−1 ni(xi − x) nếu mẫu rút gọn  i=1  k  1 X 0 2  ni(x − x) nếu mẫu ghép nhóm  n−1 i i=1 43
  44. Ta thấy n s2 = s2 n − 1b vì n n 1 X s2 = s2 = ( x2n − x2) n − 1b n − 1 n i i k n 1 X 1 X = ( ( x2n − nx2)) = n (x − x)2 n − 1 n i i n − 1 i i i=1 Hoặc ta có thể dùng trực tiếp công thức  n  1  X 2 2  n−1 xi − nx nếu mẫu đơn giản   i=1  k 2  1  X 2 2 s = n−1 nixi − nx nếu mẫu rút gọn  i=1  k  1  X 0 2 2  nix − nx nếu mẫu ghép nhóm  n−1 i i=1 2 2 Ví dụ 4. Tính x, sb , s từ bảng sau: xi 22, 5 27, 5 32, 5 37, 5 42, 5 47, 5 52, 5 ni 2 14 26 32 14 8 4 Ta có bảng 2 xi ni nixi nixi 22, 5 2 45 1012, 5 27, 5 14 385 10587, 5 32, 5 26 845 27462, 5 37, 5 32 1200 45000 42, 5 14 595 25287, 5 47, 5 8 380 18050 52, 5 4 210 11025 tổng 100 3660 138425 44
  45. Khi đó 7 1 X 3660 x = n x = = 36, 6 n i i 100 1 7 1 X s2 = n (x − x)2 b n i i 1 7 1 X = n x2 − x2 n i i 1 1 = 138428 − 36, 62 = 44, 69 100 n s2 = s2 = 45, 1414 n − 1b √ s = s2 Ví dụ 5. Khảo sát về giá phòng tại một khu khách sạn ở trung tâm thành phố thu được số liệu sau: xi là giá tiền đơn vị ngàn đồng; ni là số phòng. Xi [120; 140) [140; 160) [160; 180) [180; 200) [200; 220) [220; 240) ni 13 14 20 24 12 17 Hãy xác định độ bền trung bình, phương sai mẫu, phương sai mẫu có hiệu chỉnh. HD: 0 0 02 xi xi ni nixi nixi 120 − 140 130 13 1690 219700 140 − 160 150 14 2100 315000 160 − 180 170 20 3400 578000 180 − 200 190 24 4560 866400 200 − 220 210 12 2520 529200 220 − 240 230 17 3910 899300 tổng 100 18180 3407600 Khi đó 2 x = 181, 8; sb = 1024, 76 n s2 = s2 = 1035, 11 n − 1b 2.2 Ước lượng điểm Đặt vấn đề: X là biến ngẫu nhiên 7→ FX (x, θ): θ chưa biết; FX là hàm phân phối của X. +) FX (x, θ) chưa biết hoặc biết chưa đầy đủ, phụ thuộc vào θ ⇒ ước lượng θ. +) Cách ước lượng tham số θ: Quan sát X, xây dựng mẫu ngẫu nhiên θ(X1,X2, , Xn) ⇒ xây dựng thống kê θb(X1,X2, , Xn) thoả mãn một số điều kiện nào đó, nó là ước lượng của θ. 45
  46. 2.2.1 Ước lượng không chệch a) Định nghĩa: θb(X1,X2, , Xn) được gọi là ước lượng không chệch đối với θ nếu Eθb(X1,X2, , Xn) = θ. b) Giải thích định nghĩa. Eθb = θ ⇒ E(θb− θ) = 0 suy ra θb là ước lượng không chệch đối với θ khi và chỉ khi θb và θ không có sai số hệ thống. 2 Ví dụ 6. X ∼ N(µ, σ ), θ(X1,X2, , Xn) là mẫu ngẫu nhiên lấy từ X. Hãy chứng n 1 X minh X = n Xi là ước lượng không chệch đối với µ. i=1 HD: n n X 1 X EX = E( 1 X ) = EX n i n i i=1 i=1 Do θ(X1,X2, , Xn) là mẫu ngẫu nhiên lấy từ X nên X1,X2, , Xn là dãy biến ngẫu nhiên độc lập cùng phân phối, từ đó suy ra EXi = EX = µ n n 1 X 1 X nµ ⇒ EX = E( X ) = EX = = µ n i n i n i=1 i=1 2.2.2 Ước lượng vững p a) Định nghĩa: θ(X1,X2, , Xn) được gọi là ước lượng vững đối với θ nếu θ −→ θ (n → ∞) Nhận xét:θ(X1,X2, , Xn) được gọi là ước lượng vững đối với θ ⇔ ∀ε > 0 : P {|θ − θ| ≥ ε} → 0 (n → ∞) b) Bất đẳng thức Chebyshev. X là biến ngẫu nhiên, có phương sai hữu hạn thì DX ∀ε > 0 : P {|X − EX| ≥ ε} ≤ ε2 2 Ví dụ 7. Cho X là biến ngẫu nhiên có EX = µ; DX = σ ; θ(X1,X2, , Xn) là mẫu n 1 X ngẫu nhiên lấy từ X. Chứng minh rằng: X = n Xi là ước lượng vững đối với µ. i=1 HD: Dễ thấy EX = µ, X là ULKC đối với µ. DX σ2 ∀ε > 0 ⇒ P {|X − µ| ≥ ε} = P {|X − EX| ≥ ε} ≤ = ε2 nε2 46
  47. σ2 ∀ε > 0 ⇒ 0 ≤ P {|X − µ| ≥ ε} = → 0 (n → ∞) nε2 p ⇒ X −→ µ(n → ∞) ⇒ X là ULKC đối với µ. 2.2.3 Ước lượng hiệu quả a) Bất đẳng thức Crame-Rao. Nếu θ là ULKC đối với θ thì: Dθ ≥ 1 . b b Jn(θ) b) Định nghĩa: θb được gọi là hiệu quả đối với θ nếu: +) Eθb = θ +) Dθb đạt min. c) Nhận xét: θb là ước lượng hiệu quả đối với θ. ( Eθb = θ ⇔ Dθ = 1 b Jn(θ) Ví dụ 8. Giả sử X ∼ N(µ, σ2), với σ2 đã biết. Khi đó: n EX = µ, DX = σ2,J (µ) = n σ2 1 Pn Chứng minh X = n i=1 Xi là ước lượng hiệu quả đối với µ. Thật vậy: i) n 1 X 1 EX = EX = nµ = µ n i n i=1 ii) n 1 X 1 σ2 1 DX = DX = nσ2 = = n2 i n2 n J (µ) i=1 n 2.2.4 Ước lượng hợp lý cực đại Mẫu ngẫu nhiên θ(X1, , Xn) là mẫu ngẫu nhiên lấy từ biến ngẫu nhiên X có hàm mật độ f(x, θ) phụ thuộc θ. Ln(x1, , xn, θ) = fn(x1, , xn, θ) được gọi là hàm mật độ đồng thời của (X1, , Xn) hay Ln(X, θ) = fn(X, θ). a) Định nghĩa: 47
  48. Hàm Ln(X, θ) được gọi là hợp lý θb(X1, , Xn) sao cho hàm hợp lý đạt cực đại thì θb(X1, , Xn) được gọi là ước lượng hợp lý cực đại đối với θ. b) Giải thích định nghĩa. Định nghĩa trên thể hiện sự tương ứng giữa mẫu quan sát ngẫu nhiên với sự kiện có khả năng xuất hiện nhiều nhất. c) Mệnh đề. Giả sử hàm Ln(X, θ) là hàm khả vi, hàm logarit (ln) là hàm đơn điệu thì θb là nghiệm của phương trình. ∂Ln(X, θ) = 0 ∂θ Do θ(X1, , Xn) là mẫu ngẫu nhiên lấy từ X nên n Y Ln(X, θ) = f(xi, θ) i=1 Từ đó có nhận xét: θ(X1, , Xn) là ước lượng hợp lý đối với θ khi và chỉ khi θb là nghiệm của phương trình n X ∂Lnf(xi, θ) = 0 ∂θ i=1 Tóm lại ta có thể phát biểu đơn giản như sau: Định nghĩa: θb được gọi là ước lượng hợp lý cực đại đối với θ nếu: n Y Ln(X, θ) = f(xi, θ) i=1 đạt giá trị lớn nhất.(f(xi, θ) = P (X = xi)) Hàm L được gọi là hàm hợp lý. Nhận xét: Nếu L đạt giá trị lớn nhất thì n X lnL = lnf(xi, θ) i=1 ∂lnL cũng đạt giá trị lớn nhất. Khi đó suy ra ∂θ = 0 (∗) suy ra θb là nghiệm của phương trình (*) Ví dụ 9. Giả sử X ∼ N(µ, σ2), với σ2 đã biết. Ta cần ước lượng hợp lý cực đại của µ = EX. Giải: Thật vậy ta có: 2 1 (xi−µ) − 2 f(xi, θ) = √ e 2σ σ 2π n n 2 (x −µ)2 P (x −µ) Y 1 − i 1 n − i=1 i ⇒ L(X, µ) = √ e 2σ2 = ( √ ) e 2σ2 i=1 σ 2π σ 2π Do đó: Pn (x − µ)2 1 lnL = − i=1 i + ln( √ )n 2σ2 σ 2π 48
  49. ∂lnL Pn (x − µ) Pn x − nµ ⇒ = 2 i=1 i = i=1 i ∂µ 2σ2 σ2 Xét nghiệm của phương trình: ∂lnL Pn x − nµ = 0 ⇔ i=1 i = 0 ∂θ σ2 Vậy phương trình có nghiệm là n 1 X µ = x = X n i i=1 Vậy ước lượng hợp lý cực đại đối với µ là X. 2.2.5 Ước lượng điểm cho kỳ vọng Giả sử X là biến ngẫu nhiên với EX = µ (chưa biết), µ được gọi là giá trị trung bình của tập chính. Nếu ta có mẫu n giá trị x1, x2, , xn của X thì trung bình mẫu x + x + + x x = 1 2 n n sẽ dùng làm ước lượng cho µ Định lý 2.2.1. Trung bình mẫu là ước lượng không chệch và vững cho trung bình của tập hợp chính 2.2.6 Ước lượng điểm cho phương sai Giả sử X là biến ngẫu nhiên với DX = σ2 (chưa biết), σ2 được gọi là phương sai của tập chính. Nếu ta có một mẫu gồm n giá trị quan sát của X: x1, x2, xn thì phương 2 2 sai mẫu chưa hiệu chỉnh sb được dùng để ước lượng không chêch cho σ 2.2.7 Ước lượng điểm cho xác suất m Ước lượng cho xác suất p của tính chất A nào đó là f = n . Vì EX = p nên tần suất f là ước lượng không chệch cho p. Ví dụ 10. Tiến hành đo chiều cao cho 100 em học sinh lớp 3 (8 tuổi) ở một trường phổ thông cơ sở, ta có kết quả sau: Gọi X là chiều cao của các em học sinh (cm) xi 111 113 115 117 119 121 123 125 127 ni 5 8 14 17 20 16 10 6 4 Hãy ước lượng trung bình, phương sai, và xác suất của p = P (117 < X < 125) Giải. Ta tính được x¯ = 118, 62, sˆ2 = 15, 9754, f = 63/100 = 0, 63 Như vậy ước lượng trung bình là 118,62; ước cho phương sai là 15,9754, và ước lượng cho xác suất là 0,63 Chú ý : Khi nói đên ước lượng cho trung bình, phương sai, xác suất ma không cho độ tin cậy hoặc mức ý nghĩa thì đó chính là ước lượng điểm. 49
  50. 2.3 Ước lượng khoảng Để ước lượng tham số θ chưa biết của biến ngẫu nhiên X, ta có thể dùng một khoảng số, cách ước lượng như vậy được gọi là ước lượng khoảng. 2.3.1 Ước lượng khoảng đối với giá trị trung bình Giả sử trung bình của tổng thể là µ (µ chưa biết, µ cũng chính là kỳ vọng toán của biến ngẫu nhiên X), ta cần tìm một khoảng số để ước lượng µ với độ tin cậy 1 − α dựa trên số liệu của một mẫu kích thước n. a)Ước lượng khoảng đối xứng Trường hợp 1 Phương sai σ2 đã biết n ≥ 30(n < 30); X ∼ N(µ, σ2) Giả sử X ∼ N(µ, σ2) với mức ý nghĩa là α (độ tin cậy β = 1 − α) khi đó ta có 2 X−µ √ X ' N(µ, σ /n) ⇒ σ n ' N(0, 1). Do đó |X − µ|√ P { n ≤ u } = 1 − α σ α/2 Hay σ σ P {X − u √ ≤ µ ≤ X + u √ } = 1 − α α/2 n α/2 n Khi đó thì khoảng tin cậy đối xứng của µ = EX là:  σ σ  X − u √ , X + u √ α/2 n α/2 n Với mẫu cụ thể thì ta có  σ σ  x − u √ , x + u √ α/2 n α/2 n Trong đó uα/2 là mức phân vị α/2 của phân phối chuẩn có giá trị thỏa mãn Z uα/2 1 −t2/2 α φ0(uα/2) = √ e dt = 1 − 2π −∞ 2 Chú ý: +) α = 5% ⇒ uα/2 = 1, 96; β = 95% +) α = 1% ⇒ uα/2 = 2, 58; β = 99% +) α = 10% ⇒ uα/2 = 1, 64; β = 99% +) α = 2% ⇒ uα/2 = 2, 33; β = 99% Trường hợp 2. Phương sai σ2 chưa biết n ≥ 30 X không chuẩn Khi đó ta xấp xỉ s ≈ σ và ta tương tự ở trên ta cũng có khoảng tin cậy đối xứng của µ = EX là:  s s  X − u √ , X + u √ α/2 n α/2 n 50
  51. Với mẫu cụ thể thì ta có  s s  x − u √ , x + u √ α/2 n α/2 n Trường hợp 3. Phương sai σ2 chưa biết và n < 30 Khi đó ta xấp xỉ s ≈ σ và ta tương tự ở trên ta cũng có khoảng tin cậy đối xứng của µ = EX là:  s s  X − t √ , X + t √ (n−1,α/2) n (n−1,α/2) n Với mẫu cụ thể thì ta có  s s  x − t √ , x + t √ (n−1,α/2) n (n−1,α/2) n Trong đó t(n−1)(α/2) là mức phân vị α/2 cho phân phối Student với bậc tự do n-1. b) Ước lượng khoảng 1 phía Trường hợp 1. Phương sai σ2 đã biết Giả sử X ∼ N(µ, σ2) với mức ý nghĩa là α (độ tin cậy β = 1 − α) khi đó ta có 2 X−µ √ X ' N(µ, σ /n) ⇒ σ n ' N(0, 1). Do đó σ P {−∞ ≤ µ ≤ X + u √ } = 1 − α α n σ P {X − u √ ≤ µ ≤ +∞} = 1 − α α n Khi đó thì khoảng tin cậy 1 phía là của µ = EX là:  σ  − ∞ , X + u √ α n  σ  X − u √ , +∞ α n Với mẫu cụ thể thì ta có khoảng ước lượng bên trái và bên phải là  σ  − ∞ , x + u √ α n  σ  x − u √ , +∞ α n Trong đó uα là mức phân vị α của phân phối chuẩn có giá trị thỏa mãn Z uα 1 −t2/2 φ0(uα) = √ e dt = 1 − α 2π −∞ Trường hợp 2. Phương sai σ2 chưa biết và n ≥ 30 Ta xấp xỉ σ ≈ s và tương tự ta cũng có khoảng ước lượng bên trái và bên phải với mẫu cụ thể là  s  − ∞ , x + u √ α n 51
  52.  s  x − u √ , +∞ α n Trường hợp 3. Phương sai σ2 chưa biết và n < 30 Ta xấp xỉ σ ≈ s và tương tự ta cũng có khoảng ước lượng bên trái và bên phải với mẫu cụ thể là  s  − ∞ , x + t √ (n−1,α) n  s  x − t √ , +∞ (n−1,α) n Chú ý : Khoảng ước lượng bên trái cho ta biết giá trị tối đa, khoảng tin cậy bên phải cho ta biết giá trị tối thiểu c) Xác định kích thước mẫu, độ chính xác, độ tin cậy Giả sử muốn ước lượng µ với sai số không quá ε cho trước với độ tin cậy β (mức ý nghĩa 1 − α). Ta biết rằng với xác suất β thì σ |X − µ| ≤ u √ α/2 n Vậy ta cần có bất đẳng thức σ s u √ ≤ ε, hoặc u √ ≤ ε α/2 n α/2 n hay σu σu n ≥ ( α/2 )2 ⇒ n = ( α/2 )2 + 1 ε ε Vậy n là số nguyên dương nhỏ nhất thỏa mãn bất đẳng thức trên (nếu σ đã biết). Ví dụ 11. Hãy tim khoảng tin cậy cho chiều cao trung bình của sinh viên dựa trên một mẫu kích thước n = 36 với trung bình mẫu x = 66inches(1inches = 2, 54cm). Giả sử rằng độ lệch tiêu chuẩn của người lớn là 3inches HD Đáp số [65, 02; 66, 98] Ví dụ 12. Một trường đại học tiến hành 1 nghiên cứu xem 1 sinh viên tiêu hết bao nhiêu tiền gọi điện thoại trong một tháng. Một mẫu ngẫu nhiên gồm 59 sinh viên được chọn và kết quả như sau. 14, 18, 22, 30, 36, 28, 42, 79, 36, 52, 15, 47, 95, 16, 27, 111 37, 63, 127, 23, 31, 70, 27, 11, 30, 147, 72, 37, 25, 7, 33, 29 35, 41, 48, 15, 29, 73, 26, 15, 26, 31, 57, 40, 18, 85, 28, 32 22, 37, 60, 41, 35, 26, 20, 58, 33, 23, 35 Hãy tìm khoảng tin cậy 95% cho số tiển gọi điện thoại trung bình µ hàng tháng của 1 sinh viên. 52
  53. HD Ta có x = 41, 05 s = 27, 99 Khi đó ta có khoảng tin cậy là 33, 92 < µ < 48, 18 Ví dụ 13. Để xác định trọng lượng trung bình của các bao bột mì được đóng bao bằng máy tự động, người ta ta chọn ngẫu nhiên 15 bao và tính được x = 39, 8kg, s2 = 0, 144. Tìm khoảng tin cậy cho trọng lượng trung bình µ của bao bột với độ tin cậy 99%. HD Ta có α = 0, 01, tα/2 = 2, 997. Vậy khoảng tin cậy của µ là 39, 5023 < µ < 40, 0977 Ví dụ 14. Để ước lượng chiều cao trung bình của thanh niên trong một vùng A nào đó, một mẫu ngẫu nhiên gồm 16 thanh niên được chọn. Chiều cao của các thanh niên này đo được như sau (đơn vị cm). 172, 173, 173, 174, 174, 175, 176, 166, 166, 167, 165, 173, 171, 170, 171, 170 Hãy tìm khoảng tin cậy cho µ với độ tin cậy β = 95% Đáp số 169, 115 < µ < 172, 885 Ví dụ 15. Một phân xưởng muốn ước lượng thời gian trung bình để sản xuất một gam giấy. Giả sử lượng thời gian đó tuân theo luật phân phối chuẩn với σ =0,3 phút. Trên một tập mẫu gồm 36 gam thời gian trung bình tính được là 1,2 phút/ram. Tính khoảng tin cậy là 95% cho thời gian sản xuất trung bình trên. HD: Thông tin đầu vào là x = 1, 2; σ = 0, 3; n = 36, u α = 1, 96. 2 Từ đó suy ra σ σ x − u √ < EX < x + u √ α/2 n α/2 n  0, 3 0, 3  1, 2 − 1, 96√ , 1, 2 + 1, 96√ ⇔ (1, 102 ; 1, 298) 36 36 Ví dụ 16. Để đánh giá về mức doanh thu hàng tháng tại các đại lý nhỏ trên một địa bàn, người ta lấy ngẫu nhiên gồm 36 đâị lý. Kết quả thu được như sau: doanh thu trung bình là 155,3 triệu đồng và độ lệch mẫu là 16 triệu đồng. Với độ tin cậy 99%. Hãy ước lượng doanh thu trung bình tối đa và tối thiểu của mỗi đại lý HD. Ta có uα = 2, 33. Khi đó Doang thu tối thiểu là: µ = 149, 09 Doanh thu tối đa là µ = 161, 51 Ví dụ 17. Quan sát năng suất của 100 công nhân trong một xí nghiệp người ta tính được năng suất trung bình của một công nhân ở mẫu này là x = 12 sản phẩm/ ngày và s2 = 25 1) Hãy ước lượng năng suất trung bình của một công nhân trong xí nghiệp này với độ tin cậy 99% 2) Muốn ước lượng năng suất trung bình của một công nhân trong xí nghiệp với độ 53
  54. tin cậy 95% thì độ chính xác là bao nhiêu? 3) Muốn ước lượng năng suất trung bình của một công nhân trong xí nghiệp với độ tin cậy 99% và độ chính xác la 0,8 thì cần quan sát của bao nhiêu công nhân nữa? 2.3.2 Ước lượng khoảng đối với giá trị tỷ lệ a) Ước lượng khoảng đối xứng Bài toán: Ω là tập chính gồm các phần tử mang tính chất A hoặc không mang tính chất A. p là xác suất để phần tử của Ω có tính chất A (p chưa biết). Hãy quan sát các phần tử của Ω để tìm khoảng tin cậy đối xứng với p với độ tin cậy β (mức ý nghĩa α = 1 − β) Cách giải quyết bài toán Thực hiện n phép thử Bernoulli từ các phần tử của tập chính , k là số lần xuất k hiện các phần tử có tính chất A trong n lần quan sát. Khi đó f = n là tần suất xuất hiện các phần tử có tính chất A. Suy ra f là ước lượng không chệch đối với p pq ⇒ Ef = p , Df = n với điều kiện ( np > 5 n(1 − p) > 5 Vì p chưa biết nên Df chưa biết, tuy nhiên với 1 số điều kiện ta có thể xấp xỉ p bởi f. Lúc đó điều kiện sẽ là ( nf > 10 n(1 − f) > 10 Khi đó ta có khoảng tin cậy đối xứng cho tỉ lệ p sẽ là  pf(1 − f) pf(1 − f) f − u √ , f + u √ α/2 n α/2 n Chú ý: α = 5% ⇒ uα/2 = 1, 96 α = 1% ⇒ uα/2 = 2, 58 b) Ước lượng khoảng 1 phía Tương tự như trên ta có khoảng ước lượng bên trái và bên phải là h pf(1 − f) 0 , f + u √ α n  pf(1 − f) i f − u √ , 1 α n 54
  55. c) Xác định kích thước mẫu, độ chính xác, độ tin cậy Muốn cho sai số |f − p| ≤ ε với xác suất không nhỏ hơn β (1 − α) ta có pf(1 − f) u √ ≤ ε α/2 n hay √ u2 f(1 − f) u2 f(1 − f) α/2  α/2  ε n n ≥ ⇒ n = + 1, uα/2 = ε2 ε2 pf(1 − f) Với điều kiện ( nf > 10 n(1 − f) > 10 Ta sẽ lấy n là số nguyên dương bé nhất thõa mãn bất đẳng thức trên. Ví dụ 18. Trước khi tổ chức cuộc tranh cử tổng thống Mỹ người ta muốn biết bao nhiêu phần trăm ủng hộ ứng cử viên A. Các nhà điều tra xã hội học đã phỏng vấn 50.000 người dân có 27.040 người ủng hộ ứng cử viên A. Với độ tin cậy β = 95% hãy ước lượng tỷ lệ người dân ủng hộ ứng cử viên A. HD: Gọi p là tỷ lệ người dân ủng hộ ứng cử viên A. Khi đó k 27040 f = = = 0, 5408 n 50.000 là tần suất người dân ủng hộ ứng cử viên A trong 50.000 người ta có β = 95% ⇒ α = 5% ⇒ uα/2 = 1, 96 Áp dụng công thức ta có khoảng tin cậy đối xứng đối với tỷ lệ p, với mức ý nghĩa α = 5% là [p1, p2] với. √ pf(1 − f) 0, 5408.0, 4592 p1 = f − uα/2 √ = 0, 5408 − 1, 96. √ = 0, 5364 n 50000 √ pf(1 − f) 0, 5408.0, 4592 p2 = f + uα/2 √ = 0, 5408 + 1, 96. √ = 0, 5452 n 50000 Vậy khoảng tin cậy đối xứng đối với tỷ lệ p với độ tin cậy β = 95% là (0, 5364; 0, 5452) Ví dụ 19. Để ước lượng tỷ lệ phế phẩm của một kho hàng, người ta kiểm tra 100 sản phẩm, phát hiện có 20 sản phẩm là phế phẩm. Với độ tin cậy 95%, hãy ước lượng phế phẩm tối đa và tối thiểu của phế phẩm HD. Tỷ lệ phế phẩm tối thiểu là p = 0, 1344 Tỷ lệ phế phẩm tối đa là p = 0, 2656 55
  56. Ví dụ 20. Để xác định tốc độ hội tụ của phản ứng người ta tiến hành 60 phép thử trong cùng một điều kiện, bằng một phương pháp đo, đã thu được kết quả sau: X(T.độ pư) 2, 68 2, 70 2, 73 2, 74 2, 75 2, 76 2, 76 2, 82 n(Số f thử) 1 4 12 18 17 5 2 1 a) Hãy xác định khoảng tin cậy đối với tốc độ phản ứng trung bình, Biết độ tin cậy β = 99%. b) Người ta xem phản ứng có tốc độ ≥ 2, 74 là phản ứng xảy ra nhanh. Hãy ứơc lượng khoảng tin cậy đối xứng đối với tỷ lệ phản ứng xảy ra nhanh, với mức ý nghĩa α = 5%. HD: a) Đặt 2 2 x = 2, 7418; sb = 0, 0006 ⇒ s = 0, 0006 với β = 99% ⇒ α = 1% ⇒ uα/2 = 2, 58. Áp dụng công thức, có khoảng tin cậy đối xứng đối với phản ứng trung bình là ((µ1; µ2), trong đó s s µ1 = x − uα/2 √ = 2, 7402, µ2 = x + uα/2 √ = 2, 7413 60 60 b) Gọi p là tỷ lệ phản ứng xảy ra nhanh. Ta có n = 60, số phản ứng xảy ra nhanh là k 43 k = 43 ⇒ f = = n 60 Áp dụng công thức ta có khoảng tin cậy đối xứng đối với tỷ lệ phản ứng nhanh là (p ; p ) với mức ý nghĩa α = 5%, u α = 1, 96. 1 2 2 pf(1 − f) p = f − u √ = 0, 6564 1 α/2 n pf(1 − f) p = f + u √ = 0, 6564 2 α/2 n Ví dụ 21. Để thăm dò nhu cầu về một loại hàng ở một thành phố. Người ta đã tiến hành phỏng vấn 500 hộ gia đình thì thấy có 200 hộ có nhu cầu về mặt hàng này. a) Hãy ước lượng số hộ gia đình có nhu cầu về mặt hàng này ở thành phố với độ tin cậy 95%. (Biết tổng số hộ của thành phố là 20000) b) Nếu muốn ước lượng tỷ lệ hộ gia đình có nhu cầu về mặt hàng này đạt độ chính xác 4% thì độ tin cậy là bao nhiêu %?Cho biết φ(1, 83) = 0, 9664 56
  57. 2.3.3 Ước lượng khoảng đối với giá trị phương sai a). Trường hợp đã biết giá trị trung bình. 2 Giả sử X1,X2, , Xn là các biến ngãu nhiên và X ∼ N(µ, σ ) vơi µ đã biết. Khi đó khoảng tin cậy 1 − α của phương sai là: n n ! 1 X 1 X n (x − µ)2; n (x − µ)2 χ2 ( α ) i i χ2 (1 − α ) i i n 2 i=1 n 2 i=1 2 α 2 α trong đó χn( 2 ); χn(1 − 2 ) là giá trị tra trong bảng khi bình phương thỏa mãn điều kiện: 2 2 α 2 2 α P (χ > χ( α )) = ; P (χ > χ(1− α )) = 1 − 2 2 2 2 b. Trường hợp chưa biết giá trị trung bình µ. Khoảng tin cậy 1 − α của phương sai là (n − 1)s2 (n − 1)s2  2 α ; 2 α χn−1( 2 ) χn−1(1 − 2 ) 2 trong đó χp(k) được xác định trong bảng phân phối khi bình phương. 57
  58. BÀI TẬP CHƯƠNG II. Bài tập 49. Một sinh viên đã thống kê lại mức chi tiêu của mình trong mỗi tháng của 1 năm học: (xi: số tiền đơn vị triệu đồng; ni: số tháng) cho dưới bảng số liệu sau: xi 1, 6 1, 5 1, 45 1, 4 1, 35 1, 3 ni 2 2 1 2 3 2 a. Tính độ trung bình mẫu x¯ và phương sai mẫu hiệu chỉnh s2. b. Hãy ước lượng khoảng chi tiêu trung bình của mỗi tháng là bao nhiêu? Bài tập 50. Khảo sát về mức thu nhập trong ngày của một số trẻ em bán vé số trên đường phố thu được số liệu sau: đơn vị ngàn đồng: 15; 25; 18; 15; 20; 15; 20; 21; 25; 18 a. Hãy ước lượng khoảng mức thu nhập trung bình của mỗi em trong một ngày, với độ tin cậy 95%. b. Nếu muốn ước lượng trung bình thu nhập của trẻ em bán vé số với độ tin cậy 97% thì cần độ chính xác là bao nhiêu? Bài tập 51. Để khảo sát việc chi tiêu cho ăn uống của sinh viên tại trường Đại học Đồng Tháp. Ta phỏng vấn 26 sinh viên thì thu được bảng số liệu sau: xi là số tiền, đơn vị ngàn đồng; ni: số sinh viên: xi 15 − 20 20 − 25 25 − 30 30 − 35 35 − 40 40 − 45 ni 3 6 10 6 2 1 a. Hãy ước lượng khoảng mức chi tiêu trung bình cho viêc ăn uống của mỗi sinh viên trong một ngày, với độ tin cậy 99%. Từ kết quả trên hay ước lượng cho 1000 sinh viên. b. Nếu muốn ước lượng mức chi tiêu trung bình cho viêc ăn uống của mỗi sinh viên trong ngày, với độ tin cậy 95% thì cần độ chính xác là bao nhiêu? c. Nếu muốn ước lượng mức chi tiêu trung bình cho viêc ăn uống của mỗi sinh viên trong ngày, với độ tin cậy 90%, độ chính xác là 1,5 thì cần phải phỏng vấn bao nhiêu sinh viên? Bài tập 52. Thực hiện quan sát số lượt người vào một máy rút tiền ATM trong một ngày tại cổng trường Đại học Đồng Tháp thì thấy có 99 người trong đó có 68 là nam giới. a. Hãy ước lượng tỷ lệ người rút tiền tại 1 máy ATM trong 1 ngày là người phụ nữ, với mức ý nghĩa là 90%. b. Nếu muốn ước tỷ lệ lượt người rút tiền là nam giới tại 1 máy ATM trong 1 ngày, với độ tin cậy 99%, độ chính xác 0,06 thì cần quan sát thêm bao nhiêu người nữa? Bài tập 53. Khảo sát về kết quả kỳ thi Anh văn chứng chỉ B của sinh viên tại trường Đại học Đồng Tháp thu được bảng số liệu sau: xi là số điểm(thang điểm 10); ni: số sinh viên: xi 0 − 2 2 − 4 4 − 6 6 − 8 8 − 10 ni 8 10 12 6 14 58
  59. a. Hãy ước lượng khoảng tin cậy trung bình về số điểm của mỗi sinh viên, với độ tin cậy 99%. b. Những sinh viên có điểm từ 6 trở lên là những sinh viên học tốt. Hãy ước lượng tỷ lệ sinh viên học tốt, với độ tin cậy 95% c. Giả sử sinh viên học kém là có điểm dưới 4. Muốn ước lượng sinh viên học kém, với độ tin cậy 90%, thì độ chính xác là bao nhiêu? Bài tập 54. Tỉ lệ chính phẩm của một nhà máy là 90%. Với độ tin cậy 95%, muốn ước lượng tỉ lệ chính phẩm của nhà máy với độ dài khoảng tin cậy không quá 0,02 thì phải kiểm tra ít nhất bao nhiêu sản phẩm? Bài tập 55. Một kho hàng gồm 20.000 chiếc bóng đèn. Lấy mẫu gồm 100 chiếc bóng từ kho hàng ra kiểm tra thì có 60 chiếc đạt chất lượng. Với độ tị cậy 95% a. Hãy ước lượng khoảng tỉ lệ cho mỗi bóng đèn không đạt tiêu chuẩn. b. Hãy tìm khoảng tin cậy số bóng đèn không đạt tiêu chuẩn trong kho của. Bài tập 56. Tại một thành phố có 680 triệu người tham gia bầu cử, người ta phỏng vấn ngẫu nhiên 1000 cử tri thì có 680 của tri ủng hộ một ứng của viên A. Với độ tin cậy 95%, có ít nhất bao nhiêu cử tri của thành phố đó đã ủng hộ ứng cử viên A. Bài tập 57. Để đánh giá số lượng chim quý hiếm trong rừng, người ta bắt 200 con chim và đeo vòng cho chúng, sau đó thả về rừng. Lần thứ hai người ta bắt 100 con thì thấy có 40 con có đeo vòng. Với độ tin cậy là 95% a. Hãy ước lượng số chim trong rừng. b. Nếu muốn sai số ε = 6, độ tin cậy là 95% thì cần phải bắt bao nhiêu con chim? Bài tập 58. Quan sát thu nhập của một số người làm việc ở một công ty, ta có kết quả cho dưới bảng sau: Thu nhập(Ng đ/tháng) Số người Thu nhập(Ng đ/tháng) Số người 500-550 5 750-800 47 550-600 9 800-850 24 600-650 12 850-900 18 650-700 35 900-950 6 700-750 66 950-1000 3 1) Hãy ước lượng thu nhập trung bình của một người ở công ty với độ tin cậy 95% 2) Những người có thu nhập trên 800 ngàn đồng/tháng trở lên là nhứng người có thu nhập cao. Hãy ước lượng tỷ lệ thu nhập cao của một người trong công ty với độ tin cậy là 99% 3) Với mẫu đã cho khi ước lượng thu nhập trung bình của một người ở công ty này, nếu muốn độ tin cậy là 99% thì độ chính xác đạt được bao nhiêu? Bài tập 59. Quan sát năng suất của 100 công nhân trong một xí nghiệp người ta tính được năng suất trung bình của một công nhân ở mẫu này là 12 sản phẩm/ ngày và s2 = 25 1) Hãy ước lượng năng suất trung bình của một công nhân trong xí nghiệp này với độ tin cậy 99% 2) Muốn ước lượng năng suất trung bình của một công nhân trong xí nghiệp với độ tin cậy 95% thì độ chính xác là bao nhiêu? 3) Muốn ước lượng năng suất trung bình của một công nhân trong xí nghiệp với độ tin cậy 99% và độ chính xác la 0,8 thì cần quan sát của bao nhiêu công nhân nữa? 59
  60. Bài tập 60. Để nghiên cứu nhu cầu của một loại hàng ở một khu vực người ta tiến hành khảo sát về nhu cầu mặt hàng này ở 400 hộ gia đình, kết quả khảo sát cho ở bảng sau: Nhu cầu xi(kg/tháng) Số hộ:ni 0-1 10 1-2 35 2-3 86 3-4 132 4-5 78 5-6 31 6-7 18 7-8 10 Giả sử khu vực nghiên cứu có 4000 hộ. 1) Hãy ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong 1 năm với độ tin cậy 95% 2) Khi ước lượng nhu cầu trung bình về mặt hàng này của toàn khu vực trong 1 năm, nếu ta muốn độ tin cậy đạt được 99% và độ chính xác là 4,8 tấn thì cần khảo sát về nhu cầu của mặt hàng này ở bao nhiêu hộ gia đình? Bài tập 61. Điều tra về số liệu thống kê về doanh số bán của một siêu thị cho dưới bảng sau: Doanh số (triệu đồng/ngày)xi Số ngàyni 20-40 5 40-50 10 50-60 20 60-70 25 70-80 25 80-90 15 90-100 10 100-110 8 110-130 3 1) Những ngày có doanh số bán trên 90 triệu đồng là những ngày bán đắt hàng.Hãy ước lượng tỷ lệ những ngày bán đắt hàng ở siêu thị này với độ tin cậy là 96%. 2) Hãy ước lượng doanh số bán trung bình của một ngày "bán đắt" ở siêu thị này với độ tin cậy 95%(giả thiết doanh số bán của những ngày bán đắt hàng là đại lượng ngẫu nhiên có phân phối chuẩn). Bài tập 62. Để đánh giá sức khoẻ của các bé sơ sinh, người ta kiểm tra số đo trọng lượng của các cháu thu được bảng kết quả sau: Xi [1, 7; 2, 1) [2, 1; 2, 5) [2, 5; 2, 9) [2, 9; 3, 3) 3, 3; 3, 7 [3, 7; 4, 1) ni 4 20 21 15 2 3 Biết trọng lượng của bé sơ sinh tuân theo luật phân phối chuẩn. 60
  61. a) Ta quy định bé sơ sinh nặng từ 2, 5kg trở lên là bé khoẻ. Hãy tìm khoảng ước lượng tỉ lệ bé khoẻ với độ tin cậy 99%. b) Hãy tìm khoảng tin cậy cho trọng lượng trung bình của bé sơ sinh với mức ý nghĩa α = 0, 05. Bài tập 63. Đo chiều cao 100 sinh viên ta thu được kết quả sau: Xi(c.cao) 1, 52 − 1, 56 1, 56 − 1, 60 1, 60 − 1, 64 1, 64 − 1, 68 1, 68 − 1.72 ni(số.sv) 25 35 18 12 10 Biết rằng chiều cao là biến ngẫu nhiên tuân theo luật phân phối chuẩn với σ = 0, 04m. Hãy tính khoảng tin cậy đối với chiều cao trung bình của các sinh viên với mức ý nghĩa α = 0, 05. Bài tập 64. Ở một cửa hàng chế biến thủy sản, theo dõi nhu cầu của mặt hàng nước mắm trong một số ngày, ta có kết quả: Số bán ra (lít) Số ngày 20-30 3 30-40 8 40-50 30 50-60 45 60-70 20 70-80 25 80-90 17 90-100 9 100-110 3 a) Hãy ước lượng nước mắm trung bình bán một ngày với độ tin cậy 99% trong hai trường hợp: + Biết phương sai σ2 = 132, 25 + Chưa biết σ2 b) Hãy ước lượng phương sai của lượng nước mắm bán trong ngày với độ tin cậy 95%. Bài tập 65. Người ta đo đường kính của 100 chi tiết máy, kết quả được cho trong bảng dưới đây: S.đo X đ.k(mm) 98 98,5 99 99,5 100 100,5 101 101,5 102 102,5 Số c.t m.có s.đo X 21 47 87 158 181 201 142 97 40 26 a) Hãy tìm khoảng tin cậy giành cho đường kính trung bình của một chi tiết máy có độ tin cậy 99, 73%. b) Hãy ước lượng phương sai của số đo X với độ tin cậy 95% giả thiết X có phân phối chuẩn. 61
  62. c) Muốn dùng trung bình đường kính trong mẫu để ước lượng đường kính trung bình trong toàn bộ thì có thể đạt độ tin cậy là bao nhiêu nếu lấy độ chính xác là 2 mm. d) Cũng như câu c, nhưng muốn độ tin cậy 68% thì độ chính xác là bao nhiêu? e) Gọi các trục có đường kính dưới 100 mm là loại nhỏ. Hãy ước lượng loại nhỏ. f) Muốn ướ lượng tỉ lệ lọai nhỏ với độ tin cậy 68% và độ chính xác 5% thì cần đo thêm bao nhiêu trục máy? g) Để độ chính xác khi ước lượng trung bình là 2 mm và độ chính xác khi ước lượng tỉ lệ loại nhỏ là 8% với cùng độ tin cậy 68% thì cần điều tra thêm ít nhất bao nhiêu trục máy. Bài tập 66. . Cho X (đơn vị %) và Y (đơn vị: kg/cm2) là hai chỉ tiêu chất lượng của một loại sản phẩm. Tiến hành kiểm tra một số sản phẩm, người ta thu được kết quả thu được dưới bảng sau: Y X 30-35 35-40 40-45 45-50 130-135 3 135-140 3 14 18 140-145 11 20 145-150 3 17 5 150-160 2 4 a) Hãy ước lượng giá trị trung bình của chỉ tiêu Y của những sản phẩm có chỉ tiêu X trong khoảng (35-40) với độ tin cậy 95% b) Nếu muốn ước lượng giá trị trung bình của chỉ tiêu X với độ chính xác 0,5% thì độ tin cậy là bao nhiêu Bài tập 67. Một phương pháp điều trị mới đang được xem xét để đánh giá tính hiệu quả của nó. Một chỉ tiêu đánh giá là số ngày trung bình µ từ lúc điều trị cho đến lúc bệnh nhân khỏi bệnh. Một mẫu ngẫu nhiên gồm 11 bệnh nhân được theo dõi và số ngày điều trị cho tới khi khỏi được ghi lại như sau: 4, 4, 3, 8, 5, 6, 7, 12, 5, 3, 8. Tìm khoảng tin cậy 95% cho số ngày trung bình µ. Bài tập 68. Trong một cuộc khảo sát 64 khách hàng ở một tiệm ăn nhanh, thời gian đợi trung bình là 3 phút và độ lệch tiêu chuẩn là 1,5 phút. Tìm khoảng tin cậy 98% cho thời gian đợi phục vụ trung bình của tiệm ăn này. Bài tập 69. Trong một cuộc điều tra 150 người nghiện thuốc lá được chọn ngẫu nhiên. Người ta tính được số điếu thuốc hút trong một tuần của họ có trung bình là 97 và độ lệch tiêu chuẩn là 36. Tim khoảng tin cậy 99% cho số điếu thuốc hút trung bình 1 tuần của người nghiện thuốc lá Bài tập 70. Một cuộc nghiên cứu trên 500 em bé 6 tuổi cho thấy số giờ xem tivi trung bình trong 1 tuần của nhóm này là 38 giờ với độ lệc tiêu chuẩn là 6,4 giờ. Tìm khoảng tin cậy 99% cho thời gian xem tivi trung bình trong một tuần của các em bé nhỏ 6 tuổi. Bài tập 71. Một công ty lớn muốn ước lượng trung bình một ngày một thư ký phải đánh máy bao nhiêu trang giáy. Một mẫu gồm 50 thư ký được chọn ngẫu nhiên cho tháy số trang trung bình mà họ đánh máy là 32 và độ lệch tiêu chuẩn là 6. Tìm khoảng 62
  63. tin cậy 99% cho số trang trung bình mà một thư ký của công ty đánh máy trong một ngày Bài tập 72. Một nhà sưu tập tem thảo giá chiếc tem A trong 9 chủa hàng thì thấy giá trung bình là 17 $ với độ lệch tiêu chaaurn là 39. Tìm khoảng tin cậy 90% cho giá trung bình của chiếc tem này trong tất cả các cửa hàng bán tem. Bài tập 73. Chọn ngẫu nhiên 12 lớp trung học trong một thành phố A tính được số học sinh trung bình trong một lớp là 28 với độ lệch tiêu chuẩn là 15. Tìm khoảng tin cậy 99% cho số học sinh trung bình trong một lớp ở vùng đó Bài tập 74. Khảo sát 18 giám đốc các công ty ở Mỹ cho thấy lương trung bình hàng năm của họ là 275000 USD với độ lệch tiêu chuẩn là 62000USD. Tìm khoảng tin cậy 90% cho mức lương trung bình hàng năm của các giám đốc công ty Mỹ Bài tập 75. Một người định mua một chiếc đĩa compact(CD) đi khảo giá loại đĩa này ở 8 của hàng. Anh ta thấy giá bán ở đó như sau: 138, 149, 129, 135, 145, 125, 139, 142 (đơn vị là nghìn đồng). Tìm khoảng tin cậy 90% cho giá của chiếc đĩa CD này. Bài tập 76. Trong một cuộc thăm dò ý kiến 100 khách hàng người ta thấy 55 người thích mặt hàng A hơn mặt hàng B. Tìm khoảng tin cậy 90% cho tỷ lệ người tiêu dùng ưa thích mặt hàng A Bài tập 77. Cơ quan cảng sát giao thông kiểm tra hệ thống phanh của 40 chiếc xe tải trên đường quốc lộ. Họ phát hiện 14 chiếc có phanh chưa đảm bảo an toàn. a) Tìm khoảng tin cậy 95% cho tỷ lệ xe tải có phanh chưa an toàn. b) Tìm khoảng tin cạy 98% cho tỷ lệ xe tải có phanh tốt. Bài tập 78. Chọn ngẫu nhiên 200 sinh viên ta thấy 37% em không ở nội trú. Tìm khoảng tin cậy 90% cho tỷ lệ sinh viên ngoại trú Bài tập 79. Một cuộc điều tra cho thấy trong 2074 gia đình trí thức có 373 gia đình có máy vi tính ở nhà. Tìm khoảng tin cậy 96% cho tỷ lệ những gia đình trí thức có máy vi tính tại nhà Bài tập 80. Người ta muốn tìm khoảng tin cậy 90% cho điểm thi tốt nghiệp phổ thông cơ sở với độ chính xác 0,2. Một mẫu điều tra sơ bộ cho thấy s = 1, 2. Tìm kích thước mẫu n Bài tập 81. Người ta muốn tìm khoảng tin cậy 95% cho tỷ lệ những gia đình có máy giặt với độ chính xác 0,04. Một mẫu điều tra sơ bộ cho thấy f = 0, 72. Tìm kích thước mẫu n 63
  64. Chương 3 Kiểm định giả thiết 3.1 Đặt vấn đề Trong thực tế chúng ta thường gặp hai giả thiết trong một vấn đề: H: X có tính chất A nào đó (giả thiết). K: X không có tính chất A (đối thiết). Bằng số liệu thống kê người ta có thể đưa ra được kết luận về một giả thiết nào đó với độ tin cậy β (cho trước) Trong quá trình kiểm định giả thiết thì thường mắc phải hai sai lầm: + Sai lầm loại 1: Chấp nhận K khi H đúng. + Sai lầm loại 2: Chấp nhận H khi K đúng. P {SLL1} = P {chấp nhận K khi H đúng} = α mức ý nghĩa của tiêu chuẩn. P {SLL2} = P {chấp nhận H khi K đúng} = γ. Với γ lực lượng tiêu chuẩn. 3.2 Kiểm định về giá trị trung bình 3.2.1 Trường hợp σ2 đã biết Bài toán 1: (Kiểm định hai phía). ( H : µ = µ0 K : µ 6= µ0 với mức ý nghĩa α. x−µ √ Ta xét test thống kê t = σ n, (t xuất phát từ khoảng ước lượng trung bình) Nếu H đúng thì x − µ √ t = 0 n ∼ N(0, 1) σ 64
  65. Miền bác bỏ H là |t| > uα/2 với xác suất là α. P {|t| > uα/2} = α ⇒ P {|t| ≤ uα/2} = 1 − α x − µ √ ⇒ P {−u ≤ 0 n ≤ u } = 1 − α α/2 σ α/2 Với uα/2 được xác định bởi Z uα/2 1 −t2/2 α φ(uα/2) = √ e dt = 1 − 2π −∞ 2 Kết luận: Nếu |t| ≤ uα/2 chấp nhận H. Nếu |t| > uα/2 chấp nhận K. Chú ý: α = 1% ⇒ uα/2 = 2, 58 α = 5% ⇒ uα/2 = 1, 96 Ví dụ 22. Khối lượng quy định cho mỗi gói mì là 80g. Kiểm tra bất thường 100 gói sau một ca sản xuất người ta thấy khối lượng trunh bình là 79,92g. Biết rằng khối lượng gói mì tuân theo luật phân phối chuẩn với σ2 = 0, 1584 với mức ý nghĩa là α = 5%. Hãy kiểm tra về chất lượng của ca làm việc. HD: Gọi µ là khối lượng trung bình của gói mì Xét bài toán ( H : µ = 80 K : µ 6= 80 x−µ √ Xét Test thống kê t = σ n. 2 với n = 100, σ = 0, 1584, x = 79, 92 , µ0 = 80 ta có 79, 92 − 80√ t = √ 100 = −2, 02 0, 1584 Ta có α = 5% ⇒ uα/2 = 1, 96 ⇒ |t| = 2, 02 > 1, 96 với mức ý nghĩa α = 5% ta chấp nhận K, tức là ta có thể kết luận ca làm việc chưa đạt ưu cầu với mức ý nghĩa α = 5%. Bài toán 2: (Kiểm định 1 phía) ( ( H : µ = µ (x >> µ ) H : µ = µ (x µ0 K : µ < µ0 65
  66. Trường hợp 1 ( H : µ = µ0 (x >> µ0) K : µ > µ0 √ x−µ0 Xét Test thống kê t = σ n +) Nếu H đúng t ∼ N(0, 1) miền bác bỏ H là {t > uα} ,P {t > uα} = α ⇒ P {t ≤ uα} = 1 − α Z uα 2 1 − t ⇔ φ(uα) = √ e 2 dt = 1 − α −∞ 2π ( 1, 65 nếu α = 5% uα = 2, 33 nếu α = 1% +) Quy tắc: ( ( t ≤ u : chấp nhận H u = 1, 65 nếu α = 5% α với α t > uα : chấp nhận K uα = 2, 33 nếu α = 1% Trường hợp 2 ( H : µ = µ0 (x << µ0) K : µ < µ0 √ x−µ0 Xét Test thống kê t = σ n Hoàn toàn tương tự ta có quy tắc ( t ≥ −uα : chấp nhận H t < −uα : chấp nhận K Ví dụ 23. Tốc độ trung bình của xe gắn máy là 45km/h. Sau khi triển khai bắn tốc độ, người ta kiểm tra 121 người điều hành phương tiện tính được vận tốc trung bình x = 43km/h. Biết vận tốc xe máy tuân theo luật phân phối có σ = 8, 577 với mức ý nghĩa là α = 1%. Hãy kiểm tra xem việc bắn tốc độ có làm giảm vận tốc trung bình của xe mô tô hay không. HD: Ta có µ0 = 45km/h x = 43km/h σ = 8, 577 Xét bài toán kiểm định ( H : µ = 45 µ là vận tốc trung bình của xe K : µ < 45 (x = µ < µ0) 66
  67. Xét Test thống kê x − µ √ 43 − 45√ t = 0 n = 121 = −2, 57 σ 8, 577 với α = 1% ⇒ uα = 2, 33 ⇒ t uα/2} = α với α mức ý nghĩa P {|t| ≤ uα/2} = 1 − α suy ra x − µ √ P {−u } ≤ 0 n ≤ u } = 1 − α α/2 s α/2 Với uα/2 được xác định bởi Z uα/2 1 −t2/2 α φ(uα/2) = √ e dt = 1 − 2π 0 2 Quy tắc: +) |t| ≤ uα/2 chấp nhận H. +)|t| > uα/2 chấp nhận K. Bài toán 2. (Kiểm định 1 phía) ( ( H : µ = µ H : µ = µ 0 hoặc 0 K : µ > µ0 K : µ < µ0 Xét Test thống kê x − µ √ t = 0 n s 67
  68. Hoàn toàn tương tự quy tắc trên. Trường hợp 1: +) t ≤ uα chấp nhận H. +) t > uα chấp nhận K. ( 1, 65 : nếu α = 5% uα = 2, 33 : nếu α = 1% Trường hợp 2: ( H : µ = µ0 K : µ |t| chấp nhận H, tức là chiều cao trung bình của sinh viên là 1,67. Ví dụ 25. Đo chỉ số mở trong sữa của 130 con bò lai Hà -Ấn ta có số liệu. Gọi X là tỉ lệ mở trong sữa, ni là số bò lai. 68
  69. xi 3.0; 3.6 3.6; 4.2 4.2; 4.8 4.8; 5.4 5.4; 6.0 6.0; 6.6 6.6; 7.2 ni 2 8 35 43 22 15 5 Biết rằng chỉ số mở trong sữa bò Hà Lan thuần chủng là 4,95 với mức ý nghĩa là α = 1%. Hãy kiểm tra xem việc lai tạo có làm tăng tỉ lệ mở trong sữa không? HD: Gọi µ là tỷ lệ mở trong trong sữa bò lai Hà-Ấn. Xét bài toán kiểm định giả thiết ( H : µ = 4, 95 K : µ > 4, 95 Xét Text thống kê x − µ √ t = 0 n s với µ0 = 4, 95 ; n = 130. Tính x; s từ bảng trên được x = 5, 146 , s2 = 0, 589 ⇒ t = 2, 914 vì α = 1% ⇒ uα = 2, 33 ⇒ t > 2, 33 suy ra chấp nhận K, có nghĩa là việc lai tạo đã làm tăng tỷ lệ mở trung bình trong sữa. 3.2.3 Trường hợp σ chưa biết và n t(n−1,α/2)} = α với α mức ý nghĩa P {|t| ≤ t(n−1,α/2)} = 1 − α suy ra x − µ √ P {−t ≤ 0 n ≤ t } = 1 − α (n−1,α/2) s (n−1,α/2) 69
  70. Với t(n−1,α/2) được xác định từ bảng phân phối Student bậc tự do n-1 Quy tắc: +) |t| ≤ t(n−1,α/2) chấp nhận H. +) |t| > t(n−1,α/2) chấp nhận K. Bài toán 2. (Kiểm định 1 phía) ( ( H : µ = µ H : µ = µ 0 hoặc 0 K : µ > µ0 K : µ t(n−1,α) chấp nhận K. +) t ≤ t(n−1,α) chấp nhận H. Trường hợp 2 ( H : µ = µ0 K : µ < µ0 +) t < −t(n−1,α) chấp nhận K. +) t ≥ −t(n−1,α) chấp nhận H. Ví dụ 26. Một công ti sản xuất pin tuyên bố rằng pin của họ có tuổi thọ trung bình 21,5 giờ. Một cơ quan kiểm tra chất lượng kiểm tra 6 chiếc pin của công ti và thu được số liệu sau đây về tuổi thọ của 6 chiếc pin này là 19, 18, 22, 20, 16, 25 Kết quả này có xác nhận là quảng cáo của công ti là đúng hay không?Mức ý nghĩa được chọn là α = 0, 05. HD Xét bài toán ( H : µ = 21, 5 K : µ 6= 21, 5 √ Ta có x = 20, s = 10 Xét t = −1, 16; |t| = 1, 16 Tra bảng phân phối Student với bậc tự do n-1=5 ta có t(5,0.05) = 2, 57. Vậy |t| < t(5,0.05) nên chưa có cơ sở bác bỏ H, số liệu này xác nhận lời quảng cáo của công ti. Ví dụ 27. Một bản nghiên cứu thông báo rằng mức mức tiền dùng hàng tháng của sinh viên là 420 nghìn. Để kiểm tra người ta chọn ngẫu nhiên 16 sinh viên và tìm được trung bình mỗi tháng họ tiêu 442 nghìn đồng với độ lệch tiêu chuẩn là 60 nghìn đồng. 70
  71. Với mức ý nghĩa 5% nhận định xem kết luận báo cáo có thấp hơn so với sự thật hay không? HD Xét bài toán ( H : µ = 420 K : µ > 420 Ta có t = 1, 47, t(15,0.05) = 1, 75 nên t 12 Ta tính được t = 0, 798, t(7,0.05) = 1, 895 nên t < t(7,0.05) Chấp nhận H, nghĩa là thông báo trên không cao hơn so với thực tế. 3.3 Kiểm định tỷ lệ 3.3.1 Bài toán hai phía ( H : p = p0 K : p 6= p0 r với p0 là hằng số cho trước k Quan sát n phần tử của tập chính Ω. k là số phần tử xuất hiện tính chấtA ⇒ f = n là tần suất xuất hiện tính chất A trong n phép thử. Theo định lý giới hạn trung tâm ta có: f − p √ n ∼ N(0, 1) pp(1 − p) 71
  72. với p là xác suất xuất hiện tính chất A ở một phép thử. Nếu H đúng thì f − p0 √ p n ∼ N(0, 1) p0(1 − p0) với mức ý nghĩa α thì f − p0 √ P {p n > uα/2} = α p0(1 − p0) f − p0 √ ⇒ P {p n ≤ uα/2} = 1 − α p0(1 − p0) Với uα/2 được xác định bởi Z uα/2 1 −t2/2 α φ(uα/2) = √ e dt = 1 − 2π 0 2 Quy tắc: Xét f − p0 √ t = p n p0(1 − p0) + Nếu |t| ≤ uα/2 chấp nhận H. + Nếu |t| > uα/2 chấp nhận K với α = 5% ⇒ uα/2 = 1, 96; α = 1% ⇒ uα/2 = 2, 58. 3.3.2 Bài toán một phía ( ( H : p = p H : p = p 0 hoặc 0 K : p > p0 K : p p0 + Nếu t > uα chấp nhận K. + Nếu t ≤ uα chấp nhận H. với ( 1, 65 : nếu α = 5% 2, 33 : nếu α = 1% 72
  73. b) Với bài toán ( H : p = p0 K : p < p0 + Nếu t < −uα chấp nhận K. + Nếu t ≥ −uα chấp nhận H. với uα xác định bởi Z uα 2 1 − t φ(uα) = √ e 2 dt = 1 − α −∞ 2π ( 1, 65 : nếu α = 5% 2, 33 : nếu α = 1% 1 Ví dụ 29. Giả sử xác suất sinh con trai là p0 = 2 quan sát 10 gia đình có 43 người con trong đó co 18 người con trai với mức ý nghĩa α = 5%. Hỏi có sự lệch quy luật hay không? HD: 1 Ta có n = 43, k = 18, p0 = 2 k 18 ⇒ f = = = 0, 4186 n 43 Xét bài toắn kiểm định ( 1 H : p = 2 1 K : p 6= 2 Xét Test thống kê f − p0 √ t = p n = −1, 08 p0(1 − p0) ⇒ |t| = 1, 082 < 1, 96 = uα Suy ra chấp nhận H, tức là không có sự sai về quy luật. Ví dụ 30. Một Đảng chính trị trong cuộc bầu cử tổng thống tuyên bố rằng có 45% cử tri bỏ phiếu ủng hộ ông A. Người ta thăm dò 200 củ tri thấy 80 cử tri bỏ phiếu ủng hộ ông A, với α = 5%. Hãy kiểm tra xem dự đoán trên có quá so với thực tế không? HD: Xét bài toán kiểm định ( H : p = 0, 45 K : p < 0, 45 80 với n = 200 , k = 80 ; p0 = 0, 45 ; f = 200 = 0, 4 f − p √ ⇒ t = 0 n = −1, 443 pf(1 − f) α = 5% → uα = 1, 96 ⇒ t ≥ −uα chấp nhận H. 73
  74. Ví dụ 31. Khảo sát 3 tháng cuối của năm 2008 tại phòng đọc thư viện trường Đại học thì thông kê được 70% sinh viên của trường đến phòng đọc. Đến 3 tháng đầu năm 2009 kiểm tra 100 sinh viên thì có 80 sinh viên đến phòng đọc. Hyax nhận định tỷ lệ sinh viên đến phòng đọc ở 3 tháng đầu năm 2009 có tăng hơn so với 3 tháng cuối của năm học 2008 hay không?với mức ý nghĩa 5%. HD. Xét bài toán H : p = 0, 7; K : p > 0, 7. Khi đó tính được t = 2, 1822 > 1, 65 = uα nên chấp nhận K nghĩa là 3 tháng đầu năm 2009 số sinh viên đến thư viện đọc sách tăng lên. 3.4 Kiểm định phương sai 3.4.1 Trường hợp chưa biết biết µ Bài toán 1. (Kiểm định 2 phía) ( 2 2 H : σ = σ0 2 2 K : σ 6= σ0 Xét 2 2 (n − 1)s χ = 2 σ0 Khi H đúng thì χ2 ∼ χ2(n − 1). với χ2(n − 1) tra ở bảng phân phối khi bình phương Quy tắc: 2 2 2 + Nếu χ1−α/2(n − 1) ≤ χ ≤ χα/2(n − 1) thì chấp nhận H. 2 2 2 2 + Nếu χ > χα/2(n − 1) hoặc χ σ0 Xét 2 2 (n − 1)s χ = 2 σ0 Khi H đúng thì χ2 ∼ χ2(n − 1). Quy tắc: 2 2 + Nếu χ ≤ χα(n − 1) thì chấp nhận H. 2 2 + Nếu χ > χα(n − 1) thì chấp nhận K. Trường hợp 2 ( 2 2 H : σ = σ0 2 2 K : σ < σ0 74
  75. Xét (n − 1)s2 u = 2 σ0 Khi H đúng thì u ∼ χ2(n − 1). Quy tắc: 2 2 + Nếu χ > χ1−α(n − 1) thì chấp nhận H. 2 2 + Nếu χ ≤ χ1−α(n − 1) thì chấp nhận K. 3.4.2 Trường hợp đã biết biết µ = µ0 Bài toán 1. (Kiểm định 2 phía) ( 2 2 H : σ = σ0 2 2 K : σ 6= σ0 Xét n X 2 ni(xi − µ0) 2 i=1 χ = 2 σ0 Khi H đúng thì χ2 ∼ χ2(n). với χ2(n) tra ở bảng phân phối khi bình phương Quy tắc: 2 2 2 + Nếu χ1−α/2(n) ≤ χ ≤ χα/2(n) thì chấp nhận H. 2 2 2 2 + Nếu χ > χα/2(n) hoặc χ σ0 Xét n X 2 ni(xi − µ0) 2 i=1 χ = 2 σ0 Khi H đúng thì χ2 ∼ χ2(n). Quy tắc: 2 2 + Nếu χ ≤ χα(n) thì chấp nhận H. 2 2 + Nếu χ > χα(n) thì chấp nhận K. Trường hợp 2 ( 2 2 H : σ = σ0 2 2 K : σ < σ0 75