Bài giảng Lý thuyết sác xuất và thống kê toán - Chương 4: Dữ liệu thống kê - Lê Trường Giang
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Lý thuyết sác xuất và thống kê toán - Chương 4: Dữ liệu thống kê - Lê Trường Giang", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- bai_giang_ly_thuyet_sac_xuat_va_thong_ke_toan_chuong_4_du_li.pdf
Nội dung text: Bài giảng Lý thuyết sác xuất và thống kê toán - Chương 4: Dữ liệu thống kê - Lê Trường Giang
- TRƯỜNG ĐẠI HỌC TÀI CHÍNH-MARKETING KHOA CƠ BẢN BỘ MƠN TỐN – THỐNG KÊ BÀI GIẢNG LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TỐN Giảng viên ThS. Lê Trường Giang
- LÝ THUYẾT MẪU Bài 1. TỔNG THỂ VÀ MẪU 1. Khái niệm về tổng thể và mẫu 2. Mẫu ngẫu nhiên và mẫu cụ thể 3. Hàm phân phối thực nghiệm Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 1. Thống kê 2. Trung bình mẫu ngẫu nhiên 3. Tỉ lệ mẫu ngẫu nhiên 4. Phương sai mẫu ngẫu nhiên 5. Phương sai mẫu cĩ điều chỉnh
- Chương 4. DỮ LIỆU THỐNG KÊ Bài 1. TỔNG THỂ VÀ MẪU 1. Khái niệm về tổng thể và mẫu 2. Mẫu ngẫu nhiên và mẫu cụ thể 3. Hàm phân phối thực nghiệm
- Bài 1. TỔNG THỂ VÀ MẪU Lấy mẫu ngẫu nhiên Tổng thể Mẫu X: Biến ngẫu nhiên tổng thể n: Kích thước mẫu. N: Kích thước tổng thể. X : Trung bình mẫu. : Trung bình tổng thể. S : Độ lệch chuẩn mẫu. : Độ lệch chuẩn tổng thể. F : tỷ lệ mẫu. p: tỷ lệ tổng thể. n Ước lượng tham số Kiểm định giả thuyết
- Bài 1. TỔNG THỂ VÀ MẪU 2. Mẫu nghẫu nhiên và mẫu cụ thể a. Mẫu ngẫu nhiên Mẫu ngẫu nhiên kích thước n được lập từ tổng thể X là một bộ gồm n biến ngẫu nhiên Xi, i 1,2, , n độc lập và cùng phân phối với biến ngẫu nhiên X, kí hiệu là WXXXnn 12, , , . b. Mẫu cụ thể Mẫu ngẫu nhiên này nhận n giá trị cụ thể X1 x 1, X 2 x 2 , , Xnn x . Khi đĩ một bộ gồm n giá trị wnn x12 , x , , x được gọi là một mẫu cụ thể cĩ kích thước n.
- Bài 1. TỔNG THỂ VÀ MẪU 2. Mẫu nghẫu nhiên và mẫu cụ thể c. Ví dụ Thu nhập hàng tháng của mỗi gia đình tỉnh A (đơn vị triệu đồng). {100,121, 230, 89, 197, }. Tập giá trị của biến ngẫu nhiên tổng thể X chỉ thu nhập của mỗi gia đình tỉnh A. Một mẫu ngẫu nhiên gồm 50 hộ gia đình trong tỉnh A. {X1, X2, X50 }. Một mẫu cụ thể {121, 203, 92, 120} gồm 50 giá trị thu nhập của 50 hộ gia đình.
- Bài 1. TỔNG THỂ VÀ MẪU 2. Mẫu nghẫu nhiên và mẫu cụ thể Bảng phân phối thực nghiệm của mẫu cụ thể Mẫu cụ thể wnn x12 , x , , x , x1 < x2 < < xk và n12 n nk n . Bảng phân phối tần số thực nghiệm xi x1 x2 xk ni n1 n2 nk Bảng phân phối tần suất thực nghiệm xi x1 x2 xk fi f1 f2 fk n Trong đĩ, f i . i n
- Bài 1. TỔNG THỂ VÀ MẪU 2. Mẫu nghẫu nhiên và mẫu cụ thể Bảng phân phối thực nghiệm của mẫu cụ thể VD 1. Kiểm tra ngẫu nhiên 50 sinh viên. Ta sắp xếp điểm số X thu được theo thứ tự tăng dần và số sinh viên n cĩ điểm tương ứng vào bảng như sau: (điểm) 2 4 5 6 7 8 9 10 (số SV) 4 6 20 10 5 2 2 1
- Bài 1. TỔNG THỂ VÀ MẪU 2. Mẫu nghẫu nhiên và mẫu cụ thể Bảng phân phối thực nghiệm của mẫu cụ thể Giá trị của mẫu cụ thể dạng ghép lớp xii; x h x11; x h x22; x h xkk; x h ni n1 n2 nk Trong trường hợp này ta sử dụng giá trị trung bình trên từng khoảng xi x1 x2 xk ni n1 n2 nk x x h với x ii i 2
- Bài 1. TỔNG THỂ VÀ MẪU 2. Mẫu nghẫu nhiên và mẫu cụ thể VD 2. Đo chiều cao X (cm) của n 100 thanh niên. Vì chiều cao khác nhau nên để tiện việc sắp xếp, người ta chia chiều cao thành nhiều khoảng. Các thanh niên cĩ chiều cao trong cùng 1 khoảng được xem là cao như nhau. Khi đĩ, ta cĩ bảng số liệu ở dạng khoảng như sau: X 148-152 152-156 156-160 160-164 164-168 n 5 20 35 25 15 Khi cần tính tốn, người ta chọn số trung bình của mỗi khoảng để đưa số liệu trên về dạng bảng: X 150 154 158 162 166 n 5 20 35 25 15
- Bài 1. TỔNG THỂ VÀ MẪU 3. Hàm phân phối thực nghiệm Giả sử XXX12; ; ; n là một mẫu ngẫu nhiên được xây dựng từ đại lượng ngẫu nhiên X với hàm phân phối xác suất FxX . Định nghĩa: Hàm phân phối thực nghiệm ngẫu nhiên tương ứng với mẫu , kí hiệu là Fxn , xác định bởi cơng thức sau 0 nếux min( X12 , X , , Xn ), k Fxn nếu có k phần tử trong mẫu < x, n 1 nếux max( X12 , X , , Xn ).
- Bài 1. TỔNG THỂ VÀ MẪU 3. Hàm phân phối thực nghiệm Định lí Glivenko: P lim sup FnX x F x 0 1 n x Ý nghĩa: Hàm phân phối thực nghiệm là một xấp xỉ của hàm phân phối lý thuyết. Xấp xỉ đĩ càng tốt khi cỡ mẫu n càng lớn.
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 1. Thống kê 2. Trung bình mẫu ngẫu nhiên 3. Tỉ lệ mẫu ngẫu nhiên 4. Phương sai mẫu ngẫu nhiên 5. Phương sai mẫu cĩ điều chỉnh
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 1. Thống kê Thống kê là một hàm xác định trên các biến ngẫu nhiên của mẫu. Một thống kê của mẫu WXXXnn 12, , , được kí hiệu là GGXXX 1, 2, , n . 1 Chẳng hạn, XXXX là một thống kê trên mâu n 12 n ngẫu nhiên Wnn XXX12 , , , .
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 2. Trung bình mẫu ngẫu nhiên Mẫu ngẫu nhiên WXXXnn 12, , , , trung bình mẫu ngẫu nhiên là một thống kê X được xác định 1 XXXX . n 12 n Mẫu cụ thể wnn x12 , x , , x , trung bình thực nghiệm x được cho bởi 1 n 1 n x xi x nii x . n i 1 n i 1 Một số đặc trưng của trung bình mẫu ngẫu nhiên 2 i. EX ii. VXar n 2 Xn iii. Nếu XN, 2 thì XN , và N 0;1 . n
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 2. Trung bình mẫu ngẫu nhiên Ví dụ 1. Chiều cao (cm) của một loại cây cơng nghiệp là BNN tuân theo luật phân phối chuẩn với trung bình là 75 và độ lệch chuẩn là 10. Người ta đo ngẫu nhiên 25 cây loại trên, tính xác suất để chiều cao trung bình của 25 cây đĩ nằm trong khoảng từ 71cm đến 79cm ĐS: 0,9554
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 2. Trung bình mẫu ngẫu nhiên Định lý giới hạn trung tâm. Cho mẫu ngẫu nhiên WXXXnn 12, , , được thành lập từ biến ngẫu nhiên X cĩ kỳ vọng , phương sai 2 . Khi đĩ x 2 x t X 1 limP x e2 dt P Z x , Z N 0;1 . n 2 n Xn Nhận xét. Khi n 30 ta cĩ thể xem thống kê cĩ luật phân phối chuẩn tắc N 0;1 cho dù biến ngẫu nhiên tổng thể X cĩ bất kì phân phối nào.
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 3. Tỉ lệ mẫu ngẫu nhiên Mẫu WXXXnn 12, , , được lập từ tổng thể X B 1; p , khi đĩ trung 1 n bình XX i được gọi là tỉ lệ mẫu ngẫu nhiên, kí hiệu là Fn . n i 1 Ta tính được các đặc trưng sau 1 n pp 1 i, E F E X p. ii. VFar . ni n n n i 1 Mẫu cụ thể wnn x12 , x , , x , ta cĩ tỉ lệ phần tử cĩ tính chất A trong mẫu là n 1 nA fx i nni 1 với nA là số phần tử cĩ tính chất A.
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 3. Tỉ lệ mẫu ngẫu nhiên Định lý De Moivre – Laplace, từ mẫu ngẫu nhiên WXXXnn 12, , , 1 n được lập từ tổng thể X B 1; p , tỉ lệ mẫu là FXni , n i 1 x ta cĩ Fp limP n x . P Z x , Z N 0;1 . n pp 1 n Cụ thể n>30; n.p >5 và n(p-1) > 5 ta cĩ thể sử dụng xấp xỉ trên. Fp n N 0;1 . pp 1 n
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 4. Phương sai mẫu ngẫu nhiên Cho mẫu ngẫu nhiên WXXXnn 12, , , được lập từ tổng thể X cĩ kỳ vọng và phương sai 2 , thống kê S n 2 1 2 SXX i n i 1 được gọi là phương sai mẫu. 2 Độ lệch chuẩn mẫu được định nghĩa SS . Chú ý. Thống kê S cịn được viết dưới dạng sau n 2 1 2222 SXXXX ii . n i 1
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 5. Phương sai mẫu cĩ điều chỉnh Cho mẫu ngẫu nhiên WXXXnn 12, , , được lập từ tổng thể X cĩ kỳ vọng và phương sai 2 , thống kê S n 2 1 2 SXX i . n 1i 1 được gọi là phương sai mẫu điều chỉnh. Độ lệch chuẩn mẫu điều chỉnh được định nghĩa SS 2 .
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. 5. Phương sai mẫu cĩ điều chỉnh Chú ý. Ta cĩ thể biểu diễn phương sai mẫu điều chỉnh n 2 1 2 n 2 S XXi . nn 11i 1 Mẫu cụ thể wnn x12 , x , , x kích thước n được cho theo bảng tần số sau xi x1 x2 xk ni n1 n2 nk k nni i 1 Khi đĩ, sai sai mẫu điều chỉnh được cho bởi k 1 2 s22 n x n x . n 1 ii i 1
- Bài 2. CÁC ĐẶC TRƯNG CỦA MẪU VÀ PHÂN PHỐI XÁC SUẤT. Ví dụ 2. Thống kê lượng đường cát trắng bán ra mỗi ngày của của hàng A cho trong bảng sau 25 27,5 22 25 18 16 20 21,5 16 25 18 17,5 21,5 30 18 25 19,5 20 18,5 21 Tính trung bình và độ lệch chuẩn mẫu điều chỉnh?
- Mơ tả sự biến thiên của số trung bình: sai số chuẩn (Trích bài giảng của GS. Nguyễn Văn Tuấn – Australia) • Nếu chúng ta chọn mẫu N lần (mỗi lần với n đối tượng), thì chúng ta sẽ cĩ N số trung bình. Độ lệch chuẩn của N số trung bình này chính là sai số chuẩn. Do đĩ, sai số chuẩn phản ảnh độ dao động hay biến thiên của các số trung bình mẫu (sample averages). • Cơng thức tính sai số chuẩn (SE – standard error): s SE . n
- Ý nghĩa của độ lệch chuẩn và sai số chuẩn • Gọi số trung bình của một quần thể là μ (nên nhớ rằng chúng ta khơng biết giá trị của μ). Gọi số trung bình tính từ mẫu là x và độ lệch chuẩn là s. Theo lý thuyết xác suất của phân phối chuẩn, chúng ta cĩ thể nĩi rằng: . 95% cá nhân trong quần thể đĩ cĩ giá trị từ xs1,96 đến xs1,96 . . 95% số trung bình tính từ mẫu cĩ giá trị từ x1,96 SE đến x1,96 SE .
- • Như vậy, độ lệch chuẩn phản ảnh độ biến thiên của một số cá nhân trong một quần thể. Cịn sai số chuẩn phản ảnh độ dao động của các số trung bình chọn từ quần thể.