Giáo trình Thiết kế mẫu cho các cuộc điều tra - Phùng Đức Tùng

pdf 143 trang huongle 2760
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Thiết kế mẫu cho các cuộc điều tra - Phùng Đức Tùng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_thiet_ke_mau_cho_cac_cuoc_dieu_tra_phung_duc_tung.pdf

Nội dung text: Giáo trình Thiết kế mẫu cho các cuộc điều tra - Phùng Đức Tùng

  1. ThiThiếếtt kkếế mmẫẫuu chocho ccáácc cucuộộcc đđiiềềuu tratra PhPhùùngng ĐĐứứcc TTùùngng TTổổngng ccụụcc ThThốốngng kêkê
  2. MMụụcc đđííchch HiHiểểuu đưđượợcc ccáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề thithiếếtt kkếế mmẫẫuu vvàà ttíínhnh saisai ssốố mmẫẫu,u, ảảnhnh hhưưởởngng ccủủaa thithiếếtt kkếế mmẫẫuu đđếếnn cucuộộcc đđiiềềuu tratra XXáácc đđịịnhnh nhunhu ccầầuu vvềề đđộộ tintin ccậậyy ccủủaa ngngưườờii ssửử ddụụng,ng, ttừừ đđóó đưđưaa rara đưđượợcc ccỡỡ mmẫẫuu vvàà viviệệcc thithiếếtt kkếế mmẫẫuu phphùù hhợợpp HiHiểểuu đưđượợcc mmốốii quanquan hhệệ gigiữữaa saisai ssốố phiphi chchọọnn mmẫẫuu vvàà saisai ssốố mmẫẫuu vvàà nguyênnguyên nhânnhân saisai ssốố phiphi mmẫẫuu ttăăngng lênlên khikhi ttăăngng ccỡỡ mmẫẫuu
  3. MMụụcc đđííchch XXáácc đđịịnhnh ccáácc phphươươngng phpháápp nângnâng caocao hihiệệuu ququảả ccủủaa viviệệcc thithiếếtt kkếế mmẫẫuu nhinhiềềuu giaigiai đđooạạnn thôngthông quaqua viviệệcc ssửử ddụụngng ccáácc thôngthông tintin vvềề saisai ssốố mmẫẫu,u, ảảnhnh hhưưởởngng thithiếếtt kkếế mmẫẫu,u, chichi phphíí đđiiềềuu tra.tra. HiHiểểuu đưđượợcc ttầầmm quanquan trtrọọngng ccủủaa viviệệcc chuchuẩẩnn hohoáá ccáácc ttààii liliệệuu vvềề saisai ssốố mmẫẫuu nhnhằằmm ssửử ddụụngng trongtrong ttươươngng lailai chocho ccáácc vòngvòng đđiiềềuu tratra titiếếpp theotheo hohoặặcc ccáácc cucuộộcc đđiiềềuu tratra ttươươngng ttựự
  4. MMụụcc đđííchch HiHiểểuu đưđượợcc ccááchch ttíínhnh quyquyềềnn ssốố mmẫẫuu (quy(quyềềnn ssốố thithiếếtt kkếế,, ccáácc đđiiềềuu chchỉỉnhnh chocho ccáácc trtrưườờngng hhợợpp khôngkhông trtrảả llờờii hohoặặcc ngongoààii phphạạmm vi)vi) chocho ccáácc thithiếếtt kkếế nhinhiềềuu ttầầngng HiHiểểuu đưđượợcc thithiếếtt kkếế đđiiềềuu tratra mmẫẫuu panelpanel vvàà ứứngng ddụụngng ccủủaa nnóó
  5. NNộộii dungdung khokhoáá hhọọcc ThiThiếếtt kkếế mmẫẫuu KhoaKhoa hhọọcc hayhay nghnghệệ thuthuậậtt SaiSai ssốố phiphi chchọọnn mmẫẫuu vvớớii saisai ssốố mmẫẫuu CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề chchọọnn mmẫẫuu CCáácc phphươươngng phpháápp thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu ttầầngng ThiThiếếtt kkếế ttốốii ưưuu chocho chchọọnn mmẫẫuu nhinhiềềuu ttầầngng QuyQuyềềnn ssốố
  6. NNộộii dungdung khokhoáá hhọọcc XXửử lýlý ccáácc vvấấnn đđềề trongtrong ququáá trtrììnhnh chchọọnn mmẫẫuu TTíínhnh totoáánn ccáácc bibiếếnn đđổổi,i, ccáácc đđiiềềuu tratra panelpanel
  7. ChChọọnn mmẫẫuu khoakhoa hhọọcc hayhay nghnghệệ thuthuậật?t? ChChọọnn mmẫẫuu ththưườờngng đưđượợcc ddựựaa trêntrên ccơơ ssởở khoakhoa hhọọcc đđãã đưđượợcc phpháátt tritriểểnn trongtrong llĩĩnhnh vvựựcc đđiiềềuu tratra TuyTuy nhiênnhiên viviệệcc đđiiềềuu chchỉỉnhnh ddựựaa trêntrên kinhkinh nghinghiệệmm ththựựcc ttếế ccũũngng đđóóngng vaivai tròtrò rrấấtt quanquan trtrọọngng VVấấnn đđềề llàà phphảảii thithiếếtt kkếế đưđượợcc mmẫẫuu ccóó saisai ssốố nhnhỏỏ nhnhấấtt vvớớii mmộộtt mmứứcc chichi phphíí đđịịnhnh ssẵẵn,n, vvàà ccáácc hhạạnn chchếế vvềề ttổổ chchứứcc vvàà nhânnhân ssựự chocho cucuộộcc đđiiềềuu tra.tra.
  8. ChChọọnn mmẫẫuu khoakhoa hhọọcc hayhay nghnghệệ thuthuậật?t? LLýý thuythuyếếtt vvềề chchọọnn mmẫẫuu ssẽẽ gigiúúpp chchúúngng tata đđáánhnh gigiáá đưđượợcc vvấấnn đđềề GiGiảảii quyquyếếtt ccáácc vvấấnn đđềề vvớớii ccáácc gigiảả đđịịnhnh llàà ccáácc thôngthông ssốố liênliên quanquan đđãã đưđượợcc xxáácc đđịịnhnh
  9. ChChọọnn mmẫẫuu khoakhoa hhọọcc hayhay nghnghệệ thuthuậật?t? ĐĐểể xxáácc đđịịnhnh đưđượợcc mmộộtt thithiếếtt kkếế mmẫẫuu ttốốtt đđòiòi hhỏỏi:i: ++ CCụụ ththểể hohoáá mmụụcc tiêutiêu ccủủaa cucuộộcc đđiiềềuu tratra (( vvíí ddụụ:: saisai ssốố vvềề ttỷỷ llệệ nghnghèèoo ththấấpp hhơơnn 5%)5%)
  10. ChChọọnn mmẫẫuu khoakhoa hhọọcc hayhay nghnghệệ thuthuậật?t? ++ CCóó kikiếếnn ththứứcc sâusâu vvềề ccáácc yyếếuu ttốố ảảnhnh hhưưởởngng đđếếnn viviệệcc ttổổ chchứứcc ththựựcc hihiệệnn cucuộộcc đđiiềềuu tra:tra: đđộộ bibiếếnn thithiếếnn gigiữữaa vvàà trongtrong ttừừngng ttầầngng vvàà ccụụmm đđiiềềuu tra,tra, saisai ssốố chchọọnn mmẫẫu,u, hhààmm chichi phphíí TrongTrong ththựựcc ttếế ccóó ththểể rrấấtt khkhóó tuântuân theotheo ccáácc yêuyêu ccầầuu trêntrên vvìì:: ++ CCụụ ththểể hohoáá chchỉỉ 11 mmụụcc tiêutiêu nnààoo đđóó ccủủaa cucuộộcc đđiiềềuu tratra llàà khôngkhông ththựựcc ttếế
  11. ChChọọnn mmẫẫuu khoakhoa hhọọcc hayhay nghnghệệ thuthuậật?t? ++ CCáácc thôngthông tintin vvềề saisai ssốố chchỉỉ ccóó đưđượợcc khikhi mmộộtt cucuộộcc đđiiềềuu tratra ttươươngng ttựự đđãã đưđượợcc ththựựcc hihiệệnn ++ ViViệệcc thithiếếtt kkếế mmẫẫuu hihiệệuu ququảả ththựựcc rara llạạii rrấấtt nhnhạạyy ccảảmm vvớớii ccáácc gigiáá trtrịị chchíínhnh xxáácc ccủủaa ccáácc thôngthông ssốố ggầầnn mmứứcc ttốốii ưưuu,, mmứứcc đđộộ bibiếếnn thiênthiên ởở ggầầnn gigiáá trtrịị ttốốii ưưuu ththưườờngng llàà rrấấtt llớớnn mmàà khôngkhông ảảnhnh hhưưởởngng llớớnn đđếếnn hihiệệuu ququảả
  12. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu ++ CCáácc khkhóó khkhăănn,, trtrởở ngngạạii đđôiôi khikhi llạạii chchíínhnh llàà ccáácc yyếếuu ttốố quyquyếếtt đđịịnhnh đđếếnn viviệệcc thithiếếtt kkếế mmẫẫu,u, vvàà nhnhưư vvậậyy ssẽẽ khôngkhông ccóó chchỗỗ chocho viviệệcc ttốốii ưưuu hohoáá viviệệcc thithiếếtt kkếế
  13. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu NhNhữữngng loloạạii saisai ssốố nnààoo trongtrong cucuộộcc đđiiềềuu tra?tra? ++ SaiSai ssốố chchọọnn mmẫẫu:u: ++++ LLàà saisai ssốố ssảảyy rara khikhi chchúúngng tata chchỉỉ đđiiềềuu tratra 11 phphầầnn ccủủaa ttổổngng ththểể ++++ DoDo ssựự bibiếếnn thiênthiên ngngẫẫuu nhiênnhiên ttừừ 11 đơđơnn vvịị mmẫẫuu đưđượợcc chchọọnn ++++ SaiSai ssốố chchọọnn mmẫẫuu ccóó ththểể đđoo llưườờngng đưđượợcc
  14. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu ++ SaiSai ssốố phiphi chchọọnn mmẫẫuu ++++ XXảảyy rara ccảả trongtrong ccáácc cucuộộcc ttổổngng đđiiềềuu tratra ++++ XXảảyy rara ởở ttấấtt ccảả ccáácc giaigiai đđooạạnn ccủủaa ququáá trtrììnhnh đđiiềềuu tratra ++++ KhKhááii niniệệmm khôngkhông rõrõ rrààng,ng, hihiểểuu nhnhầầmm câucâu hhỏỏi,i, ghighi nhnhầầmm thôngthông tin,tin, nhnhậậpp tintin saisai vv vv
  15. Sai số chọn mẫu và sai số phi chọn mẫu Các định nghĩa DĐộ tin câyh trong các cuộc điều tra liên quan đến sai số chọn mẫu. • AĐộ chính xác liên quan đến sai số phi chọn mẫu hoặc độ chệch. • oHai loại sai số này được biểu thị bằng toán học là Sai số bình phương trung bình (Mean Square Error (MSE)) • MSE = σ2 + B2
  16. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu CCăănn bbậậcc haihai ccủủaa saisai ssốố bbììnhnh phphươươngng trungtrung bbììnhnh llàà TTổổngng saisai ssốố ccủủaa cucuộộcc đđiiềềuu tratra SaiSai ssốố bbììnhnh phphươươngng trungtrung bbììnhnh vvàà TTổổngng saisai ssốố ccủủaa cucuộộcc đđiiềềuu tratra chchủủ yyếếuu llàà ccáácc khkhááii niniệệmm mangmang ýý nghnghĩĩaa lýlý thuythuyếếtt vvìì thôngthông ththưườờngng chchúúngng tata khôngkhông ththểể đđoo llưườờngng đưđượợcc haihai thôngthông ssốố nnààyy trongtrong ccáácc cucuộộcc đđiiềềuu tratra
  17. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu SaiSai ssốố phiphi chchọọnn mmẫẫuu trongtrong ccáácc cucuộộcc đđiiềềuu tra:tra: ++ RRấấtt khkhóó đđoo llưườờngng vvàà gigiảảii quyquyếếtt soso vvớớii saisai ssốố chchọọnn mmẫẫuu ++ CCóó rrấấtt nhinhiềềuu nguyênnguyên nhânnhân ddẫẫnn đđếếnn saisai ssốố phiphi chchọọnn mmẫẫuu ++++ KhKhááii niniệệmm ++++ ThiThiếếtt kkếế bbảảngng hhỏỏii
  18. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu ++++ MMẫẫuu chchệệchch ++++ ĐĐiiềềuu tratra viênviên ++++ KhôngKhông nhnhớớ ++++ NNggưườờii trtrảả llờờii ++++ KhôngKhông trtrảả llờờii ++++ SSửử lýlý ssốố liliệệuu ++++ PhânPhân ttíích,ch, ttíínhnh totoáánn vvàà ssửử ddụụngng quyquyềềnn ssốố
  19. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu ++++ SaiSai ssốố phiphi chchọọnn mmẫẫuu khkhóó đđoo llưườờngng đưđượợcc ởở ttừừngng ccấấuu phphầầnn trêntrên ++++ ChChúúngng tata phphảảii ttậậpp trungtrung vvààoo hhạạnn chchếế saisai ssốố nnààyy ++++ CCáácc phphươươngng phpháápp vvàà quiqui trtrììnhnh đđiiềềuu tratra nnààoo ssẽẽ ttạạoo rara saisai ssốố phiphi chchọọnn mmẫẫuu caocao hhơơnn khikhi ccỡỡ mmẫẫuu ttăăngng lênlên??
  20. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu ++++ mmứứcc đđộộ khôngkhông chchíínhnh xxáácc ccủủaa bbảảngng câucâu hhỏỏi,i, câucâu trtrảả llờờii ccủủaa ngngưườờii đưđượợcc phphỏỏngng vvấấnn ++++ KhKhóó ttììmm đưđượợcc nhnhữữngng đđiiềềuu tratra viên,viên, gigiáámm ssáátt viênviên ccóó đđủủ trtrììnhnh đđộộ ++++ KhKhóó đđààoo ttạạoo hhọọ mmộộtt ccááchch totoàànn didiệệnn ddẫẫnn đđếếnn nhinhiềềuu saisai ssốố trongtrong ququáá trtrììnhnh phphỏỏngng vvấấnn vvàà ghighi llạạii câucâu trtrảả llờờii
  21. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu ++++ ViViệệcc ththựựcc hihiệệnn ddưướớii ththựựcc đđịịaa khôngkhông chchíínhnh xxáácc ++++ KhôngKhông ttììmm đưđượợcc đđộộii ngngũũ đđiiềềuu tratra viênviên vvàà gigiáámm ssáátt viênviên đđạạtt yêuyêu ccầầuu vvàà khôngkhông đđààoo ttạạoo hhọọ đđầầyy đđủủ ddẫẫnn đđếếnn hhọọ mmắắcc ccáácc llỗỗii dodo khôngkhông tuântuân ththủủ đđúúngng quiqui trtrììnhnh chchọọnn mmẫẫuu
  22. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu ++++ SaiSai ssốố chchọọnn mmẫẫuu ttăăngng lênlên khikhi ccơơ mmẫẫuu ttăăngng lênlên ++++ HHầầuu hhếếtt ccáácc cucuộộcc đđiiềềuu tratra chchỉỉ quanquan tâmtâm đđếếnn saisai ssốố chchọọnn mmẫẫuu mmàà khôngkhông quanquan tâmtâm đđếếnn saisai ssốố phiphi chchọọnn mmẫẫuu
  23. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu MSE = Sai số bình phương trung bình ˆ 2 MSE=Var( + Y) Bias Sự khác biệt giữa ước lượng mong đợi sử dụng cùng một qui trình điều tra và giá trị thực
  24. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu MSE = Tổng sai số s. e .(ˆ ) Y Độ chệnh
  25. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu Các trường hợp s.e(Y) Độ chệch Tình hình chung ở hầu hết các Tổng cuộc điều tra ở các nước đang điều tra phát triển
  26. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu MSE=40 = 6 . 3 Tổng sai số 2 tăng lên mặc dù tăng cỡ mẫu 6 lên 2 lần MSE44= . 25 = 6 . 7 1.4 6.5 Cỡ mẫu tăng gấp 2 lần (vídụ từ 5000 hộ lên 10000 hộ), làm giảm sai số chuẩn từ 2 xuống 1.4
  27. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu “Ấn tượng của chúng tôi là một số lượng lớn các nhà điều tra áp dụng các tính toán rất phức tạp và chính xác. Tuy nhiên họ chỉ tập trung vào sai số chọn mẫu mà không xem xét một cách đầy đủ đến sai số bình phương trung bình.” Casley-Lury, Bộ phận thu thập số liệu cho các nước đang phát triển
  28. SaiSai ssốố chchọọnn mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu Điều tra thu nhập và chi tiêu hộ gia đình Namibia 100000 80000 60000 40000 20000 0 tdomconsf12 -20000 -20000 0 20000 40000 60000 80000 100000 120000 TINCOME2
  29. SaiSai ssốố mmẫẫuu vvàà saisai ssốố phiphi chchọọnn mmẫẫuu Giátrị thực = Giátrị tổng thể ± Sai số phi chọn mẫu Mối quan hệ giứa sai số mẫu và phi mẫu với cỡ mẫu 6 Sai số chọn mẫu 5 Sai số phi chọn mẫu 4 3 2 Margin of errors Margin 1 0 10 20 30 40 50 60 Cỡ mẫu
  30. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu TTổổngng ththểể vvàà mmẫẫuu TrungTrung bbìình,nh, pphhươươngng saisai,, đđộộ llệệchch chuchuẩẩnn SaiSai ssốố chuchuẩẩn,n, hhệệ ssốố bibiếếnn thiênthiên KhoKhoảảngng tintin ccậậyy XXáácc đđịịnhnh ccỡỡ mmẫẫuu ccầầnn thithiếếtt ChChọọnn mmẫẫuu phânphân ttầầngng
  31. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu VVíí ddụụ:: TTổổngng ththểể ccủủaa 22 bibiếếnn y1i 8 10 9 12 9 11 10 12 9 8 10 9 7 12 11 12 8 9 13 11 . . . y2i831581122132471479111418831211
  32. 3. Sampling basics N y ∑ i 10000 Population mean= = Y1 =same forvar bothiables N 1000
  33. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu N ()y− Y 2 ∑ i 2839 . 3 Population variance=2 = S1 = variable 1 N −1 999 26815 . 3 Population var iance = variable 2 999
  34. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Trung bình tổng thể, phương sai và độ lệch chuẩn của 2 biến stand mean variance deviation y1i 10 2,8 1,7 y2i 10 26,8 5,2
  35. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Lấy mẫu 1 biến 50 quan sát y1i10129 8109 712119 y2i 15 2 4 7 14 7 9 12 14 19 . . .
  36. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu n y ∑ i 485 Sample mean= =1 y =9 . 7for = var iable 1 n 50 n y ∑ i 515 Sample mean= =1 y =10 .for 3 = var iable 2 n 50
  37. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu n ()y− y2 ∑ i 132 . 3 Sample variance=2 = s1 =2 . 7= variable 1 n −1 49 1416 . 1 Sample variance=2 = s 28 . = 9 variable 2 49
  38. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Trung bình mẫu, phương sai, độ lệch chuẩn stand mean variance deviation y1i 9,70 2,7 1,6 y2i 10,30 28,9 5,4
  39. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu So sánh tổng thể và mẫu stand mean variance deviation y1i population 10 2,8 1,7 sample 9,7 2,7 1,6 y2i population 10 26,8 5,2 sample 10,3 28,9 5,4
  40. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Phương sai của số trung bình N ()y− Y 2 S 2 ∑ i y Trong 2 1 Var()= y S y = n đó: N −1 ước lượng phương sai từ mẫu: n ()y− y2 s 2 ∑ i var(y = )y Trong s 2 = 1 n đó: y n −1
  41. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Nếu mẫu được chọn không lặp lại thì phương sai của số trung bình là: S 2 Var( )= y ( 1 − y f ) n Trong đó: n f = ( 1− f )nếu f rất nhỏ thì 1- f sẽ được N bỏ ra
  42. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Công thức tính sai số chuẩn từ mẫu: s s. e .( y= ) y n
  43. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Trong ví dụ stand mean (y) deviation s.e(y) y1i 9,7 1,64 0,23 y2i 10,3 5,38 0,76 5 . 38 50
  44. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Hệ số biến thiên s. e .( y (cv ) y= 100 * y 100⋅ 0 . 23 9 . 7 )y (eanm )y(vc iy1 7,9 4,2 iy2 3,01 4,7
  45. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Khoảng tin cậy là 95 % : y1 .± 96⋅ s e . .( y )
  46. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Khoảng tin cậy tính cho ví dụ 9 . 7 1 .y1 96± 0 . 23 ⋅ ( 9− . 25 10 . 15 ) 10 . 3 1 .y2 96± 0 . ⋅ 76 ( 8− . 81 11 . 79 )
  47. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Trong vídụ hệ số biến thiên là 2.4% cho biến 1 và 7.4% cho biến 2 khi mẫu là 50. Cỡ mẫu cần thiết là bao nhiêu cho biến 2 nếu muốn hệ số biến thiên là 2.4 % ? (cv )2 y 2≤ . 4 %
  48. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu s y2 100s⋅ e .2 .( y ) trong ≤2 . 4 s. e .(2 y = ) đó: y2 n vì vậy: 100⋅ s . 100⋅ s . y2 ≤2 . 4 y2 ≤ n y22⋅ . 4 y2 ⋅ n
  49. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu 2 100⋅ s y2 . ⎡100⋅ s ⎤ . ≤ n n ≥ y2 y 2⋅ . 4 ⎢ ⎥ 2 ⎣ y22⋅ . 4⎦ Ta và: s =5 . 4 y2 10= . 3 y2 có: 100⋅ 5 .2 4 . Vì ⎡ ⎤ n = 477 n ≥ ⎢ ⎥ vậy: 10⎣ . 3⋅ 2⎦ . 4
  50. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu ►►BiBiếếnn 22 ccóó ssựự bibiếếnn thiênthiên llớớnn soso vvớớii bibiếếnn 11 nênnên ccầầnn 11 ccỡỡ mmẫẫuu llớớnn hhơơnn rrấấtt nhinhiềềuu đđểể ccóó đưđượợcc ưướớcc llưượợngng ssốố trungtrung bbììnhnh chchíínhnh xxáácc nhnhưư bibiếếnn 11 ►►ĐĐểể ccóó đưđượợcc hhệệ ssốố bibiếếnn thiênthiên ccủủaa ssốố trungtrung bbììnhnh llàà 2.42.4 %,%, chchúúngng tata chchỉỉ ccầầnn ccỡỡ mmẫẫuu 5050 chocho bibiếếnn 11 nhnhưưngng ttớớii 477477 chocho bibiếếnn 22
  51. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu ► Khi chúng ta tính cỡ mẫu cần thiết để đạt được 1 hệ số biến thiên nhất định, chúng ta cần thông tin về số trung bình và phương sai từ các cuộc điều tra trước ( nếu không có thì phải tự dự đoán) 2 ⎡100⋅ s y ⎤ . n ≥ ⎢ ⎥ y⎣ ⋅ cv()⎦ y Hệ số biến thiên yêu cầu (vídụởmức 5%)
  52. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu ► Víí ddụụ đơđơnn gigiảảnn chocho viviệệcc xxáácc đđịịnhnh ccỡỡ mmẫẫuu ccầầnn thithiếếtt chocho ưướớcc llưượợngng ttỷỷ llệệ p( 1− p ) p( 1− p ) s. e .( p= ) 0≤ . 05 ≤ n n 0 . 052 p( 1− p ) p( 1− p ) n ≥ ≤ n 2 0 . 052 0 . 05
  53. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Ví dụ khác: Một tổng thể gồm 1000 đơn vị, biến y cần đo lường yi 8 10 9 12 56 11 10 12 9 87 10 74 7121112879 13 11 Một số quan sát có giá trị rất lớn (khoảng 10% số quan sát có giá trị rất lớn)
  54. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Phương sai và độ lệch chuẩn rất lớn: mean Variance Stand dev 16,4 458,2 21,4
  55. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Chúng ta chọn 2 mẫu với mỗi mẫu gồm 50 đơn vị được chọn từ tổng thể 1000 đơn vị. Mẫu 1 chỉ gồm 1 quan sát có giá trị lớn. Mẫu 2 bao gồm 7 quan sát có giá trị lớn. Sample 1 7 12 11 12 8 10 82 12 . . . . 11 10 12 9 10 . . . . Sample 2 12 69 11 10 12 9 10 7 . . . . 87 8 79 13 11 . . . .
  56. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Trung bình mẫu (ước lượng của trung bình tổng thể) có sự khác biệt rất lớn giữa 2 mẫu . y Var(y) s.e(y) Sample 1 9,5 1,8 1,4 Sample 2 18,7 11,4 3,4 vàcócả sự khác biệt về phương sai ( và sai số chuẩn)
  57. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Nếu chúng ta có cách nào đósắp sếp thành 2 nhóm- một nhóm gồm các đơn vị có giá trị lớn và nhóm còn lại- chúng ta có thể có được các ước lượng tốt hơn bằng cách chọn mẫu riêng biệt cho từng nhóm sau đókết hợp lại Vấn đề dĩ nhiên là ở chỗ xác định được các đơn vị có giá trị y lớn trước khi chúng ta tiến hành điều tra và đo lường y. Chúng ta sẽ đề cập đến vấn đề này sau. Giả sử chúng ta có cách nhóm thành 2 nhóm (strata)
  58. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Chọn 5 đơn vị từ nhóm có giá trị lớn và 45 từ nhóm có giá trị nhỏ. y var(y) s.e.(y) Sample of 5 large units 81,4 6,2 2,5 Sample of 45 units from the other group 9,3 0,2 0,4
  59. CCáácc kikiếếnn ththứứcc ccơơ bbảảnn vvềề mmẫẫuu Phương sai và độ lệch Giátrị trung bình ước lượng rất chuẩn là rất nhỏ gần với giá trị trung bình của tổng thể (16.4) y var(y) s.e.(y) Combined sample 16,5 0,2 0,5 Previous sample 1 9,5 1,8 1,4 Previous sample 2 18,7 11,4 3,4
  60. ChChọọnn mmẫẫuu ► DDàànn mmẫẫuu ►► ĐơĐơnn vvịị mmẫẫuu ccấấpp 11 vvàà ccấấpp 22 ►► XXáácc đđịịnhnh đơđơnn vvịị phphùù hhợợpp llààmm đơđơnn vvịị mmẫẫuu ►► ChChọọnn mmẫẫuu ccụụmm vvàà chchọọnn mmẫẫuu theotheo danhdanh ssááchch ► ChChọọnn mmẫẫuu phânphân ttầầngng ►► ChChọọnn đơđơnn vvịị banban đđầầuu
  61. ChChọọnn mmẫẫuu Yêu cầu về dàn mẫu: ► Tất cả các đơn vị của dàn mẫu phải được liệt kê trong danh sách, không được bỏ sót ► Mỗi đơn vị chỉ được liệt kê 1 lần trong danh sách ► Danh sách này phải được cập nhật ► Đơn vị điều tra phải được định nghĩa rõ ràng ► Đơn vị điều tra phải tìm được khi tiến hành thu thập số liệu ► Qui mô của đơn vị điều tra phải được xác địng nếu đơn vị điều tra có qui mô không cố định
  62. ChChọọnn mmẫẫuu ► Địa bàn điều tra ► Có thể gồm nhiều giai đoạn, như xã, thôn ► Mục đích: Gửi điều tra viên xuống các địa bàn điều tra (liệt kê danh sách hộ, chọn hộ và tiến hành phỏng vấn)
  63. ChChọọnn mmẫẫuu ► GianhGianh gigiớớii đđịịaa bbàànn rõrõ rrààngng rrấấtt quanquan trtrọọngng nhnhưưngng đđôiôi khikhi khôngkhông trtráánhnh khkhỏỏii ssựự saisai llệệchch ► XXáácc đđịịnhnh saisai:: ƒ Gianh giớớii rõrõ rrààngng nhnhưưngng xxáácc đđịịnhnh saisai =>=> khôngkhông nghiêmnghiêm trtrọọngng ƒ Gianh giớớii khôngkhông rõrõ rrààngng =>=> ccóó vvấấnn đđềề vvìì ssẽẽ chocho phphéépp ĐĐiiềềuu tratra viênviên llựựaa chchọọnn
  64. ChChọọnn mmẫẫuu Dàn mẫu địa bàn điều tra ► DDàànn mmẫẫuu lýlý ttưưởởngng llàà ccóó ssơơ đđồồ đđịịaa bbàànn mmàà danhdanh gigiớớii đưđượợcc xxáácc đđịịnhnh thôngthông quaqua ccáácc đđịịaa hhììnhnh ttựự nhiênnhiên ► SSơơ đđồồ ththưườờngng ddùùngng llàà đơđơnn vvịị hhàànhnh chchíínhnh hohoặặcc đđịịaa bbàànn ttổổngng đđiiềềuu tratra dândân ssốố
  65. ChChọọnn mmẫẫuu ►►ĐơĐơnn vvịị mmẫẫuu ccơơ ssởở ccủủaa bbưướớcc chchọọnn mmẫẫuu đđầầuu tiêntiên ccóó ththểể llàà xãxã hohoặặcc thônthôn ►►ĐơĐơnn vvịị chchọọnn mmẫẫuu ccấấpp 22 ccóó ththểể llàà thônthôn hohoặặcc hhộộ
  66. ChChọọnn mmẫẫuu ►►CCáácc khukhu vvựựcc chchọọnn llààmm đơđơnn vvịị chchọọnn mmẫẫuu ccơơ ssởở:: ►►XemXem trongtrong ddàànn mmẫẫuu baobao ggồồmm ccáácc đơđơnn vvịị đđịịaa bbàànn nhnhỏỏ nhnhấấtt ccóó ththểể NNếếuu ccáácc đơđơnn vvịị đđịịaa bbảảnn nnààyy đđủủ nhnhỏỏ ththìì ssửử ddụụngng ccáácc đơđơnn vvịị đđịịaa bbàànn nnààyy trongtrong 11 hohoặặcc nhinhiềềuu giaigiai đđooạạnn ccủủaa ququáá trtrììnhnh chchọọnn mmẫẫuu
  67. ChChọọnn mmẫẫuu VVẽẽ ssơơ đđồồ hayhay liliệệtt kêkê danhdanh ssáách:ch: ►►NNếếuu đđịịaa bbàànn đđiiềềuu tratra đđủủ nhnhỏỏ ththìì liliệệtt kêkê danhdanh ssááchch hhộộ hohoặặcc nhnhàà ởở ►►NNếếuu đđịịaa bbàànn đđiiềềuu tratra ququáá llớớn,n, chchúúngng tata phphảảii phânphân chiachia đđịịaa bbàànn ddùùngng ssơơ đđồồ bbảảngng kêkê ththàànhnh ccáácc đơđơnn vvịị nhnhỏỏ hhơơnn trtrưướớcc khikhi liliệệtt kêkê danhdanh ssááchch ccáácc hhộộ
  68. ChChọọnn mmẫẫuu Các hộ gia đình trẻ thường ít được chọn vào mẫu vì khi lập gia đình họ thường chuyển gia ở riêng và thời gian cập nhật danh sách và thời gian điều tra thực địa thường cách nhau khá lâu
  69. ChChọọnn mmẫẫuu Tính khoảng cách mẫu: Chọn ngẫu nhiên 1 số có giá trị trong khoảng 0 đến 1. Giả sử trong 1 thôn có 63 hộ và ta muốn chọn 15 hộ. Khoảng cách chọn mẫu sẽ là 63/15 = 4.2; giả sử số ngẫu nhiên ban đầu là 0.4. Cộng số ngẫu nhiêu với khoảng cách chọn mẫu 4.2 vàtiếp tục như vậy ta có: 0.4, 4.6, 8.8, 13.0, 17.2, 21.4, 25.6, 29.8, 34.0, 38.2, 42.4, 46.6, 50.8, 55.0, 59.2 và 63.4. Sau đó loại bỏ số thập phân ta sẽ chọn được các hộ vào mẫu như sau 0, 4, 8, 13, 17, 21, 25, 29, 34, 38, 42, 46, 50, 55, 59 and 63. Ta thấy là số 0.4 (hay 0) là không có hộ nào được chọn vào mẫu nhưng nó quan trọng vì nó cho phép bắt đầu giá trị từ 0.1 đến 0.9 để chắc chắn chọn được 15 hộ.
  70. PhPhươươngng phpháápp chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn 1.1. ChChọọnn mmẫẫuu vvớớii xxáácc xuxuấấtt khkháácc nhaunhau 2.2. ưướớcc llưượợngng vvàà quyquyềềnn ssốố 3.3. ưướớcc llưượợngng phphươươngng saisai ttừừ chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn
  71. PhPhươươngng phpháápp chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ChChọọnn mmẫẫuu vvớớii xxáácc xuxuấấtt khkháácc nhaunhau ► Phươươngng phpháápp thôngthông ththưườờngng llàà chchọọnn mmẫẫuu vvớớii xxáácc xuxuấấtt ttỷỷ llệệ thuthuậậnn vvớớii quiqui mômô ccủủaa ttổổngng ththểể (v(víí ddụụ ssốố hhộộ)) trongtrong mmỗỗii đơđơnn vvịị chchọọnn mmẫẫuu. ► Nếếuu nhnhưư đđịịaa bbàànn AA ccóó quiqui mômô llớớnn hhơơnn 55 llầầnn đđịịaa bbàànn BB ththìì nnóó ssẽẽ ccóó xxáácc xuxuấấtt đưđượợcc chchọọnn vvààoo mmẫẫuu llớớnn ggấấpp 55 llầầnn soso vvớớii đđịịaa bbàànn BB ►►PhPhươươngng phpháápp nnààyy đưđượợcc ggọọii llàà PPS (PPS= “xáácc xuxuấấtt ttỷỷ llệệ vvớớii quiqui mômô”).
  72. PhPhươươngng phpháápp chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ►►PhPhươươngng phpháápp chchọọnn mmẫẫuu PPSPPS ssẽẽ ccóó xuxu hhưướớngng chchệệchch vvềề phphííaa ccáácc đđịịaa bbàànn ccóó quiqui mômô llớớn.n. ĐĐiiềềuu nnààyy phphảảii đưđượợcc đđiiềềuu chchỉỉnhnh llạạii ởở giaigiai đđooạạnn ttíínhnh totoáánn (ch(chúúngng tata ssẽẽ đđềề ccậậpp sâusâu vvấấnn đđềề nnààyy sau)sau) hohoặặcc trongtrong giaigiai đđooạạnn chchọọnn mmẫẫuu khikhi mmàà ccáácc hhộộ giagia đđììnhnh đưđượợcc chchọọnn vvààoo mmẫẫu.u.
  73. PhPhươươngng phpháápp chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ► MMộộtt ccááchch đđiiềềuu chchỉỉnhnh đđộộ chchệệchch ởở giaigiai đđooạạnn chchọọnn mmẫẫuu llàà llựựaa chchọọnn ccáácc hhộộ giagia đđììnhnh vvớớii xxáácc xuxuấấtt ngngưượợcc vvớớii ttỷỷ soso vvớớii quiqui mômô đưđượợcc ssửử ddụụngng ởở giaigiai đđooạạnn chchọọnn đđịịaa bbàànn ►►NNếếuu đđịịaa bbàànn AA ccóó quiqui mômô llớớnn hhơơnn 55 llầầnn đđịịaa bbàànn B,B, chchúúngng tata nênnên đđặặtt ttỷỷ llệệ đưđượợcc chchọọnn vvààoo mmẫẫuu ccủủaa ccáácc hhộộ thuthuộộcc đđịịaa bbàànn AA nhnhỏỏ hhơơnn 55 llầầnn soso vvớớii ccáácc hhộộ ởở đđịịaa bbàànn BB
  74. PhPhươươngng phpháápp chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ► KKếếtt ququảả ccủủaa phphươươngng phpháápp nnààyy llàà ssốố hhộộ trongtrong mmẫẫuu ggầầnn nhnhưư gigiốốngng nhaunhau gigiữữaa ccáácc đđịịaa bbàànn đđiiềềuu tra,tra, bbấấtt kkểể đđịịaa bbàànn đđóó llớớnn hayhay nhnhỏỏ ► NNóó ccũũngng ttạạoo rara mmẫẫuu ttựự llấấyy quyquyềềnn ssốố ““selfself weightingweighting”” KhKhôngông ccầầnn phphảảii ssửử ddụụngng quyquyềềnn ssốố mmẫẫuu khikhi ưướớcc llưượợngng ccáácc gigiáá trtrịị trungtrung bbìình,nh, ttỷỷ llệệ vvàà ttỷỷ ssốố
  75. PhPhươươngng phpháápp chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ►►MMộộtt phphươươngng phpháápp ggầầnn gigiốốngng vvớớii phphươươngng phpháápp nnààyy llàà chchọọnn 11 ssốố hhộộ ccốố đđịịnhnh trongtrong mmỗỗii đđịịaa bbàànn đđiiềềuu tratra ►►VVớớii phphươươngng phpháápp nnààyy ththìì mmẫẫuu chchỉỉ xxấấpp xxĩĩ ttựự llấấyy quyquyềềnn ssốố ChChúúngng tata vvẫẫnn phphảảii ssửử ddụụngng quyquyềềnn ssốố mmẫẫuu đđểể đđiiềềuu chchỉỉnhnh đđộộ chchệệchch trongtrong giaigiai đđooạạnn ttíínhnh totoáánn
  76. PhPhươươngng phpháápp chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ►►LLợợii ththếế llớớnn nhnhấấtt ccủủaa ccáácc phphươươngng phpháápp nnààyy llàà chchúúngng tata ccóó đưđượợcc mmứứcc đđộộ côngcông viviệệcc ởở ththựựcc đđịịaa ggầầnn bbằằngng nhaunhau ởở ccáácc đđịịaa bbàànn đđiiềềuu tra.tra. ĐĐiiềềuu nnààyy thuthuậậnn titiệệnn chocho viviệệcc ttổổ chchứứcc thuthu ththậậpp thôngthông tintin ởở ththựựcc đđịịaa
  77. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ►►XXáácc xuxuấấtt chchọọnn mmẫẫuu ►►QuyQuyềềnn ssốố mmẫẫuu ►►CCáácc ưướớcc llưượợngng ttổổngng ►►CCáácc ưướớcc llưượợngng ttỷỷ llệệ vvàà trungtrung bbììnhnh ►►CCáácc ưướớcc llưượợngng phphươươngng saisai
  78. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ►►CCầầnn phphảảii ccóó quyquyềềnn ssốố mmẫẫuu đđểể đđiiềềuu chchỉỉnhnh ccáácc đđộộ chchệệchch dodo xxáácc xuxuấấtt chchọọnn mmẫẫuu khkháácc nhaunhau vvàà dodo ttăăngng ccỡỡ mmẫẫuu theotheo ttổổngng ththểể ((đđôiôi khikhi ggọọii quyquyềềnn ssốố nnààyy llàà NhânNhân ttốố ttăăngng lênlên).).
  79. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ► Chúng ta muốn chọn đơn vị chọn mẫu ban đầu với xác xuất tỷ lệ với qui mô (PPS), qui mô được đo bằng số hộ ► Nếu đơn vị chọn mẫu ban đầu (PSU) i có Mi hộ và tổng số hộ (trong tầng) là M, thì xác xuất PSU được chọn với 1 lần rút thăm là: M p = i i M Nếu chóng ta chän n lần thì xác xuất được chọn vào mẫu của PSU i sẽ là: n⋅ M p = i i M
  80. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Nếu mi làsố hộ được chọn từ PSU i thìxác xuất được chọn có điều kiện của hộ ij là: mi p2ij = * M i
  81. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Tổng xác xuất được chọn của hộ ij sẽ là: n⋅ Mim i pij= p i ⋅2 p ij = ⋅ * M M i n = số PSU được chọn vào mẫu M = số hộ trong tổng thể = M i số hộ trong PSU I (theo tổng điều tra) * = M i số hộ trong PSU I theo danh sách liệt kê của cuộc điều tra = mi số hộ được chọn vào mẫu từ PSU I
  82. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Quyền số cá nhân/ hộ: Giả sử p3ij làxác xuất được chọn của 1 người trong hộ ij Trong hộ này có 1, 2, 3 ,kij người vì vậy kij làtổng số người trong hộ ij Số người được chọn trong mẫu kij (tất cả các thành viên của hộ) p3ij = kij/ kij =1 Vìvậy xác xuất p(người) = P1*P2*P3 = P1*P2*1 = P(hộ)
  83. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Quyền số mẫu cho hộ ij bằng tỷ lệ ngịch với xác xuất chọn mẫu: * 1 M M i wij= = ⋅ pij n⋅ Mi mi
  84. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn * = M h ⋅ M hi whij nh M hi mhi Quyền số giai đoạn 1 Quyền số giai đoạn hai
  85. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn * = M h M hi whij nh M hi mhi nh = Số địa bàn được chọn trong tầng h = ố hộ trong tầng ổng điều tra M h S h theo t = Số hộ trong địa bàn I trong tầng h theo tổng điều tra M hi *' = Số hộ trong địa bàn I trong tầng h theo danh sách liệt kê M hi = mhi Số hộ trong mẫu của địa bàn I trong tầng h
  86. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Tổng thể có thể được ước lượng từ mẫu Lnh m hi Y$ = ∑ ∑w ∑hij yhij h=1 i = 1 j = 1 Quyền số mẫu (quyền số thiết kế)
  87. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Ước lượng tỷ lệ: Y$ R$ = X$ Trong đó X$ được ước lượng giống như Y$
  88. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Ước lượng trung bình Yˆ Yˆ = Mˆ L nmhhi Trong Mˆ = ∑∑∑whij đó: hi==11 j = 1
  89. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Giả sử: mhi ' Tổng quyền số của các = yhi ∑whij yhij quan sát trong PSU j=1 Cách biểu thị đơn giản nhất của ước lượng phương sai: Y$ L ⎡ nh 2 2 ⎤ Var( ˆ) = Y nh ⎢ ''− / ⎥ ∑ −1 ∑y( hi)(∑ yhi ) nh h=1 nh ⎣⎢ i=1 ⎦⎥
  90. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Phương sai của ước lượng tỷ lệ: 1 2 var(Rˆ) = YRXRXY[var(+ˆ) ˆ ⋅var( ˆ) − 2 ˆ ⋅cov( ⋅ ˆ , ˆ)] Xˆ 2
  91. CCáácc ưướớcc llưượợngng ttừừ mmẫẫuu nhinhiềềuu giaigiai đđooạạnn STATA syntax: Tên của biến chứa quyền số, mã địa bàn, mã tầng svyset [pweight=name] svyset, psu(name) svyset, strata(name) svymean name
  92. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn 1.1. PhânPhân ttầầngng 2.2. ẢẢnhnh hhưưởởngng thithiếếtt kkếế mmẫẫuu 3.3. TTỷỷ llệệ đđồồngng nhnhấấtt (roh)(roh) 4.4. MôMô hhììnhnh chichi phphíí 5.5. QuiQui mômô ttốốii ưưuu 11 đđịịaa bbàànn đđiiềềuu tratra
  93. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ►► PhânPhân ttầầngng đơđơnn vvịị chchọọnn mmẫẫuu ccấấpp 11 rrấấtt quanquan trtrọọngng ►► VVìì:: 1.1. NNóó chocho phphéépp chchọọnn mmẫẫuu theotheo ttỷỷ llệệ khkháácc nhaunhau chocho ttừừngng khukhu vvựựcc 2.2. PhânPhân ttầầngng ththưườờngng gigiúúpp gigiảảmm saisai ssốố mmẫẫuu
  94. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ►►TTạạii saosao ccầầnn ttỷỷ llệệ chchọọnn mmẫẫuu khkháácc nhau?nhau? ƒƒ TTỷỷ llệệ chchọọnn mmẫẫuu phphảảii đưđượợcc ttíínhnh totoáánn đđểể đđạạtt đưđượợcc thithiếếtt kkếế mmẫẫuu ttốốii ưưuu (T(Tỷỷ llệệ chchọọnn mmẫẫuu caocao ởở nhnhưưngng nnơơii ccóó mmứứcc đđộộ bibiếếnn thiênthiên llớớn,n, ttỷỷ llệệ ththấấpp ởở nhnhưưngng khukhu vvựựcc ccóó chichi phphíí llớớn)n) ƒƒ ĐĐảảmm bbảảoo đđủủ ccỡỡ mmẫẫuu chocho ttừừngng khukhu vvựựcc ccầầnn nghiênnghiên ccứứuu
  95. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ►►PhânPhân ttầầngng vvớớii ttỷỷ llệệ bbằằngng nhaunhau ((““phânphân bbổổ ttỷỷ llệệ””).). GiGiảảmm saisai ssốố mmẫẫuu vvớớii viviệệcc đđảảmm bbảảoo mmẫẫuu đưđượợcc trtrảảii đđềều.u. VVíí ddụụ ththàànhnh ththịị == 25%25% ttổổngng ssốố mmẫẫuu đưđượợcc chchọọnn vvàà nôngnông thônthôn llàà 75%75%
  96. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ˆ Var( design Y ) Ảnh hưởng thiết kế mẫu: DEFF = ˆ Var( srs ) Y Var( ˆ Y ) Phươsai tính tng ừ cuộc điều tra theo thiết kế mẫu design thực tế. Var( ˆ ) Y Phương sai với giả định là cuộc điều tra được chọn srs hoàn toàn ngẫu nhiên với cùng cỡ mẫu
  97. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn ˆ Phương sai Var( design Y ) và ảnh hưởng thiết kế mẫu có thể tính toán được sử dụng phầm mềm STATA hoặc phần mềm thống kê khác. Một số phần mềm thống kê không đưa ra được chính xác phương sai và sai số chuẩn như SPSS không đưa ra được chính xác phương sai.
  98. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Descriptive Statistics N Mean SPSS: Statistic Statistic Std. Error FOOD 866851 603111.34 370.77 Valid N (listwise) 866851 Sai ! ! Đúng Giống nhau Survey mean estimation STATA: Estimate Std. Err. Deff 603111.3 7947.086 4.288
  99. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Các tên khác nhau: Một số nhà Thống kê sử dụng thuật ngữ nhân tố thiết kế (design factor (deft)) cho ảnh hưởng của thiết kế, dẫn đến những sự hiểu lầm vì một số nhà thống kê khác sử dụng thuật ngữ nhân tố thiết kế cho căn bậc hai của ảnh hưởng thiết kế mẫu deff: Deft = Deff 2 Ký hiệu hay nhất của ảnh hưởng thiết kế là: DY( ˆ)
  100. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Ảnh hưởng của thiết kế mẫu TT NT Cả nuớc LECS 97/98 Tiêu dùng bình quân tháng 3.8 7.8 5.4 Tiêu dùng lương thực, thực phẩm 4.4 6.8 5.8 Dân số sử dụng xe máy 1.3 3.3 2.1 Dân số sử dụng TV 3.1 6.8 5.4 Dân số sử dụng RADIO 2.7 4.8 4.5 Dân số sử dụng VIDEO 3.9 6.1 5.5 CSES 1999 Total monthly consumption 2.0 2.0 1.4 Monthly food consumption 3.1 3.2 3.2 Proportion with access to TV 2.4 2.2 2.6 NHIES 93/94 Total yearly hh consumption 2.9 1.9 2.5 Total yearly hh income 2.9 2.8 2.8 Proportion with access to TV 6.0 4.6 4.1 Proportion with access to radio 2.7 2.1 2.4 Proportion with access to telephone 6.2 4.6 4.5
  101. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Khi mẫu không tự lấy quyền số chịu ảnh hưởng bởi nhân tố: 2 whij ⋅ n ∑ (L= “loss factor”) L = 2 ()∑ whij Điều chỉnh deff để loại bỏảnh hưởng của quyền số có thể được tính toán như sau: deff deff * = L
  102. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Tỷ lệ đồng nhất được tính toán như sau: deff −1 roh = m −1 Trong đó m làsố hộ (đối tượng điều tra) trung bình 1 địa bàn điều tra.
  103. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn roh dựa trên khái niệm tương quan trong nội tại địa bàn điều tra. Tương quan trong nội tại địa bàn điều tra đo lường mức độ mà 2 hộ (hoặc đối tượng điều tra) trong địa bàn điều tra là dường như có chung các đặc điểm, so với việc chọn 2 hộ này một cách ngẫu nhiên trong tổng thể. Nócógiátrị từ -1 đến +1. Vídụ: Tỷ lệ mắc 1 dịch bệnh nào đó thường có mối tương quan cao hơn giữa 2 người sống trong cùng 1 địa bàn so với 2 người sống ở địa bàn khác nhau do sự lây nhiễm trong cùng 1 cộng đồng cao hơn. Các biến số về kinh tế-xã hội thường có tỷ lệ đồng nhất cao hơn các biến về địa lý
  104. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Tỷ lệ đồng nhất Chủ đề/ đặc trưng TT NT Tiêu dùng, thu nhập của hộ -Tổng tiêu dùng tháng (Lao LECS) 0.072 0.209 -Tổng tiêu dùng tháng (Cambodia CSES) 0.089 0.080 -Tổng tiêu dùng của hộ (Namibia NHIES) 0.071 0.025 -Tiêu dùng thực phẩm tháng (Lao LECS) 0.092 0.178 -Tiêu dùng thực phẩm tháng (Cambodia CSES) 0.139 0.204 -Tổng thu nhập (Namibia NHIES) 0.071 0.058
  105. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn TT NT Các giá trị roh Chủ đề/ đặc trưng Đồ dùng của hộ -CóTV(Lao LECS) 0.049 0.178 -CóTV(Cambodia CSES) 0.079 0.061 -CóTV(Namibia NHIES) 0.200 0.125 -Có radio (Lao LECS) 0.036 0.110 -Có radio (Cambodia CSES)) 0.100 0.109 -Có radio (Namibia NHIES) 0.063 0.032 -Có video (Lao LECS) 0.076 0.154 -Có điện thoại (Namibia NHIES) 0.208 0.125
  106. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Deff và roh cho tỷ lệ hộ nghèo và thu nhập đầu người (VHLSS 2002). Ước lượng deff L Deff roh (adj) Tỷ lệ hộ nghèo, qui mô 2.2 1.4 1.6 0.15 cụm: 5 hộ Tỷ lệ hộ nghèo, qui mô 5.0 1.3 3.9 0.15 cụm: 20 hộ Thu nhập đầu người, 3.5 1.1 3.1 0.09 Qui mô cụm: 25 hộ Thu nhập đầu người,TT, 4.0 1.1 3.5 0.11 qui mô cụm: 25 hộ Thu nhập đầu người, NT, 3.5 1.1 3.1 0.09 Qui mô cụm: 25 hộ
  107. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn deff( 1= +roh⋅ (− m 1 )) Ảnh hưởng của thiết kế mẫu phụ thuộc vào mức độ đồng nhất và cỡ mẫu trong 1 địa bàn điều tra
  108. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Đối với phân loại địa lý (như tỉnh) chúng ta mong đợi deff giống như mức quốc gia. Đội với phân loại (như hộ với chủ hộ dưới 25 tuổi) chúng ta mong đợi deff sẽ thấp hơn deff của tổng mẫu
  109. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Phương sai của y s 2 var( )y = y (+roh 1 ⋅ ( m − 1 )) n⋅ m Số địa bàn Số hộ
  110. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Bài tập: Giả sử roh=0.2. Tính var(y cho ) 2 khả năng n (số PSU) và m (số hộ trong 1 PSU): 1. n=1000 m= 25 tổng số mẫu:25000 2. n=1200 m= 15 tổng số mẫu:18000
  111. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Mô hình chi phí: C C= 0 C+ 1⋅ n+ 2 C⋅ ⋅ n m
  112. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn n = số địa bàn điều tra m = số hộ điều tra trong 1 địa bàn C0= chi phícố định thực hiện cuộc điều tra, không phụ thuộc vào số địa bàn và số hộ điều tra như chi phí thiết kế bảng hỏi, chọn mẫu vv. C1= chi phí trung bình cho việc điều tra thêm 1 địa bàn. C2= chi phí trung bình cho việc điều tra thêm 1 hộ trong địa bàn
  113. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Các mô hình chi phí của điều tra thu nhập và chi tiêu của Lào (USD): Curban 95= n⋅ + 24⋅ n⋅ m Crural149= n⋅ + ⋅ n 24⋅ m
  114. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Số địa bàn tối ưu: C1 (1− roh) mopt = ⋅ C2 roh Nhân tố thứ nhất trong phương trình C1/C2 là tỷ lệ chi phí giữa chi phí 1 đơn vị trong giai đoạn chọn mẫu thứ nhất và thứ 2. C1 là chi phí tăng thêm khi điều tra thêm 1 địa bàn điều tra và C2 là chi phí tăng thêm khi điều tra thêm 1 hộ
  115. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Khi chúng ta xác định được m và chúng ta biết roh, chúng ta có thể xác định được ảnh hưởng của thiết kế mẫu: deff1= +roh⋅ (− m 1 ) Nếu chúng ta ước tính tỷ lệ P, và chúng ta dự toán giá trị gần đúng P thì chúng ta có thể tính toán được cỡ mẫu cần thiết đáp ứng yêu cầu có được độ lệch chuẩn ở mức e : p( 1− p ) n⋅ m = ⋅ deff n= số địa bàn điều tra được chọn e 2
  116. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Tổng số mẫu: Quan trọng hơn các nhân tố khác, chọn cỡ mẫu được xác định bằng mức độ chi tiết yêu cầu bởi kế hoạch tính toán. Mẫu cung cấp mức độ tin cậy cho các ước lượng ở cấp tỉnh sẽ lớn hơn gấp 8 lần so với mẫu có ước lượng với mức độ tin cậy ở cấp vùng.
  117. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Qui mô mẫu: Vấn đề với cơ quan Thống kê là làm thế nào có thể đáp ứng được nhu cầu thông tin mà không làm giảm mức độ tin cậy hoặc chi tiết cho các ước lượng thấp hơn cấp quốc gia.
  118. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Qui mô mẫu: Hầu hết các cơ quan Thống kê sử dụng các số liệu tổng điều tra ở cấp thấp hơn quốc gia nhưng họ không thể cung cấp các số liệu điều tra mẫu cho cấp địa phương với các thông tin về độ tin cậy cần thiết để làm cho việc sử dụng số liệu hiệu quả hơn.Việc chọn mẫu nhiều hơn mức cần thiết đang diễn ra phổ biến, đặc biệt là ở cấp vùng tạo nên sự lãng phí về ngân sách
  119. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Diagram1: Sampling errors for p= 30%, 20% and 5%, for different sample sizes (deff=3) 10.0 9.0 8.0 7.0 6.0 p=30% 5.0 p=20% p=5% 4.0 3.0 2.0 sampling error percentage units 1.0 0.0 1 112131415161 sample of households in hundreds
  120. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Diagram 2: Probability of detecting a true change of 4 % and 8 % respectively for different sample sizes (p1=32%, deff=3, panel 50%) 1,00 0,90 0,80 0,70 0,60 change=8% 0,50 change=4% 0,40 0,30 0,20 probability of detecting the change 0,10 0,00 1112131 sample size, no of households in hundreds
  121. TTốốii ưưuu hohoáá thithiếếtt kkếế chchọọnn mmẫẫuu nhinhiềềuu giaigiai đđooạạnn Đồ thị trên cho thấy sự thay đổi là 8% thì chúng ta có 75% khả năng kiểm chứng được sự thay đổi này với cỡ mẫu là 500 hộ. Với sự thay đổi là 4% thì chúng ta cần 1 cỡ mẫu là 2700 để có được 75% khả năng kiểm chứng được sự thay đổi này
  122. QuyQuyềềnn ssốố BaBa giaigiai đđooạạnn llấấyy quyquyềềnn ssốố:: ►► QuyQuyềềnn ssốố vvớớii xxáácc xuxuấấtt chchọọnn khôngkhông đđềềuu (quy(quyềềnn ssốố ccơơ ssởở)) ►► ĐĐiiềềuu chchỉỉnhnh quyquyềềnn ssốố chocho ccáácc hhộộ koko trtrảả llờời:i: đđiiềềuu chchỉỉnhnh quyquyềềnn ssốố đơđơnn gigiảảnn ►► ĐĐiiềềuu chchỉỉnhnh quyquyềềnn ssốố đđểể đưđưaa rara ccáácc ưướớcc llưượợngng ththốốngng nhnhấấtt vvớớii ttổổngng ththểể
  123. QuyQuyềềnn ssốố GiaiGiai đđooạạnn 11 quyquyềềnn ssốố ccơơ bbảản:n: ►►QuyQuyềềnn ssốố chocho xxáácc xuxuấấtt chchọọnn khôngkhông đđềềuu ĐĐâyây llàà ccááchch ttíínhnh rrấấtt đơđơnn gigiảản.n. MMỗỗii nhânnhân ttốố đưđượợcc ấấnn đđịịnhnh chocho 11 quyquyềềnn ssốố llàà xxáácc xuxuấấtt llựựaa chchọọnn totoàànn bbộộ ccáácc nhânnhân ttốố trongtrong ttổổngng ththểể hohoặặcc llàà ttỷỷ llệệ vvớớii ttổổngng ththểể
  124. QuyQuyềềnn ssốố GiaiGiai đđooạạnn 22 ccủủaa quyquyềềnn ssốố:: ►►DDùùngng đđểể đđiiềềuu chchỉỉnhnh quyquyềềnn ssốố ccơơ bbảảnn chocho ccáácc hhộộ khôngkhông trtrảả llờờii hohoặặcc khôngkhông ttììmm ththấấyy hhộộ vvàà khôngkhông thaythay ththếếhhộộ
  125. QuyQuyềềnn ssốố GiaiGiai đđooạạnn 3:3: ►►ĐĐểể llààmm chocho quyquyềềnn ssốố phphảảnn áánhnh đđúúngng gigiáá trtrịị ccủủaa ttổổngng ththểể (phân(phân bbốố)) vvíí ddụụ phânphân bbốố theotheo nhnhóómm tutuổổi,i, gigiớớii ttíính,nh, ttổổngng dândân ssốố ►►LoLoạạii đđiiềềuu chchỉỉnhnh nnààyy ththưườờngng đưđượợcc ggọọii llàà đđiiềềuu chchỉỉnhnh hhậậuu phânphân ttầầngng poststratificationpoststratification
  126. QuyQuyềềnn ssốố M M * w =h ⋅ hi Quyền số cơ bản: hij n M m h hi hi Nhân tố điều chỉnh * M h M hi mhi Điều chỉnh cho các hộ không whij= ⋅ ⋅ r trả lời: nh M hi mhi mhi r mhi = Số hộ trả lời trong địa bàn hi
  127. QuyQuyềềnn ssốố Phân bố theo nhóm tuổi, Nam Nữ Tổng giới tính của tổng thể (triệu 0 - 19 4.5 5 9.5 người) : 20 - 49 4 4 8 50 - 2 2.5 4.5 Tổng 10.5 11.5 22 Phân bố giới tính, nhóm tuổi Nam Nữ Tổng theo quyền số mẫu,triệu 0 - 19 4 4.5 8.5 người: 20 - 49 3.5 4.5 8 50 - 1.5 2 3.5 Tổng 9 11 20
  128. QuyQuyềềnn ssốố Các nhân tố điều chỉnh quyền số sẽ tạo cho các ước lượng từ mẫu phù hợp với phân bố theo nhóm tuổi và giới tính của tổng thể đã biết: Male Female 0 - 19 1.125 1.111 20 - 49 1.143 0.889 50 - 1.333 1.25 Tổng thể đã biết: 10 . 5 Ước lượng từ mẫu cho tổng thể dựa trên quyền 9 số cơ bản:
  129. QuyQuyềềnn ssốố Điều tra y tế quốc gia (VNHS), 272 nhân tố điều chỉnh (giới tính theo 17 nhóm tuổi chia cho 8 vùng) được sử dụng để đảm bảo rằng phân bố dân số theo tuổi và giới tính trong các bảng biểu tổng hợp giống như tổng điều tra dân số 1999
  130. XXửử lýlý mmộộtt ssốố vvấấnn đđềề trongtrong ququáá trtrììnhnh chchọọnn mmẫẫuu 1.1. KiKiểểmm tratra ddàànn mmẫẫuu 2.2. CCáácc llỗỗii trongtrong chchọọnn mmẫẫuu 3.3. CCáácc llỗỗii vvềề phphạạmm vivi dodo đđiiềềuu tratra viênviên gâygây rara ởở ththựựcc đđịịaa 4.4. CCáácc đơđơnn vvịị mmẫẫuu mmàà khôngkhông ththểể ththựựcc hihiệệnn đưđượợcc khikhi titiếếnn hhàànhnh đđiiềềuu tratra ththựựcc đđịịaa 5.5. CCáácc đđịịaa bbàànn đđiiềềuu tratra khôngkhông ththểể đđếếnn đưđượợcc
  131. Xử lý một số vấn đề trong quá trình chọn mẫu KiKiểểmm tratra ddàànn mmẫẫuu:: ►►KhôngKhông baobao bbọọcc hhếếtt ttổổngng ththểể ►►BBịị trtrùùngng ►►KhôngKhông chchíínhnh xxáácc hohoặặcc khôngkhông đđủủ thôngthông tintin xxáácc đđịịnhnh ►►ThôngThông tintin bbổổ sungsung chocho ddàànn mmẫẫuu khôngkhông chchíínhnh xxáácc
  132. Xử lý một số vấn đề trong quá trình chọn mẫu CCáácc llỗỗii trongtrong chchọọnn mmẫẫu:u: ►►HHưướớngng ddẫẫnn quiqui trtrììnhnh chchọọnn mmẫẫuu ccóó ththểể bbịị hihiểểuu nhnhầầm,m, hohoặặcc bbịị áápp ddụụngng sai,sai, ddẫẫnn đđếếnn viviệệcc llựựaa chchọọnn saisai hohoặặcc chchọọnn vvớớii xxáácc xuxuấấtt chchọọnn khôngkhông đđúúngng
  133. Xử lý một số vấn đề trong quá trình chọn mẫu LLỗỗii phphạạmm vvịị dodo đđiiềềuu tratra viênviên ởở ththựựcc đđịịaa:: ► MMộộtt phphầầnn đđịịaa bbàànn đđiiềềuu tratra ccóó ththểể bbịị loloạạii bbỏỏ hohoặặcc đđịịaa bbàànn đđiiềềuu tratra baobao ggồồmm ccảả phphầầnn khôngkhông thuthuộộcc đđịịaa bbàànn (nh(nhầầmm danhdanh gigiớới)i) dodo đđiiềềuu tratra viênviên ► HHộộ giagia đđììnhnh ccóó ththểể bbịị bbỏỏ ssóótt trongtrong ququáá trtrììnhnh liliệệtt kêkê danhdanh ssááchch hhộộ ►►ViViệệcc xxáácc đđịịnhnh hhộộ khôngkhông ttốốtt ((đđịịnhnh nghnghĩĩaa hhộộ giagia đđììnhnh koko đđúúng)ng)
  134. Xử lý một số vấn đề trong quá trình chọn mẫu ĐơĐơnn vvịị chchọọnn mmẫẫuu khôngkhông ththểể titiếếpp ccậậnn đưđượợcc khikhi titiếếnn hhàànhnh ththựựcc đđịịa:a: ►►LLũũ llụụtt ►►NNộộii chichiếến,n, xungxung đđộộtt (Tây(Tây Nguyên)Nguyên) ►►HHộộ ttừừ chchốốii hhợợpp ttáácc
  135. Xử lý một số vấn đề trong quá trình chọn mẫu CCáácc đđịịaa bbàànn đđiiềềuu tratra khôngkhông ththểể đđếếnn đưđượợc:c: ►►KhuKhu vvựựcc đđãã bbịị didi chuychuyểểnn ►►KhuKhu vvựựcc bbịị gigiảảii totoảả đđểể xâyxây ddựựngng đưđườờng,ng, ccáácc côngcông trtrììnhnh xâyxây ddựựngng khkháácc ((ĐĐàà NNẵẵng)ng)
  136. Xử lý một số vấn đề trong quá trình chọn mẫu GiGiảảii quyquyếếtt vvấấnn đđềề vvềề phphạạmm vivi khôngkhông baobao trtrùùmm nhnhưư ththếế nnàào:o: ►►QuayQuay llạạii vvàà thuthu ththậậpp ccáácc thôngthông tintin thithiếếuu ►►ThThưườờngng koko ththựựcc hihiệệnn đưđượợcc ►►ThayThay ththếế ccáácc đơđơnn vvịị mmấấtt bbằằngng ccáácc đơđơnn vvịị khkháácc ►►ĐĐiiềềuu chchỉỉnhnh llạạii quyquyềềnn ssốố
  137. ƯƯớớcc llưượợngng ccáácc thaythay đđổổii ►►ThôngThông ththưườờngng ththìì ccáácc đđặặcc trtrưưngng ccóó ttíínhnh ổổnn đđịịnhnh quaqua ththờờii gian.gian. VVìì vvậậy,y, ccáácc mmốốii ttươươngng quanquan thuthuậậnn ttăăngng lênlên ttừừ viviệệcc ssửử ddụụngng ccáácc đơđơnn vvịị đưđượợcc đđiiềềuu tratra llặặp.p. CCáácc nhnhàà nghiênnghiên ccứứuu ththưườờngng ssửử ddụụngng llợợii ththếế ccủủaa mmốốii ttươươngng quanquan nnààyy đđểể đđoo llưườờngng ssựự thaythay đđổổi.i.
  138. ƯƯớớcc llưượợngng ccáácc thaythay đđổổii ►►MMẫẫuu đđộộcc llậậpp ►►MMẫẫuu llặặpp totoàànn bbộộ (c(cùùngng mmộộtt mmẫẫuu quaqua ththờờii gian)gian) ►►MMộộtt phphầầnn mmẫẫuu đưđượợcc llặặpp
  139. ƯƯớớcc llưượợngng ccáácc thaythay đđổổii Mẫu độc lập: Var d()()()() Var= y1− y 2 = Var1 + y2 Var y Mẫu lặp toàn bộ: Var d() Var y (= y1 )− 2 = Var ()1 + y ()2(,)2 Var− 1 y 2 Cov y y
  140. ƯƯớớcc llưượợngng ccáácc thaythay đđổổii Nếu: 2 2 Vàcỡ mẫu giống nhau ở 2 cuộc điều tra SSy1 = y2 Ko lặp Lặp toàn bộ Lặp 1 phần n n Qn Pn Mẫu n n Pn Qn Sự khác biệt2: ⋅ var((y 1 ) )−R 2⋅ ⋅ ( var( 1 y P− ) )⋅ R 2⋅ ⋅ var( y ) Tổng: 2⋅ var((y 1 ) )+R 2⋅ ⋅ ( var( 1 y P+ ) )⋅ R 2⋅ ⋅ var( y )
  141. ƯƯớớcc llưượợngng ccáácc thaythay đđổổii ►►ẢẢnhnh hhưưởởngng ccủủaa ssựự khkháácc bibiệệtt ccủủaa mmẫẫuu llặặpp totoàànn bbộộ llàà (1(1 R).R). ẢẢnhnh hhưưởởngng ccủủaa mmẫẫuu llặặpp 11 phphầầnn llàà (1(1 PR).PR). ►►ẢẢnhnh hhưưởởngng ccủủaa ccáácc ttổổngng 22 trungtrung bbììnhnh chchíínhnh xxáácc llàà ngngưượợcc llạạii:: (1+R)(1+R) chocho mmẫẫuu llặặpp hohoàànn totoàànn vvàà (1+PR)(1+PR) chocho mmẫẫuu llặặpp 11 phphầầnn
  142. ƯƯớớcc llưượợngng ccáácc thaythay đđổổii ►►ĐĐiiềềuu tratra PanelPanel ƒƒ PanelPanel llàà 11 đđiiềềuu tratra mmẫẫuu mmàà trongtrong đđóó ccáácc hhộộ đưđượợcc đđiiềềuu tratra nhinhiềềuu hhơơnn 11 vvòngòng ƒƒ ĐĐiiềềuu tratra panelpanel đưđượợcc ththựựcc hihiệệnn khikhi chchúúngng tata mumuốốnn đđoo llưườờngng ttổổngng thaythay đđổổii đđằằngng sausau thaythay đđổổii thuthuầầnn
  143. ƯƯớớcc llưượợngng ccáácc thaythay đđổổii Một phần lặp trong thiết kế Lặp 1/2: ab – bc – cd – de – ef Lặp 2/3: abc – bcd– cde – def – efg Lặp 1/3: abc –cde–efg – ghi – ijk