Giáo trình Học phần điều tra xã hội học - Chương 5: Xử lý dữ liệu và phân tích kết quả nghiên cứu

pdf 86 trang huongle 2600
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Học phần điều tra xã hội học - Chương 5: Xử lý dữ liệu và phân tích kết quả nghiên cứu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfgiao_trinh_hoc_phan_dieu_tra_xa_hoi_hoc_chuong_5_xu_ly_du_li.pdf

Nội dung text: Giáo trình Học phần điều tra xã hội học - Chương 5: Xử lý dữ liệu và phân tích kết quả nghiên cứu

  1. Chương V XỬ LÝ DỮ LIỆU VÀ PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU I II XỬ LÝ PHÂN TÍCH DỮ LIỆU KẾT QUẢ NGHIÊN CỨU
  2. I. XỬ LÝ DỮ LIỆU 1 Chuẩn bị dữ liệu 2 Phương pháp mô tả và phân tích dữ liệu
  3. Tập hợp phiếu Kiểm tra Hiệu chỉnh Mã hoá Nhập tin Kiểm tra Tổng hợp
  4. 1. Chuẩn bị dữ liệu Kiểm tra dữ liệu Hiệu chỉnh dữ liệu Mã hoá dữ liệu Nhập dữ liệu
  5. Kiểm tra dữ liệu Mục đích: xác định dữ liệu đã thu thập được có thể chấp nhận được hay không? "dữ liệu đó có thực sự chính xác hay không?" Nội dung: Kiểm tra: con số và logic
  6. Kiểm tra dữ liệu Cách làm: - Nếu bản thân người nghiên cứu đi thu thập: kiểm tra tính chính xác trên phiếu điều tra. - Nếu việc thu thập dữ liệu đặt hàng cho một tổ chức khác: kiểm tra lấy mẫu và chọn mẫu, tính chính xác trên phiếu điều tra
  7. Hiệu chỉnh dữ liệu Một số thiếu sót phổ biến cần hiệu chỉnh Cách tiếp cận để xử lý  Những câu trả lời không đầy đủ  Quay trở lại điều tra viên hay  Những câu trả lời thiếu người trả lời để làm sáng tỏ. nhất quán  Suy luận từ những câu trả  Những câu trả lời không lời khác. thích hợp  Loại toàn bộ câu trả lời  Những câu trả lời không đọc được
  8. Mã hoá dữ liệu Các thủ tục mã hóa  Mã hóa trước  Mã hóa sau
  9. Mã hoá dữ liệu Các nguyên tắc thiết lập mã hóa  Số lượng "kiểu mã hóa" thích hợp  Tính tương đương của thông tin trả lời trong cùng “loại mã"  Sự khác biệt của các thông tin trả lời giữa các "loại mã"  Nguyên tắc loại trừ giữa các loại mã hóa  Nguyên tắc toàn diện
  10. Mã hoá dữ liệu Lập danh bạ mã hóa  Danh bạ mã hóa: là bảng gồm nhiều cột, chứa đựng những lời giải thích về mã hiệu đã được sử dụng trong những trường dữ liệu  Chức năng của danh bạ mã hóa:  Giúp người làm mã hóa thực hiện việc làm biến đổi từ một câu trả lời ra một ký hiệu (mã hiệu) thích hợp mà máy tính có thể đọc được.  Giúp nhà nghiên cứu nhận diện được các biến số sử dụng trong các quá trình phân tích.
  11. Mã hoá dữ liệu Một phần của một bảng danh bạ mã hoá STT Cột trên máy Tên của biến Vấn đề của Mã hiệu câu hỏi tính số câu hỏi 2 14 Gioi_tinh Giới tính 1 = Nam 2 = Nữ 8 28 Ky_nang Bạn đánh giá kỹ 1 = không biết năng sử dụng máy 2 = Biết ít tính cá nhân của bạn 3 = Sử dụng được như thế nào? 4 = Rất k/ nghiệm 9 34 Tienganh Biết ngoại ngữ nào? 1 = Biết 2 = Không 35 Tiengphap Biết ngoại ngữ nào? 1 = Biết 2 = Không
  12. Nhập dữ liệu Thiết kế form nhập dữ liệu Nhập trực tiếp vào phần mềm xử lý Công nghệ Scanning
  13. Thiết kế form nhập dữ liệu
  14. Nhập trực tiếp vào phần mềm xử lý
  15. Công nghệ scanning
  16. I. XỬ LÝ DỮ LIỆU 1 Chuẩn bị dữ liệu 2 Phương pháp mô tả và phân tích dữ liệu
  17. 2. Phương pháp mô tả và phân tích dữ liệu 2.1. Mô tả dữ liệu 2.2. Phân tích dữ liệu
  18. Phương pháp xử lý dữ liệu Xử lý bằng máy tính Đây là phương pháp thích hợp nhất và mang lại hiệu quả cao về kinh tế cũng như kỹ thuật xử lý, phân tích. Hiện nay có nhiều phần mềm hữu hiệu cho việc nhập, xử lý và phân tích các dữ liệu phân tích kinh tế xã hội. (SPSS, STATA, SAS, Minitab, Eviews, Excel, )
  19. 2.1. Mô tả dữ liệu 2.1.1 Sắp xếp dữ liệu và phân tổ thống kê 2.1.2. Bảng thống kê và đồ thị thống kê 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng
  20. 2.1.1 Sắp xếp dữ liệu và phân tổ thống kê 2.1.1.1 Sắp xếp dữ liệu 2.1.1.2 Phân tổ thống kê
  21. 2.1.1.1 Sắp xếp dữ liệu  Sắp xếp số liệu theo thứ tự  Biểu hiện bằng sơ đồ thân lá (Stem and leaf) TUOI Stem-and-Leaf Plot Frequency Stem & Leaf 3,00 2 . 1& 10,00 2 . 2333 30,00 2 . 44444445555555 33,00 2 . 6666667777777777 76,00 2 . 8888888888888888888999999999999999999 56,00 3 . 0000000000000000000001111111 62,00 3 . 2222222222222222222233333333333 51,00 3 . 4444444444455555555555555 25,00 3 . 666666777777 45,00 3 . 8888888888888889999999 31,00 4 . 000000000000011 23,00 4 . 22222233333 41,00 4 . 44444444455555555555 17,00 4 . 66666677 25,00 4 . 888888899999 20,00 5 . 000000011 9,00 5 . 2233 4,00 5 . 5& 4,00 5 . 7& 3,00 5 . 8 Sắp xếp??? Stem width: 10 Each leaf: 2 case(s)
  22. 2.1.1.2 Phân tổ thống kê Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ (hoặc các tiểu tổ) có tính chất khác nhau.
  23. 2.1.1.2 Phân tổ thống kê Các loại phân tổ thống kê Các loại phân tổ Căn cứ vào số lượng thống kê tiêu thức của phân tổ Phân tổ Phân tổ Phân tổ Phân tổ theo Phân tổ theo phân loại kết cấu liên hệ 1 tiêu thức nhiều tiêu thức Phân tổ Phân tổ kết hợp nhiều chiều
  24. 2.1.1.2 Phân tổ thống kê Phân phối các đơn vị vào từng tổ Bước 4 Xác định số tổ và khoảng cách tổ Bước 3 Lựa chọn tiêu thức phân tổ Bước 2 Xác định mục đích phân tổ Bước 1
  25. 2.1. Mô tả dữ liệu 2.1.1 Sắp xếp dữ liệu và phân tổ thống kê 2.1.2. Bảng thống kê và đồ thị thống kê 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng
  26. 2.1.2. Bảng thống kê và đồ thị thống kê 2.1.2.1 Bảng thống kê 2.1.2.2 Đồ thị thống kê
  27. 2.1.3.1 Bảng thống kê Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng nghiên cứu. Cấu thành bảng thống kê Tên bảng thống kê (tiêu đề chung) Phần giải thích Các chỉ tiêu giải thích (tên cột) Phần chủ đề (A) (1) (2) (3) (4) Các chỉ tiêu giải thích (tên cột)
  28. Nguyên tắc trình bày bảng - Quy mô của bảng thống kê không nên quá lớn. - Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và dễ hiểu. - Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số. - Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý. - Cách ghi các số liệu vào bảng thống kê. - Phần ghi chú ở cuối bảng thống kê.
  29. Cách ghi số liệu vào bảng thống kê + Nếu hiện tượng không có số liệu đó, thì trong ô sẽ ghi một dấu gạch ngang (-). + Nếu số liệu còn thiếu, sau này có thể bổ sung, thì trong ô có ký hiệu 3 chấm ( ). + Trong một ô nào đó: hiện tượng không có liên quan đến chỉ tiêu đó, nếu viết số liệu vào ô đó sẽ vô nghĩa, thì trong ô có ký hiệu gạch chéo (x). + Các số liệu trong cùng một cột, có đơn vị tính toán giống nhau, phải ghi theo trình độ chính xác như nhau (số lẻ đến 0,1 hay 0,01, ) đơn vị tính phải ghi thống nhất theo quy định.
  30. Nguyên tắc trình bày bảng - Quy mô của bảng thống kê không nên quá lớn. - Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và dễ hiểu. - Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số. - Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý. - Cách ghi các số liệu vào bảng thống kê. - Phần ghi chú ở cuối bảng thống kê.
  31. 2.1.3.2 Đồ thị thống kê Là các hình vẽ hoặc đường nét hình học dùng để miêu tả có tính chất quy ước các tài liệu thống kê. Có tính quần chúng, có sức hấp dẫn và sinh động, làm cho người hiểu biết ít về thống kê vẫn lĩnh hội được vấn đề chủ yếu một các dễ dàng, đồng thời giữ được ấn tượng sâu đối với người đọc.
  32. Nguyên tắc trình bày đồ thị - Quy mô của đồ thị - Các ký hiệu hình học - Hệ tọa độ - Thang và tỷ lệ xích - Phần ghi chú
  33. Đồ thị hình cột 25 20 15 10 5 0 Jan Feb Mar Apr May Jun
  34. Đồ thị so sánh hình cột 35 Food Gas 30 25 20 15 10 5 0 Jan Feb Mar Apr May Jun
  35. Đồ thị cơ cấu 12 19 17 12 14 22
  36. Đồ thị so sánh cơ cấu 100% 90% Oil Gas Food 80% 70% 60% 50% 40% 30% 20% 10% 0% Jan Feb Mar Apr May Jun
  37. Đồ thị tượng hình 25 20 15 10 5 0 Jan Feb Mar Apr May Jun
  38. 0.0005 0.0015 0.0025 0.001 0.002 0.003 0 1 17 33 49 65 81 97 113 129 145 161 177 193 209 225 241 Đồ thị diện tích 257 273 289 305 321 337 353 369 385 401 417 433 449 465 481 497 513 529 545 561 577 593 609 625 641 657 673 689 705 721 737 753 769 785 801 817 833 849 865 881 897 913 929
  39. Đồ thị liên hệ 750 700 650 600 550 500 450 400 0 5 10 15 20 25 30 35 40
  40. Đồ thị hình “mạng nhện” TC1 30 SP1 TC10 25 TC2 SP2 20 15 TC9 10 TC3 5 0 TC8 TC4 TC7 TC5 TC6
  41. Đồ thị đường gấp khúc Food 25 20 15 10 5 0 Jan Feb Mar Apr May Jun
  42. Bản đồ thống kê
  43. 2.1. Mô tả dữ liệu 2.1.1 Sắp xếp dữ liệu và phân tổ thống kê 2.1.2. Bảng thống kê và đồ thị thống kê 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng
  44. 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng 2.1.3.1 Các mức độ điển hình 2.1.3.2 Các tham số biến thiên (phân tán)
  45. 2.1.3.1 Các mức độ trung tâm Số bình quân Trung vị Mốt
  46. Số bình quân Số bình quân trong thống kê là mức độ biểu hiện trị số đại biểu theo một tiêu thức nào đó của một tổng thể bao gồm nhiều đơn vị cùng loại.
  47. Số bình quân -Số bình quân cộng: _ x x x  x + Giản đơn: x 1 2 n i n n x . f x . f x . f  x . f + Gia quyền: x 1 1 2 2 n n i i f1 f2 fn  fi _  xi. f  xi . fi  M i + Điều hoà gia quyền x f x . f M  i  i . x  x _ n i i + Điều hoà giản đơn x 1  xi
  48. Số bình quân - Số bình quân nhân: n + Giản đơn: n n x x1.x2 xn  xi i 1 n fi f f f f + Gia quyền:  1 2 n  fi i x x1 .x2 xn  xi i 1
  49. Số bình quân Đặc điểm • Nêu lên mức độ chung nhất, phổ biến nhất, có tính chất đại biểu nhất của tiêu thức nghiên cứu, không kể đến chênh lệch thực tế giữa các đơn vị tổng thể. • San bằng mọi chênh lệch giữa các đơn vị về trị số của tiêu thức nghiên cứu. • Chịu ảnh hưởng của các lượng biến đột xuất.
  50. Số bình quân Điều kiện vận dụng: - Số bình quân chỉ được tính ra từ tổng thể đồng chất (bao gồm nhiều đơn vị, phần tử hoặc hiện tượng có cùng chung một tính chất, thuộc cùng một loại hình kinh tế xã hội, xét theo một tiêu thức nào đó). - Số bình quân chung cần được vận dụng kết hợp với các số bình quân tổ hoặc dãy số phân phối.
  51. Ví dụ: Hợp tác xã A Hợp tác xã B Vụ lúa Diện Sản Năng Diện Sản Năng tích lượng suất tích lượng suất (ha) (tạ) (tạ/ha) (ha) (tạ) (tạ/ha) Vụ đông xuân 100 3000 30 300 9600 32 Vụ hè thu 300 10500 35 100 3700 37 Cả 2 vụ 400 13500 33,75 400 13300 32,25
  52. 2.1.3.1 Các mức độ trung tâm Số bình quân Trung vị Mốt
  53. Mốt (Mo) Là biểu hiện của một tiêu thức được gặp nhiều nhất trong một tổng thể hay trong một dãy số phân phối. (Được sử dụng đối với cả biến định tính và định lượng) - Đối với một dãy số lượng biến, mốt là lượng biến có tần số lớn nhất - Đối với một dãy số lượng biến có khoảng cách tổ, muốn tìm mốt trước hết cần xác định tổ có mốt, tức là tổ có tần số lớn nhất. Sau đó, trị số gần đúng của mốt tính theo công thức: fM fM 1 M x h . o o 0 M 0 min M 0 ( f f ) ( f f ) M o M o 1 M o M o 1
  54. Mốt (Mo) Tác dụng • Là mức độ đại biểu, nên có thể dùng Mo để thay thế cho số trung bình trong những trường hợp tính số trung bình gặp khó khăn. • Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến đột xuất. • Là một trong những tham số nêu lên đặc trưng phân phối. • Phục vụ nhu cầu hợp lý.
  55. Mốt (Mo) Hạn chế • Kém nhạy bén với sự biến thiên của tiêu thức. • Không xác định được trong trường hợp dãy số phân phối không bình thường.
  56. 2.1.3.1 Các mức độ trung tâm Số bình quân Trung vị Mốt
  57. Trung vị (Me) Là một lượng biến tiêu thức của đơn vị đứng ở vị trí giữa trong một dãy số lượng biến. - Nếu số đơn vị tổng thể lẻ (n = 2m + 1), số trung vị sẽ là lượng biến của đơn vị đứng ở vị trí giữa. - Nếu số đơn vị tổng thể chẵn (n = 2m), số trung vị là bình quân của hai lượng biến đứng ở vị trí giữa. - Dãy số lượng biến có khoảng cách tổ: xác định tổ có số trung vị và tính theo công thức: f i S  Me 1 M x h . 2 e Me min Me f Me
  58. Trung vị (Me) Tác dụng • Là mức độ đại biểu, có thể dùng Me để thay thế cho số trung bình trong những trường hợp tính số trung bình gặp khó khăn. • Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến đột xuất. • Là một trong những tham số nêu lên đặc trưng phân phối. • Tác dụng trong kỹ thuật và phục vụ công cộng.
  59. Khoảng tứ phân vị, Q1 Me Q2 70 60 50 40 30 20 10 N = 568 TUOI
  60. Đặc trưng phân phối x M Hệ số bất đối xứng K 0  K 0 dãy số phân phối chuẩn lệch phải K=0 dãy số phân phối chuẩn đối xứng K càng lớn thì dãy số càng không đối xứng X Me Mo
  61. 2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng 2.1.3.1 Các mức độ điển hình 2.1.3.2 Các tham số biến thiên (phân tán)
  62. 2.1.3.2 Các tham số biến thiên (phân tán) Ý nghĩa nghiên cứu: - Xét trình độ đại biểu của số bình quân - Thấy rõ nhiều đặc trưng của dãy số, như đặc trưng về phân phối, về kết cấu, tính chất đồng đều của tổng thể nghiên cứu - Sử dụng trong nhiều trường hợp nghiên cứu thống kê khác Phân tán như: phân tích biến động, phân tích mối liên hệ, dự đoán thống kê
  63. Khoảng biến thiên (R) Là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu, biểu hiện bằng công thức: R = Xmax - Xmin Không phụ thuộc vào sự phân bố của dữ liệu: R = 12 - 7 = 5 R = 12 - 7 = 5 7 8 9 10 11 12 7 8 9 10 11 12
  64. R = 78-72 = 4 (inches) R = 84-67 = 17 (inches)
  65. Độ lệch tuyệt đối bình quân Là số bình quân cộng của các độ lệch tuyệt đối giữa các lượng biến với số bình quân cộng của các lượng biến đó xi x fi  xi x  d d n  fi
  66. Phương sai Là số bình quân cộng của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó. 2 2 (x x) 2 (xi x) fi  2  i  n  fi Công thức thực hành:  2 x 2 (x)2
  67. Độ lệch tiêu chuẩn Là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó.   2 x 2 (x)2 Là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong nghiên cứu thống kê để đánh giá độ biến thiên của tiêu thức.
  68. Hệ số biến thiên Là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tiêu chuẩn (hoặc độ lệch tuyệt đối bình quân) với số bình quân cộng.  V .100 x Là thước đo độ biến thiên tương đối, có thể dùng để so sánh giữa các chỉ tiêu khác loại hoặc cùng loại và có số trung bình không bằng nhau.
  69. 2. Phương pháp mô tả và phân tích dữ liệu 2.1. Mô tả dữ liệu 2.2. Phân tích dữ liệu
  70. 2.2. Phân tích dữ liệu Phương pháp hồi quy tương quan Phương pháp dãy số thời gian Một số phương pháp dự đoán thống kê
  71. Chương V XỬ LÝ DỮ LIỆU VÀ PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU I II XỬ LÝ PHÂN TÍCH DỮ LIỆU KẾT QUẢ NGHIÊN CỨU
  72. II. TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU 1 Vai trò của báo cáo 2 Các loại báo cáo 3 Nguyên tắc trình bày kết quả nghiên cứu 4 Cách thuyết trình
  73. 1. Vai trò của báo cáo - Là phương tiện mà qua đó các dữ liệu, các phân tích và các kết quả được sắp xếp có hệ thống. - Phản ánh chất lượng của công trình nghiên cứu. - Hiệu quả của bản báo cáo có thể xác định những hoạt động sẽ được tiến hành (kết luận, đề xuất, kiến nghị giải pháp, ).
  74. 2. Các loại báo cáo 1 Báo cáo gốc
  75. Báo cáo gốc Bản báo cáo đầu tiên được chuẩn bị dựa trên các kết quả có được của dự án và được nhà nghiên cứu viết để sử dụng. Bao gồm các tài liệu làm việc và bản phác thảo sơ bộ.
  76. 2. Các loại báo cáo 1 Báo cáo gốc 2 Báo cáo được phổ biến
  77. Báo cáo được phổ biến Được soạn ra từ những kết quả nghiên cứu để đăng tải trong những tạp chí chuyên ngành hoặc trong các chuyên khảo, các tạp chí phổ thông, các tập san,
  78. 2. Các loại báo cáo 1 Báo cáo gốc 2 Báo cáo được phổ biến 3 Báo cáo kỹ thuật
  79. Báo cáo kỹ thuật Loại này thường dành cho các chuyên gia khoa học, quan tâm chủ yếu đến các mô tả chi tiết về toàn bộ quá trình nghiên cứu. Các loại báo cáo này cũng có thể kèm theo những phụ lục kỹ thuật phức tạp về phương pháp luận và thư mục đầy đủ để cung cấp cho độc giả các nguồn tài liệu tham khảo đầy đủ hơn.
  80. 2. Các loại báo cáo 1 Báo cáo gốc 2 Báo cáo được phổ biến 3 Báo cáo kỹ thuật 4 Báo cáo cho lãnh đạo
  81. Báo cáo cho lãnh đạo Loại này phục vụ cho những người ra quyết định. Gồm những nội dung chủ yếu phần cốt lõi của công trình nghiên cứu, những kết luận chính cùng những đề xuất và kiến nghị.
  82. 2. Các loại báo cáo 1 Báo cáo gốc 2 Báo cáo được phổ biến 3 Báo cáo kỹ thuật 4 Báo cáo cho lãnh đạo
  83. 3. Nguyên tắc soạn thảo báo cáo - Rõ ràng, dễ theo dõi - Dùng câu có cấu trúc tốt - Tránh dùng ngôn ngữ chuyên môn - Trình bày ngắn gọn - Nhấn mạnh các kết luận có tính thực tiễn - Sử dụng các bảng, đồ thị, hình vẽ, trong bản báo cáo
  84. 4. Cách thuyết trình a) Lựa chọn kỹ thuật thuyết trình: - Đọc một bài soạn trước - Đọc thuộc lòng - Nói tuỳ hứng - Nói ứng biến b) Lựa chọn phương tiện hỗ trợ - Tính hiệu quả - Các kỹ thuật
  85. NỘI DUNG THỰC HÀNH • Khai biến • Nhập số liệu vào chương trình xử lý • Thao tác đổi/tính toán với biến số • Thao tác một số thống kê mô tả • Thao tác lập bảng (biến 1 trả lời, nhiều trả lời) • Thao tác vẽ một số đồ thị thông dụng • Thao tác hồi quy tương quan