Bài giảng Phân tích và xử lý dữ liệu với R - Phần 4: Phân tích dữ liệu bằng biểu đồ

pptx 25 trang huongle 7970
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phân tích và xử lý dữ liệu với R - Phần 4: Phân tích dữ liệu bằng biểu đồ", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptxbai_giang_phan_tich_va_xu_ly_du_lieu_voi_r_phan_4_phan_tich.pptx

Nội dung text: Bài giảng Phân tích và xử lý dữ liệu với R - Phần 4: Phân tích dữ liệu bằng biểu đồ

  1. Phân tích dữ liệu với R Chương 2 _ phần 4 Phân tích dữ liệu bằng biểu đồ
  2. Các hàm R cơ bản ▪Biểu đồ phân bố (histogram) ▪Biểu đồ hộp (box plot) ▪Biểu đồ thanh (bar plot) ▪Biểu đồ tương quan (scatter plot)
  3. Đọc dữ liệu > setwd("D:/") > ob = read.csv ("salary.csv", header = T) > attach(ob) > head(ob) id salbeg sex time age salnow edlevel work jobcat minority sexrace 1 7 6900 0 79 28.00 16080 15 3.17 1 0 1 2 8 5400 0 67 28.75 14100 15 0.50 1 0 1 3 9 5040 0 96 27.42 12420 15 1.17 1 0 1 4 11 6300 0 84 33.50 15720 15 6.00 1 0 1 5 12 6000 0 88 54.33 8880 12 27.00 1 0 1 6 18 6900 0 72 32.67 10380 15 6.92 1 0 1
  4. Mục đích ▪ Muốn mô tả phân bố biến salnow ▪ Phân bố salnow có khác nhau giữa nam và nữ (sex)
  5. Biểu đồ phân bố
  6. Hàm hist () ▪ Hist(var, xlab, ylab, main, xlim, ylim, col, border, prob)
  7. Hist(salnow) Histogram of salnow 200 100 Frequency 50 0 10000 30000 50000 salnow
  8. > hist(salnow, col= "blue", border = "white") Histogram of salnow 200 150 100 Frequency 50 0 10000 20000 30000 40000 50000 salnow
  9. ➢hist(salnow, col= Phân bố mức luong hiện tại của nhân viên "blue", border = "white", xlab = 8e-05 "lương hiện tại 6e-05 ($)", ylab = "tỉ lệ tỉ lệ", prob = T, 4e-05 main = "Phân bố 2e-05 mức lương hiện 0e+00 tại của nhân 10000 20000 30000 40000 50000 luong hiện tại ($) viên")
  10. Biểu đồ hộp
  11. Hàm boxplot ▪ Boxplot(var, xlab, ylab, main, xlim, ylim, col, border, horizontal) ▪ Boxplot(var ~ group, xlab, ylab, main, xlim, ylim, col, border, horizontal)
  12. boxplot(salnow)
  13. boxplot (salnow, xlab ="lương hiện tại", main = "lương hiện tại", col = "blue")
  14. boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue")
  15. boxplot (salnow, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)
  16. boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = "blue", horizontal=T)
  17. boxplot (salnow~sex, notch = T, xlab ="lương hiện tại", main = "lương hiên tại", col = c("blue","red"), horizontal=T)
  18. Biểu đồ thanh
  19. Hàm barplot ▪ table (groupA, GroupB) ▪ means = with(data,tapply(var,group, mean)) ▪ barplot(table, horiz) ▪ barplot(mean, horiz)
  20. f = table(sex) barplot(f)
  21. barplot(means, horiz = T, xlab ="số nhân viên", ylab = "nhóm nghề")
  22. Biểu đồ tương quan
  23. Hàm plot() ▪ plot(varx~vary, pch, main, xlab, ylab, xlim, ylim, col, lwd) ▪ abline(lm(varX~varY),col = , lwd)
  24. ▪ plot(salnow~edlevel,ch =16, col = "blue") ▪ abline(lm(salnow~edlevel),col ="red" , lwd=2)