Đồ án Tìm hiểu và tích hợp các phương pháp dự báo - Nguyễn Trung Kiên

pdf 55 trang huongle 1790
Bạn đang xem 20 trang mẫu của tài liệu "Đồ án Tìm hiểu và tích hợp các phương pháp dự báo - Nguyễn Trung Kiên", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfdo_an_tim_hieu_va_tich_hop_cac_phuong_phap_du_bao_nguyen_tru.pdf

Nội dung text: Đồ án Tìm hiểu và tích hợp các phương pháp dự báo - Nguyễn Trung Kiên

  1. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng LỜI CẢM ƠN Trƣớc hết em xin bày tỏ tình cảm và lòng biết ơn đối với thầy Nguyễn Trịnh Đông – Khoa Công nghệ Thông tin – Trƣờng Đại học Dân Lập Hải Phòng, ngƣời đã dành cho em rất nhiều thời gian quý báu, trực tiếp hƣớng dẫn tận tình giúp đỡ, chỉ bảo em trong suốt quá trình làm đồ án tốt nghiệp. Em xin chân thành cảm ơn tất cả các thầy cô giáo trong khoa Công nghệ Thông tin - Trƣờng ĐHDL Hải Phòng, chân thành cảm ơn các thầy giáo, cô giáo tham gia giảng dạy và truyền đạt những kiến thức quý báu trong suốt thời gian em học tập tại trƣờng, đã đọc và phản biện đồ án của em giúp em hiểu rõ hơn các vấn đề mình nghiên cứu, để em có thể hoàn thành đồ án này. Em xin cảm ơn GS.TS.NGƢT Trần Hữu Nghị Hiệu trƣởng Trƣờng Đại học Dân lập Hải Phòng, Ban giám hiệu nhà trƣờng, Bộ môn tin học, các Phòng ban nhà trƣờng đã tạo điều kiện tốt nhất trong suốt thời gian học tập và làm tốt nghiệp. Tuy có nhiều cố gắng trong quá trình học tập, trong thời gian thực tập cũng nhƣ trong quá trình làm đồ án nhƣng không thể tránh khỏi những thiếu sót, em rất mong đƣợc sự góp ý quý báu của tất cả các thầy giáo, cô giáo cũng nhƣ tất cả các bạn để kết quả của em đƣợc hoàn thiện hơn. Em xin chân thành cảm ơn! Hải Phòng, ngày tháng năm 2013 Sinh viên Nguyễn Trung Kiên Nguyễn Trung Kiên – Lớp CT1301 1
  2. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng MỤC LỤC LỜI CẢM ƠN 1 MỤC LỤC 2 DANH MỤC BẢNG VÀ HÌNH VẼ 4 LỜI MỞ ĐẦU 6 CHƢƠNG 1: BÀI TOÁN PHÂN TÍCH VÀ DỰ BÁO 8 1.1. Khái niệm 8 1.2. Ý nghĩa và vai trò của phân tích và dự báo trong quá trình ra quyết định kinh doanh 8 1.2.1. Ý nghĩa 8 1.2.2. Vai trò 9 1.3. Phân loại dự báo 9 1.3.1. Căn cứ vào độ dài thời gian dự báo: 9 1.3.2. Dựa vào các phƣơng pháp dự báo: 10 1.3.3. Căn cứ vào nội dung (đối tƣợng dự báo) 11 1.4. Các phƣơng pháp dự báo 12 1.4.1. Phƣơng pháp dự báo định tính 12 1.4.2. Phƣơng pháp dự báo định lƣợng 14 1.5. Quy trình dự báo 20 CHƢƠNG 2: HỆ THỐNG PHÂN TÍCH VÀ DỰ BÁO 23 2.1. Dự báo từ các mức độ bình quân 23 2.1.1. Dự báo từ số bình quân trƣợt (di động) 23 2.1.2. Mô hình dự báo dựa vào lƣợng tăng (giảm) tuyệt đối bình quân 23 2.1.3. Mô hình dự báo dựa vào tốc độ phát triển bình quân 24 2.2. Mô hình dự báo theo phƣơng trình hồi quy (dự báo dựa vào xu thế) 25 Nguyễn Trung Kiên – Lớp CT1301 2
  3. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 2.2.1. Mô hình hồi quy theo thời gian 25 2.2.2. Mô hình hồi quy giữa các tiêu thức 26 2.3. Dự báo dựa vào hàm xu thế và biến động thời vụ 27 2.3.1. Dự báo dựa vào mô hình cộng 27 2.3.2. Dự báo dựa vào mô hình nhân 28 2.4. Dự báo theo phƣơng pháp san bằng mũ 29 2.4.1. Mô hình đơn giản (phƣơng pháp san bằng mũ đơn giản) 29 2.4.2. Mô hình xu thế tuyến tính và không có biến động thời vụ (Mô hình san mũ Holt – Winters) 32 2.4.3. Mô hình xu thế tuyến tính và biến động thời vụ 33 CHƢƠNG 3: THỰC NGHIỆM CÁC BÀI TOÁN DỰ BÁO 36 3.1. Phần mềm IBM SPSS Modeler 36 3.1.1. Giới thiệu 36 3.1.2. Các chức năng trong SPSS Modeler 36 3.2. Áp dụng phần mềm IBM SPSS Modeler vào bài toán dự báo 39 3.2.1. Bài toán 1 (sử dụng phƣơng pháp định tính) 39 3.2.2. Bài toán 2 (sử dụng phƣơng pháp định lƣợng) 46 3.2.3. Bài toán 3 (sử dụng phƣơng pháp định lƣợng) 49 KẾT LUẬN 54 TÀI LIỆU THAM KHẢO 55 Nguyễn Trung Kiên – Lớp CT1301 3
  4. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng DANH MỤC BẢNG VÀ HÌNH VẼ DANH MỤC BẢNG Bảng 3.2. 1 Diễn giải 40 Bảng 3.2. 2 Giá bán sản phẩm 46 Bảng 3.2. 3 Sản lƣợng doanh nghiệp A 49 DANH MỤC HÌNH VẼ Hình 3.1.2. 1 Nguồn dữ liệu 36 Hình 3.1.2. 2 Trích chọn dữ liệu 37 Hình 3.1.2. 3 Biến đổi dữ liệu 37 Hình 3.1.2. 4 Lọc các trƣờng dữ liệu 37 Hình 3.1.2. 5 Biến đổi trƣờng và thuộc tính dữ liệu 38 Hình 3.1.2. 6 Xử lý dữ liệu 38 Hình 3.1.2. 7 Đánh giá và biểu diễn kết quả 39 Hình 3.2.1. 1 Chọn nút Type 40 Hình 3.2.1. 2 Chọn nút Filter 41 Hình 3.2.1. 3 Chọn nút select 41 Hình 3.2.1. 4 Xử lý với tập Nguoi.sav 42 Hình 3.2.1. 5 Chọn nút Merge 42 Hình 3.2.1. 6 Chọn nút Statistic 43 Hình 3.2.1. 7 Kết quả số lƣợng 43 Hình 3.2.1. 8 Chọn nút Table 44 Hình 3.2.1. 10 Bảng kết quả 44 Hình 3.2.1. 11 Chọn nút Distribution 45 Hình 3.2.1. 12 Bảng kết quả 45 Hình 3.2.2. 1 Chọn nút Type 47 Nguyễn Trung Kiên – Lớp CT1301 4
  5. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Hình 3.2.2. 2 Chọn nút Filter 47 Hình 3.2.2. 3 Chọn nút Derive 48 Hình 3.2.2. 4 Chọn nút Table 48 Hình 3.2.2. 5 Kết quả 48 Hình 3.2.3. 1 Chọn nút Filter 50 Hình 3.2.3. 2 Chọn nút Type 50 Hình 3.2.3. 3 Chọn nút Time Intervals 50 Hình 3.2.3. 4 Xử lý nút Time Intervals 51 Hình 3.2.3. 5 Chọn nút Time Series 51 Hình 3.2.3. 6 Kết quả xử lý Time Series 51 Hình 3.2.3. 7 Bảng kết quả dự báo 52 Hình 3.2.3. 8 Chọn nút Multiplot và Plot 52 Hình 3.2.3. 9 Biểu đồ kết quả qua Multiplot 53 Hình 3.2.3. 10 Biểu đồ kết quả qua Plot 53 Nguyễn Trung Kiên – Lớp CT1301 5
  6. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng LỜI MỞ ĐẦU Dự báo luôn gắn liền với cuộc sống của con ngƣời, từ các dự báo đơn giản về thời tiết, môi trƣờng sống, đến các dự báo quan trọng trong lĩnh vực chính trị, quân sự, kinh doanh và trong các lĩnh vực khác. Với chiều dài phát triển nhƣ vậy dự báo vẫn chƣa chính thức là một ngành khoa học độc lập cho đến những năm đầu của thập niên 60 của thế kỉ trƣớc, khoa học dự báo với tƣ cách một ngành khoa học độc lập có đầy đủ hệ thống lí luận và phƣơng pháp luận. Mỗi lĩnh vực có một yêu cầu về dự báo riêng, đối với nhà quản trị khi lên kế hoạch, trong hiện tại họ xác định hƣớng tƣơng lai cho các hoạt động mà họ sẽ thực hiện. Bƣớc đầu tiên trong hoạch định là dự báo hay là ƣớc lƣợng nhu cầu tƣơng lai cho sản phẩm hoặc dịch vụ và các nguồn lực cần thiết để sản xuất sản phẩm hoặc dịch vụ đó. Dự báo sẽ mở ra một cửa sổ để hƣớng tới tƣơng lai. Nó là con đƣờng dẫn tới việc lập kế hoạch cho sự phát triển của tƣơng lai. Những tầm nhìn từ dự báo sẽ giúp mở ra nhiều lựa chọn hơn cho tƣơng lại để ta có quyết định chọn hay không chọn. Trong một thế giới thay đổi với nhịp độ nhanh nhƣ hiện nay, tƣơng lai sẽ có xu hƣớng rất khác so với thực tế hiện tại với rất nhiều cách khác nhau. Hơn nữa, do sự phát triển của những tri thức mới và những tiến bộ trong khoa học (và tiếp theo là sự tiến bộ của công nghệ), xã hội học, chính trị, kinh tế và kinh doanh, xã hội toàn cầu của chúng ta có khả năng ngày càng tăng để hình thành (theo hƣơng tích cực hoặc tiêu cực) tƣơng lai mà chúng ta sẽ phải đạt đƣợc. Kết quả là xã hội và những tổ chức trong nó phải tìm những kiến thức dự báo về tƣơng lai có thể xảy ra và những hậu quả đối với những hành động ngày hôm nay và những hành động cần thiết. Do đó việc ngày càng cần thiết là chúng ta có những công cụ dự báo tốt hơn và áp dụng chúng theo những cách ta có thể. Điều đó cho thấy dự báo là càng quan trọng nhiều hơn, ngành dự báo đã trở thành một công cụ cần thiết để mọi ngƣời sử dụng trong nỗ lực đƣa ra định những quyết, kế hoạch, thiết kế, chỉ đạo, quản lý, thực hiện và kiểm soát thay đổi bằng cách xác định tƣơng lai thích hợp hơn với những dự báo. Xác định đƣợc tầm quan trọng của lĩnh vực dự báo nhƣ vậy nên em đã chọn đề tài “Tìm hiểu và tích hợp các phƣơng pháp dự báo.” Nguyễn Trung Kiên – Lớp CT1301 6
  7. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Xuất phát từ yêu cầu của đề tài, đồ án đƣợc chia làm các phần nhƣ sau: Lời mở đầu: Giới thiệu về dự báo và vai trò Chƣơng 1: BÀI TOÁN PHÂN TÍCH VÀ DỰ BÁO Trong chƣơng này trình bày các khái niệm và kiến thức cơ bản về dự báo cũng nhƣ các phƣơng pháp dự báo. Chƣơng 2: HỆ THỐNG PHÂN TÍCH VÀ DỰ BÁO Tìm hiểu các phƣơng pháp cơ bản để xây dựng hệ thống phân tích và dự báo. Chƣơng 3: THỰC NGHIỆM CÁC BÀI TOÁN DỰ BÁO Giới thiệu và áp dụng phần mềm SPSS Modeler của hãng IBM giải quyết các bài toán dự báo. Kết luận Tài liệu tham khảo Nguyễn Trung Kiên – Lớp CT1301 7
  8. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng CHƢƠNG 1: BÀI TOÁN PHÂN TÍCH VÀ DỰ BÁO 1.1. Khái niệm Dự báo là một khoa học và nghệ thuật tiên đoán những sự việc sẽ xảy ra trong tƣơng lai, trên cơ sở phân tích khoa học về các dữ liệu đã thu thập đƣợc. Khi tiến hành dự báo ta căn cứ vào việc thu thập xử lý số liệu trong quá khứ và hiện tại để xác định xu hƣớng vận động của các hiện tƣợng trong tƣơng lai nhờ vào một số mô hình toán học. Dự báo có thể là một dự đoán chủ quan hoặc trực giác về tƣơng lai. Nhƣng để cho dự báo đƣợc chính xác hơn, ngƣời ta cố loại trừ những tính chủ quan của ngƣời dự báo. Ngày nay, dự báo là một nhu cầu không thể thiếu đƣợc của mọi hoạt động kinh tế - xã hội, khoa học - kỹ thuật, đƣợc tất cả các ngành khoa học quan tâm nghiên cứu. 1.2. Ý nghĩa và vai trò của phân tích và dự báo trong quá trình ra quyết định kinh doanh 1.2.1. Ý nghĩa - Dùng để dự báo các mức độ tƣơng lai của hiện tƣợng, qua đó giúp các nhà quản trị doanh nghiệp chủ động trong việc đề ra các kế hoạch và các quyết định cần thiết phục vụ cho quá trình sản xuất kinh doanh, đầu tƣ, quảng bá, quy mô sản xuất, kênh phân phối sản phẩm, nguồn cung cấp tài chính, và chuẩn bị đầy đủ điều kiện cơ sở vật chất, kỹ thuật cho sự phát triển trong thời gian tới (kế hoạch cung cấp các yếu tố đầu vào nhƣ: lao động, nguyên vật liệu, tƣ liệu lao động, cũng nhƣ các yếu tố đầu ra dƣới dạng sản phẩm vật chất và dịch vụ). - Trong các doanh nghiệp nếu công tác dự báo đƣợc thực hiện một cách nghiêm túc còn tạo điều kiện nâng cao khả năng cạnh tranh trên thị trƣờng. - Dự báo chính xác sẽ giảm bớt mức độ rủi ro cho doanh nghiệp nói riêng và toàn bộ nền kinh tế nói chung. - Dự báo chính xác là căn cứ để các nhà hoạch định các chính sách phát triển kinh tế văn hoá xã hội trong toàn bộ nền kinh tế quốc dân. Nguyễn Trung Kiên – Lớp CT1301 8
  9. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng - Nhờ có dự báo các chính sách kinh tế, các kế hoạch và chƣơng trình phát triển kinh tế đƣợc xây dựng có cơ sở khoa học và mang lại hiệu quả kinh tế cao. - Nhờ có dự báo thƣờng xuyên và kịp thời, các nhà quản trị doanh nghiệp có khả năng kịp thời đƣa ra những biện pháp điều chỉnh các hoạt động kinh tế của doanh nghiệp nhằm thu đƣợc hiệu quả sản xuất kinh doanh cao nhất. 1.2.2. Vai trò - Dự báo tạo ra lợi thế cạnh tranh. - Công tác dự báo là một bộ phận không thể thiếu trong hoạt động của các doanh nghiệp, trong từng phòng ban nhƣ: phòng Kinh doanh hoặc Marketing, phòng Sản xuất hoặc phòng Nhân sự, phòng Kế toán – tài chính. 1.3. Phân loại dự báo 1.3.1. Căn cứ vào độ dài thời gian dự báo: Dự báo dài hạn: Khoảng thời gian từ 3 năm trở lên. Dự báo dài hạn đƣợc ứng dụng cho lập kế hoạch sản xuất sản phẩm mới, kế hoạch nghiên cứu và ứng dụng công nghệ mới, định vị doanh nghiệp hay mở rộng doanh nghiệp. Dự báo trung hạn: Khoảng thời gian dự báo thƣờng là từ 3 tháng đến 3 năm. Nó cần cho việc lập kế hoạch sản xuất, kế hoạch bán hàng, dự thảo ngân sách, kế hoạch tiền mặt, huy động các nguồn lực và tổ chức hoạt động tác nghiệp. Dự báo ngắn hạn: Khoảng thời gian dự báo có thể đến một năm, nhƣng thƣờng là ít hơn ba tháng. Loại dự báo này thƣờng đƣợc dùng trong kế hoạch mua hàng, điều độ công việc, cân bằng nhân lực, phân chia công việc. Dự báo trung hạn và dài hạn có ba đặc trƣng khác với dự báo ngắn hạn: Thứ nhất, dự báo trung hạn và dài hạn phải giải quyết nhiều vấn đề có tính toàn diện và yểm trợ cho các quyết định quản lý thuộc về hoạch định kế hoạch sản xuất sản phẩm và quá trình công nghệ. Thứ hai, dự báo ngắn hạn thƣờng dùng nhiều loại phƣơng pháp luận hơn là dự báo dài hạn. Đối với các dự báo ngắn hạn ngƣời ta dùng phổ biến các kỹ thuật toán học nhƣ bình quân di động, san bằng mũ và hồi quy theo xu hƣớng. Nói cách khác thì các phƣơng pháp ít định lƣợng đƣợc dùng để tiên đoán các vấn đề lớn toàn diện Nguyễn Trung Kiên – Lớp CT1301 9
  10. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng nhƣ có cần đƣa một sản phẩm mới nào đó vào danh sách các chủng loại mặt hàng của công ty không. Thứ ba, dự báo ngắn hạn có khuynh hƣớng chính xác hơn dự báo dài hạn. Vì các yếu tố ảnh hƣởng đến nhu cầu thay đổi hàng ngày, nếu kéo dài thời gian dự báo ra thì độ chính xác có khả năng giảm đi. Do vậy, cần phải thƣờng xuyên cập nhật và hoàn thiện các phƣơng pháp dự báo. 1.3.2. Dựa vào các phương pháp dự báo: Dự báo có thể chia thành 3 nhóm: - Dự báo bằng phương pháp chuyên gia: Loại dự báo này đƣợc tiến hành trên cơ sở tổng hợp, xử lý ý kiến của các chuyên gia thông thạo với hiện tƣợng đƣợc nghiên cứu, từ đó có phƣơng pháp xử lý thích hợp đề ra các dự đoán, các dự đoán này đƣợc cân nhắc và đánh giá chủ quan từ các chuyên gia. Phƣơng pháp này có ƣu thế trong trƣờng hợp dự đoán những hiện tƣợng hay quá trình bao quát rộng, phức tạp, chịu sự chi phối của khoa học - kỹ thuật, sự thay đổi của môi trƣờng, thời tiết, chiến tranh trong khoảng thời gian dài. Một cải tiến của phƣơng pháp Delphi – là phƣơng pháp dự báo dựa trên cơ sở sử dụng một tập hợp những đánh giá của một nhóm chuyên gia. Mỗi chuyên gia đƣợc hỏi ý kiến và rồi dự báo của họ đƣợc trình bày dƣới dạng thống kê tóm tắt. Việc trình bày những ý kiến này đƣợc thực hiện một cách gián tiếp (không có sự tiếp xúc trực tiếp) để tránh những sự tƣơng tác trong nhóm nhỏ qua đó tạo nên những sai lệch nhất định trong kết quả dự báo. Sau đó ngƣời ta yêu cầu các chuyên gia duyệt xét lại những dự báo của họ trên cơ sở tóm tắt tất cả các dự báo có thể có những bổ sung thêm. - Dự báo theo phương trình hồi quy: Theo phƣơng pháp này, mức độ cần dự báo phải đƣợc xây dựng trên cơ sở xây dựng mô hình hồi quy, mô hình này đƣợc xây dựng phù hợp với đặc điểm và xu thế phát triển của hiện tƣợng nghiên cứu. Để xây dựng mô hình hồi quy, đòi hỏi phải có tài liệu về hiện tƣợng cần dự báo và các hiện tƣợng có liên quan. Loại dự báo này thƣờng đƣợc sử dụng để dự báo trung hạn và dài hạn ở tầm vĩ mô. - Dự báo dựa vào dãy số thời gian: Là dựa trên cơ sở dãy số thời gian phản ánh sự biến động của hiện tƣợng ở những thời gian đã qua để xác định mức độ của hiện tƣợng trong tƣơng lai. Nguyễn Trung Kiên – Lớp CT1301 10
  11. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 1.3.3. Căn cứ vào nội dung (đối tượng dự báo) Có thể chia dự báo thành: Dự báo khoa học, dự báo kinh tế, dự báo xã hội, dự báo tự nhiên, thiên văn học - Dự báo khoa học: Là dự kiến, tiên đoán về những sự kiện, hiện tƣợng, trạng thái nào đó có thể hay nhất định sẽ xảy ra trong tƣơng lai. Theo nghĩa hẹp hơn, đó là sự nghiên cứu khoa học về những triển vọng của một hiện tƣợng nào đó, chủ yếu là những đánh giá số lƣợng và chỉ ra khoảng thời gian mà trong đó hiện tƣợng có thể diễn ra những biến đổi. - Dự báo kinh tế: Là khoa học dự báo các hiện tƣợng kinh tế trong tƣơng lai. Dự báo kinh tế đƣợc coi là giai đoạn trƣớc của công tác xây dựng chiến lƣợc phát triển kinh tế - xã hội và dự án kế hoạch dài hạn; không đặt ra những nhiệm vụ cụ thể, nhƣng chứa đựng những nội dung cần thiết làm căn cứ để xây dựng những nhiệm vụ đó. Dự báo kinh tế bao trùm sự phát triển kinh tế và xã hội của đất nƣớc có tính đến sự phát triển của tình hình thế giới và các quan hệ quốc tế. Thƣờng đƣợc thực hiện chủ yếu theo những hƣớng sau: dân số, nguồn lao động, việc sử dụng và tái sản xuất chúng, năng suất lao động; tái sản xuất xã hội trƣớc hết là vốn sản xuất cố định: sự phát triển của cách mạng khoa học – kĩ thuật và công nghệ và khả năng ứng dụng vào kinh tế; mức sống của nhân dân, sự hình thành các nhu cầu phi sản xuất, động thái và cơ cấu tiêu dung, thu nhập của nhân dân; động thái kinh tế quốc dân và sự chuyển dịch cơ cấu (nhịp độ, tỉ lệ, hiệu quả); sự phát triểu các khu vực và ngành kinh tế (khối lƣợng động thái, cơ cấu, trình độ kĩ thuật, bộ máy, các mối liên hệ liên ngành); phân vùng sản xuất, khai thác tài nguyên thiên nhiên và phát triển các vùng kinh tế trong nƣớc, các mối liên hệ liên vùng; dự báo sự phát triển kinh tế của thế giới kinh tế. Các kết quả dự báo kinh tế cho phép hiểu rõ đặc điểm của các điều kiện kinh tế - xã hội để đặt chiến lƣợc phát triển kinh tế đúng đắn, xây dựng các chƣơng trình, kế hoạch phát triển một cách chủ động, đạt hiệu quả cao và vững chắc. - Dự báo xã hội: Dự báo xã hội là khoa học nghiên cứu những triển vọng cụ thể của một hiện tƣợng, một sự biến đổi, một quá trình xã hội, để đƣa ra dự báo hay dự đoán về tình hình diễn biến, phát triển của một xã hội. - Dự báo tự nhiên, thiên văn học, loại dự báo này thƣờng bao gồm: Nguyễn Trung Kiên – Lớp CT1301 11
  12. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng + Dự báo thời tiết: Thông báo thời tiết dự kiến trong một thời gian nhất định trên một vùng nhất định. Trong dự báo thời tiết có dự báo chung, dự báo khu vực, dự báo địa phƣơng, v.v. Về thời gian, có dự báo thời tiết ngắn (1-3 ngày) và dự báo thời tiết dài (tới một năm). + Dự báo thuỷ văn: Là loại dự báo nhằm tính để xác định trƣớc sự phát triển các quá trình, hiện tƣợng thuỷ văn xảy ra ở các sông hồ, dựa trên các tài liệu liên quan tới khí tƣợng thuỷ văn. Dự báo thuỷ văn dựa trên sự hiểu biết những quy luật phát triển của các quá trình, khí tƣợng thuỷ văn, dự báo sự xuất hiện của hiện tƣợng hay yếu tố cần quan tâm. Căn cứ thời gian dự kiến, dự báo thuỷ văn đƣợc chia thành dự báo thuỷ văn hạn ngắn (thời gian không quá 2 ngày), hạn vừa (từ 2 đến 10 ngày); dự báo thuỷ văn mùa (thời gian dự báo vài tháng); cấp báo thuỷ văn: thông tin khẩn cấp về hiện tƣợng thuỷ văn gây nguy hiểm. Theo mục đích dự báo, có các loại: dự báo thuỷ văn phục vụ thi công, phục vụ vận tải, phục vụ phát điện,v.v. Theo yếu tố dự báo, có: dự báo lƣu lƣợng lớn nhất, nhỏ nhất, dự báo lũ, v.v. + Dự báo địa lý: Là việc nghiên cứu về hƣớng phát triển của môi trƣờng địa lí trong tƣơng lai, nhằm đề ra trên cơ sở khoa học những giải pháp sử dụng hợp lí và bảo vệ môi trƣờng. + Dự báo động đất: Là loại dự báo trƣớc địa điểm và thời gian có khả năng xảy ra động đất. Động đất không đột nhiên xảy ra mà là một quá trình tích luỹ lâu dài, có thể hiện ra trƣớc bằng những biến đổi địa chất, những hiện tƣợng vật lí, những trạng thái sinh học bất thƣờng ở động vật,v.v. Việc dự báo thực hiện trên cơ sở nghiên cứu bản đồ phân vùng động đất và những dấu hiệu báo trƣớc. Cho đến nay, chƣa thể dự báo chính xác về thời gian động đất sẽ xảy ra. 1.4. Các phƣơng pháp dự báo 1.4.1. Phương pháp dự báo định tính Phƣơng pháp dự báo định tính dựa trên cơ sở doanh số của từng sản phẩm hay dịch vụ riêng biệt và dựa trên những ý kiến về các khả năng có liên hệ của những nhân tố nhân quả trong tƣơng lai. Những phƣơng pháp này có liên quan đến mức độ phức tạp của khảo sát ý kiến đƣợc tiến hành một cách khoa học để nhận biết về các sự kiện tƣơng lai. Dƣới đây là các dự báo định tính thƣờng dùng: Nguyễn Trung Kiên – Lớp CT1301 12
  13. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 1.4.1.1. Lấy ý kiến của ban điều hành Phƣơng pháp lấy ý kiến của ban điều hành sử dụng rộng rãi ở các tổ chức. Khi thực hiện công việc dự báo, họ tổng hợp ý kiến của các nhà quản trị cấp cao, trƣởng các bộ phận của doanh nghiệp, và sử dụng các số liệu thống kê về những chỉ tiêu tổng hợp: doanh số, chi phí, lợi nhuận, Ngoài ra cần lấy thêm ý kiến của các chuyên gia về marketing, tài chính, sản xuất, kỹ thuật. Nhƣợc điểm lớn nhất của phƣơng pháp này là có tính chủ quan của các thành viên và ý kiến của ngƣời có chức vụ cao nhất thƣờng chi phối ý kiến của những ngƣời khác. 1.4.1.2. Lấy ý kiến của người bán hàng Những ngƣời bán hàng tiếp xúc thƣờng xuyên với khách hàng, do đó họ hiểu rõ nhu cầu, thị hiếu của ngƣời tiêu dùng. Họ có thể dự đoán đƣợc lƣợng hàng tiêu thụ tại khu vực họ phụ trách. Tập hợp ý kiến của nhiều ngƣời bán hàng tại nhiều khu vực khác nhau, ta có đƣợc lƣợng dự báo tổng hợp về nhu cầu đối với loại sản phẩm đang xét. Nhƣợc điểm của phƣơng pháp này là phụ thuộc vào đánh giá chủ quan của ngƣời bán hàng. Một số có khuynh hƣớng lạc quan đánh giá cao lƣợng hàng bán ra của ngƣời bán. Ngƣợc lại, một số khác lại muốn giảm xuống để dễ đạt định mức. 1.4.1.3. Phương pháp chuyên gia (Delphi) Phƣơng pháp này thu thập ý kiến của các chuyên gia trong hoặc ngoài doanh nghiệp theo những mẫu câu hỏi đƣợc in sẵn và đƣợc thực hiện nhƣ sau: - Mỗi chuyên gia đƣợc phát một thƣ yêu cầu trả lời một số câu hỏi phục vụ cho việc dự báo. - Nhân viên dự báo tập hợp các câu trả lời, sắp xếp chọn lọc và tóm tắt lại các ý kiến của các chuyên gia. - Dựa vào bảng tóm tắt này nhân viên dự báo lại tiếp tục nêu ra các câu hỏi để các chuyên gia trả lời tiếp. - Tập hợp các ý kiến mới của các chuyên gia. Nếu chƣa thỏa mãn thì tiếp tục quá trình nêu trên cho đến khi đạt yêu cầu dự báo. Nguyễn Trung Kiên – Lớp CT1301 13
  14. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Ƣu điểm của phƣơng pháp này là tránh đƣợc các liên hệ cá nhân với nhau, không xảy ra va chạm giữa các chuyên gia và họ không bị ảnh hƣởng bởi ý kiến của một ngƣời nào đó có ƣu thế trong số ngƣời đƣợc hỏi ý kiến. 1.4.1.4. Phương pháp điều tra người tiêu dùng Ngƣời ta áp dụng phƣơng pháp để thu thập nguồn thông tin từ ngƣời tiêu dùng về nhu cầu hiện tại cũng nhƣ tƣơng lai. Cuộc điều tra nhu cầu đƣợc thực hiện bởi những nhân viên bán hàng hoặc nhân viên nghiên cứu thị trƣờng. Họ thu thập ý kiến khách hàng thông qua phiếu điều tra, phỏng vấn trực tiếp hay điện thoại, Cách tiếp cận này không những giúp cho doanh nghiệp về dự báo nhu cầu mà cả trong việc cải tiến thiết kế sản phẩm. Phƣơng pháp này mất nhiều thời gian, việc chuẩn bị phức tạp, khó khăn và tốn kém, có thể không chính xác trong các câu trả lời của ngƣời tiêu dùng. 1.4.2. Phương pháp dự báo định lượng Dự báo định lƣợng dựa trên số liệu thống kê trong quá khứ, những số liệu này giả sử có liên quan đến tƣơng lai. Tất cả các mô hình dự báo theo định lƣợng có thể sử dụng thông qua chuỗi thời gian và các giá trị này đƣợc quan sát đo lƣờng các giai đoạn theo từng chuỗi. - Tính chính xác của dự báo: Tính chính xác của dự báo đề cập đến độ chênh lệch của dự báo với số liệu thực tế. Bởi vì dự báo đƣợc hình thành trƣớc khi số liệu thực tế xảy ra, vì vậy tính chính xác của dự báo chỉ có thể đánh giá sau khi thời gian đã qua đi. Nếu dự báo càng gần với số liệu thực tế, ta nói dự báo có độ chính xác cao và lỗi trong dự báo càng thấp. Ngƣời ta thƣờng dùng độ sai lệch tuyệt đối bình quân (MAD) để tính toán: Tổng các sai số tuyệt đối của n giai đoạn MAD = n giai đoạn Nguyễn Trung Kiên – Lớp CT1301 14
  15. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng n i 1 Nhu cầu thực tế - nhu cầu dự báo MAD= N 1.4.2.1. Dự báo ngắn hạn Dự báo ngắn hạn ƣớc lƣợng tƣơng lai trong thời gian ngắn, có thể từ vài ngày đến vài tháng. Dự báo ngắn hạn cung cấp cho các nhà quản lý những thông tin để đƣa ra quyết định về các vấn đề nhƣ: - Cần dự trữ bao nhiêu đối với một loại sản phẩm cụ thể nào đó cho tháng tới ? - Lên lịch sản xuất từng loại sản phẩm cho tháng tới nhƣ thế nào ? - Số lƣợng nguyên vật liệu cần đặt hàng để nhận vào tuần tới là bao nhiêu ? * Dự báo sơ bộ: Mô hình dự báo sơ bộ là loại dự báo nhanh, không cần chi phí và dễ sử dụng. Ví dụ nhƣ: - Sử dụng số liệu hàng bán ngày hôm nay làm dự báo cho lƣợng hàng bán ở ngày mai. - Sử dụng số liệu ngày này ở năm rồi nhƣ là dự báo lƣợng hàng bán cho ngày ấy ở năm nay. Mô hình dự báo sơ bộ quá đơn giản cho nên thƣờng hay gặp những sai sót trong dự báo. * Phương pháp bình quân di động có quyền số. Phƣơng pháp bình quân di động xem vai trò của các số liệu trong quá khứ là nhƣ nhau. Trong một vài trƣờng hợp, các số liệu này có ảnh hƣởng khác nhau trên kết quả dự báo, vì thế, ngƣời ta thích sử dụng quyền số không đồng đều cho các số liệu quá khứ. Quyền số hay trọng số là các con số đƣợc gán cho các số liệu quá khứ để chỉ mức độ quan trọng của chúng ảnh hƣởng đến kết quả dự báo. Quyền số lớn đƣợc gán cho Nguyễn Trung Kiên – Lớp CT1301 15
  16. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng số liệu gần với kỳ dự báo nhất để ám chỉ ảnh hƣởng của nó là lớn nhất. Việc chọn các quyền số phụ thuộc vào kinh nghiệm và sự nhạy cảm của ngƣời dự báo. Công thức tính toán: n Ak i 1 t i i F n t k i 1 i Với: Ft - Dự báo thời kỳ thứ t At-i - Số liệu thực tế thời kỳ trƣớc (i=1,2, ,n) ki - Quyền số tƣơng ứng ở thời kỳ i Phƣơng pháp bình quân di động có quyền số có ƣu điểm là san bằng đƣợc các biến động ngẫu nhiên trong dãy số. Tuy vậy, phƣơng pháp này có nhƣợc điểm sau: - Do việc san bằng các biến động ngẫu nhiên nên làm giảm độ nhạy cảm đối với những thay đổi thực đã đƣợc phản ánh trong dãy số. - Số bình quân di động chƣa cho chúng ta xu hƣớng phát triển của dãy số một cách tốt nhất. Nó chỉ thể hiện sự vận động trong quá khứ chứ chƣa thể kéo dài sự vận động đó trong tƣơng lai. * Phương pháp điều hòa mũ. Điều hòa mũ đƣa ra các dự báo cho giai đoạn trƣớc và thêm vào đó một lƣợng điều chỉnh để có đƣợc lƣợng dự báo cho giai đoạn kế tiếp. Sự điều chỉnh này là một tỷ lệ nào đó của sai số dự báo ở giai đoạn trƣớc và đƣợc tính bằng cách nhân số dự báo của giai đoạn trƣớc với hệ số nằm giữa 0 và 1. Hệ số này gọi là hệ số điều hòa. Công thức tính nhƣ sau: Ft = Ft−1+ α (At−1−Ft−1) Trong đó : F t - Dự báo cho giai đoạn thứ t, giai đoạn kế tiếp. F t -1 - Dự báo cho giai đoạn thứ t-1, giai đoạn trƣớc. A t -1 - Số liệu thực tế của giai đoạn thứ t-1 Nguyễn Trung Kiên – Lớp CT1301 16
  17. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng * Phương pháp điều hòa mũ theo xu hướng Đối với kế hoạch ngắn hạn thì mùa vụ và xu hƣớng là nhân tố không quan trọng. Khi chúng ta chuyển từ dự báo ngắn hạn sang dự báo trung hạn thì mùa vụ và xu hƣớng trở nên quan trọng hơn. Kết hợp nhân tố xu hƣớng vào dự báo điều hòa mũ đƣợc gọi là điều hòa mũ theo xu hƣớng hay điều hòa đôi. Vì ƣớc lƣợng cho số trung bình và ƣớc lƣợng cho xu hƣớng cho số trung bình và hệ số điều hòa đƣợc điều hòa cả hai. Hệ số điều hòa cho xu hƣớng, đƣợc sử dụng trong mô hình này . Công thức tính toán nhƣ sau: FTt = St - 1 + T t - 1(At -FTt) Với: St = FTt + (FTt - FTt - 1 - Tt - 1) Tt = Tt - 1 Trong đó FTt - Dự báo theo xu hƣớng trong giai đoạn t St - Dự báo đã đƣợc điều hòa trong giai đoạn t Tt - Ƣớc lƣợng xu hƣớng trong giai đoạn t At - Số liệu thực tế trong giai đoạn t t - Thời đoạn kế tiếp. t-1 - Thời đoạn trƣớc. 1.4.2.2. Dự báo dài hạn Dự báo dài hạn là ƣớc lƣợng tƣơng lai trong thời gian dài, thƣờng hơn một năm. Dự báo dài hạn rất cần thiết trong quản trị sản xuất để trợ giúp các quyết định chiến lƣợc về hoạch định sản phẩm, quy trình công nghệ và các phƣơng tiện sản xuất. Ví dụ nhƣ: - Thiết kế sản phẩm mới. - Xác định năng lực sản xuất cần thiết là bao nhiêu? Máy móc, thiết bị nào cần sử dụng và chúng đƣợc đặt ở đâu ? - Lên lịch trình cho những nhà cung ứng theo các hợp đồng cung cấp nguyên vật liệu dài hạn. Nguyễn Trung Kiên – Lớp CT1301 17
  18. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Dự báo dài hạn có thể đƣợc xây dựng bằng cách vẽ một đƣờng thẳng đi xuyên qua các số liệu quá khứ và kéo dài nó đến tƣơng lai. Dự báo trong giai đoạn kế tiếp có thể đƣợc vẽ vƣợt ra khỏi đồ thị thông thƣờng. Phƣơng pháp tiếp cận theo kiểu đồ thị đối với dự báo dài hạn có thể dùng trong thực tế, nhƣng điểm không thuận lợi của nó là vấn đề vẽ một đƣờng tƣơng ứng hợp lý nhất đi qua các số liệu quá khứ này. Doanh số Đƣờng xu hƣớng Thời gian Phân tích hồi qui sẽ cung cấp cho chúng ta một phƣơng pháp làm việc chính xác để xây dựng đƣờng dự báo theo xu hƣớng. * Phương pháp hồi qui tuyến tính. Phân tích hồi qui tuyến tính là một mô hình dự báo thiết lập mối quan hệ giữa biến phụ thuộc với hai hay nhiều biến độc lập. Trong phần này, chúng ta chỉ xét đến một biến độc lập duy nhất. Nếu số liệu là một chuỗi theo thời gian thì biến độc lập là giai đoạn thời gian và biến phụ thuộc thông thƣờng là doanh số bán ra hay bất kỳ chỉ tiêu nào khác mà ta muốn dự báo. Mô hình này có công thức: Y = ax + b n xy x y x2 y x xy a = b = 2 n x22() x n x() x 2 Trong đó : y - Biến phụ thuộc cần dự báo. x - Biến độc lập a - Độ dốc của đƣờng xu hƣớng Nguyễn Trung Kiên – Lớp CT1301 18
  19. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng b - Tung độ gốc n - Số lƣợng quan sát Trong trƣờng hợp biến độc lập x đƣợc trình bày thông qua từng giai đoạn theo thời gian và chúng phải cách đều nhau (nhƣ : x = 0 . Vì vậy 2002, 2003, 2004, ) thì ta có thể điều chỉnh lại để sao cho việc tính toán sẽ trở nên đơn giản và dễ dàng hơn nhiều. Nếu có một số lẻ lƣợng mốc thời gian: chẳng hạn x = 0, là 5, thì giá trị của x đƣợc ấn định nhƣ sau : -2, -1, 0, 1, 2 và nhƣ thế giá trị của x đƣợc sử dụng cho dự báo trong năm tới là +3. Nếu có một số chẵn lƣợng mốc thời gian: chẳng hạn x = 0 và là 6 thì giá trị của x đƣợc ấn định là : -5, -3, -1, 1, 3, 5. Nhƣ thế giá trị của x đƣợc dùng cho dự báo trong năm tới là +7. Trƣờng hợp biến độc lập không phải là biến thời gian, hồi qui tuyến tính là một nhóm các mô hình dự báo đƣợc gọi là mô hình nhân quả. Mô hình này đƣa ra các dự báo sau khi thiết lập và đo lƣờng các biến phụ thuộc với một hay nhiều biến độc lập. * Tính chất mùa vụ trong dự báo chuỗi thời gian. Loại mùa vụ thông thƣờng là sự lên xuống xảy ra trong vòng một năm và có xu hƣớng lặp lại hàng năm. Những vụ mùa này xảy ra có thể do điều kiện thời tiết, địa lý hoặc do tập quán của ngƣời tiêu dùng khác nhau Cách thức xây dựng dự báo với phân tích hồi qui tuyến tính khi vụ mùa hiện diện trong chuỗi số theo thời gian. Ta thực hiện các bƣớc: - Chọn lựa chuỗi số liệu quá khứ đại diện. - Xây dựng chỉ số mùa vụ cho từng giai đoạn thời gian. Y I i i Y 0 Với - Số bình quân của các thời kỳ cùng tên. - Số bình quân chung của tất cả các thời kỳ trong dãy số. Ii - Chỉ số mùa vụ kỳ thứ i. Nguyễn Trung Kiên – Lớp CT1301 19
  20. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng - Sử dụng các chỉ số mùa vụ để hóa giải tính chất mùa vụ của số liệu. - Phân tích hồi qui tuyến tính dựa trên số liệu đã phi mùa vụ. - Sử dụng phƣơng trình hồi qui để dự báo cho tƣơng lai. - Sử dụng chỉ số mùa vụ để tái ứng dụng tính chất mùa vụ cho dự báo. 1.5. Quy trình dự báo Quy trình dự báo đƣợc chia thành 9 bƣớc: Bước 1: Xác định mục tiêu: - Các mục tiêu liên quan đến các quyết định cần đến dự báo phải đƣợc nói rõ. Nếu quyết định vẫn không thay đổi bất kể có dự báo hay không thì mọi nỗ lực thực hiện dự báo cũng vô ích. - Nếu ngƣời sử dụng và ngƣời làm dự báo có cơ hội thảo luận các mục tiêu và kết quả dự báo sẽ đƣợc sử dụng nhƣ thế nào, thì kết quả dự báo sẽ có ý nghĩa quan trọng. Bước 2: Xác định dự báo cái gì: - Khi các mục tiêu tổng quát đã rõ ta phải xác định chính xác là dự báo cái gì (cần có sự trao đổi). + Ví dụ: Chỉ nói dự báo doanh số không thì chƣa đủ, mà cần phải hỏi rõ hơn là: Dự báo doanh thu bán hàng (sales revenue) hay số đơn vị doanh số (unit sales). Dự báo theo năm, quý, tháng hay tuần. + Nên dự báo theo đơn vị để tránh những thay đổi của giá cả. Bước 3: Xác định khía cạnh thời gian Có 2 loại khía cạnh thời gian cần xem xét: - Thứ nhất: Độ dài dự báo, cần lƣu ý: + Đối với dự báo theo năm: từ 1 đến 5 năm. + Đối với dự báo quý: từ 1 hoặc 2 năm. + Đối với dự báo tháng: từ 12 đến 18 tháng. Nguyễn Trung Kiên – Lớp CT1301 20
  21. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng - Thứ hai: Ngƣời sử dụng và ngƣời làm dự báo phải thống nhất tính cấp thiết của dự báo. Bước 4: Xem xét dữ liệu: - Dữ liệu cần để dự báo có thể từ 2 nguồn: bên trong và bên ngoài. - Cần phải lƣu ý dạng dữ liệu sẵn có (thời gian, đơn vị tính, ). - Dữ liệu thƣờng đƣợc tổng hợp theo cả biến và thời gian, nhƣng tốt nhất là thu thập dữ liệu chƣa đƣợc tổng hợp. - Cần trao đổi giữa ngƣời sử dụng và ngƣời làm dự báo. Bước 5: Lựa chọn mô hình: - Làm sao để quyết định đƣợc phƣơng pháp thích hợp nhất cho một tình huống nhất định? + Loại và lƣợng dữ liệu sẵn có. + Mô hình (bản chất) dữ liệu quá khứ. + Tính cấp thiết của dự báo. + Độ dài dự báo. + Kiến thức chuyên môn của ngƣời làm dự báo. Bước 6: Đánh giá mô hình: - Đối với các phƣơng pháp định tính thì bƣớc này ít phù hợp hơn so với phƣơng pháp định lƣợng . - Đối với các phƣơng pháp định lƣợng, cần phải đánh giá mức độ phù hợp của mô hình (trong phạm vi mẫu dữ liệu). - Đánh giá mức độ chính xác của dự báo (ngoài phạm vi mẫu dữ liệu). - Nếu mô hình không phù hợp, quay lại bƣớc 5. Nguyễn Trung Kiên – Lớp CT1301 21
  22. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 7: Chuẩn bị dự báo: - Nếu có thể nên sử dụng hơn một phƣơng pháp dự báo, và nên là những loại phƣơng pháp khác nhau (ví dụ mô hình hồi quy và san mũ Holt, thay vì cả 2 mô hình hồi quy khác nhau). - Các phƣơng pháp đƣợc chọn nên đƣợc sử dụng để chuẩn bị cho một số các dự báo (ví vụ trƣờng hợp xấu nhất, tốt nhất và có thể nhất). Bước 8: Trình bày kết quả dự báo: - Kết quả dự báo phải đƣợc trình bày rõ ràng cho ban quản lý sao cho họ hiểu các con số đƣợc tính toán nhƣ thế nào và chỉ ra sự tin cậy trong kết quả dự báo. - Ngƣời dự báo phải có khả năng trao đổi các kết quả dự báo theo ngôn ngữ mà các nhà quản lý hiểu đƣợc. - Trình bày cả ở dạng viết và dạng nói. - Bảng biểu phải ngắn gọn, rõ ràng. - Chỉ cần trình bày các quan sát và dự báo gần đây thôi. - Chuỗi dữ liệu dài có thể đƣợc trình bày dƣới dạng đồ thị (cả giá trị thực và dự báo). - Trình bày thuyết trình nên theo cùng hình thức và cùng mức độ với phần trình bày viết. Bước 9: Theo dõi kết quả dự báo: - Lệch giữa giá trị dự báo và giá trị thực phải đƣợc thảo luận một cách tích cực, khách quan và cởi mở. - Mục tiêu của việc thảo luận là để hiểu tại sao có các sai số, để xác định độ lớn của sai số. - Trao đổi và hợp tác giữa ngƣời sử dụng và ngƣời làm dự báo có vai trò rất quan trọng trong việc xây dựng và duy trì quy trình dự báo thành công. Nguyễn Trung Kiên – Lớp CT1301 22
  23. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng CHƢƠNG 2: HỆ THỐNG PHÂN TÍCH VÀ DỰ BÁO Các hệ thống phân tích và dự báo đƣợc xây dựng dựa trên yêu cầu thực tế của từng bài toán, qua đó lựa chọn các phƣơng pháp dự báo phù hợp để xây dựng hệ thống là một yếu tố quan trọng của những chuyên gia làm trong lĩnh vực dự báo. Trong đồ án này chúng tôi xây dựng hệ thống dự báo dựa trên các phƣơng pháp phân tích và dự báo cơ bản để từ đó nắm đƣợc nguyên lý xây dựng hệ thống phân tích và dự báo. 2.1. Dự báo từ các mức độ bình quân 2.1.1. Dự báo từ số bình quân trượt (di động) Phƣơng pháp số bình quân di động là một trong những phƣơng pháp biểu hiện xu hƣớng phát triển cơ bản của hiện tƣợng nghiên cứu, hay nói cách khác, mô hình hoá sự phát triển thực tế của hiện tƣợng nghiên cứu dƣới dạng dãy các số bình quân di động. Phƣơng pháp bình quân di động còn đƣợc sử dụng trong dự báo thống kê. Trên cơ sở xây dựng một dãy số bình quân di động, ngƣời ta xây dựng mô hình dự báo. Mô hình dự báo là: ŷn+1 = Mn Khoảng dự báo sẽ đƣợc xác định theo công thức sau: 1 ŷn+L ± tS 1 k Trong đó t là giá trị tra trong bảng tiêu chuẩn t- Student với (k-1) bậc tự do và xác suất tin cậy (1-α). Độ lệch tiêu chuẩn mẫu điều chỉnh đƣợc tính theo công thức sau: ()yM2 S = ii k 1 2.1.2. Mô hình dự báo dựa vào lượng tăng (giảm) tuyệt đối bình quân - Phƣơng pháp này đƣợc sử dụng trong trƣờng hợp lƣợng tăng (giảm) tuyệt đối liên hoàn xấp xỉ nhau qua các năm (dãy số thời gian có dạng gần giống nhƣ cấp số cộng): xấp xỉ nhau (i= z n). Nguyễn Trung Kiên – Lớp CT1301 23
  24. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Mô hình dự báo theo phƣơng trình: Y nL y = yn + .L Trong đó: : Mức độ dự đoán ở thời gian (n+L) : Mức độ cuối cùng của dãy số thời gian y : Lƣợng tăng, giảm tuyệt đối bình quân L: Tầm xa của dự đoán ( L=1,2,3, năm) Trong đó: = 2.1.3. Mô hình dự báo dựa vào tốc độ phát triển bình quân Thƣờng áp dụng trong trƣờng hợp các mức độ của dãy số biến động theo thời gian có tốc độ phát triển (hoặc tốc độ tăng, giảm) từng kỳ gần nhau (dãy số thời gian có dạng gần nhƣ cấp số nhân). Có hai mô hình dự đoán: * Dự đoán mức độ hàng năm: (có thể dùng để dự báo trong dài hạn). - Phƣơng pháp này đƣợc áp dụng khi tốc độ phát triển hoàn toàn xấp xỉ nhau. - Mô hình dự đoán: L = .t : Mức độ dự đoán ở thời gian (n+L) : Mức độ đƣợc dùng làm kỳ gốc để ngoại suy L: Tầm xa của dự đoán ( L=1,2,3, năm) Nguyễn Trung Kiên – Lớp CT1301 24
  25. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng t : Tốc độ phát triển bình quân hàng năm yn t n 1 y 1 *Dự đoán mức độ của khoảng thời gian dưới 1 năm (quý, tháng- dự báo ngắn hạn) i 1 t Yyij j Sr Trong đó: Y ij : Là mức độ của hiện tƣợng ở thời gian j (j=1,m) của năm i n yYj ij - Tổng các mức độ của thời gian j của năm i (i=1 n) i 1 : Tốc độ phát triển bình quân hàng 2 3 n-1 Sr= 1 + ( ) +( ) + ( ) + + ( ) n: có thể là số năm hoặc số lƣợng mức độ của từng năm. 2.2. Mô hình dự báo theo phƣơng trình hồi quy (dự báo dựa vào xu thế) Từ xu hƣớng phát triển của hiện tƣợng nghiên cứu ta xác định đƣợc phƣơng trình hồi quy lý thuyết, đó là phƣơng trình phù hợp với xu hƣớng và đặc điểm biến động của hiện tƣợng nghiên cứu, từ đó có thể ngoại suy hàm xu thế để xác định mức độ phát triển trong tƣơng lai. 2.2.1. Mô hình hồi quy theo thời gian * Ví dụ: Mô hình dự báo theo phƣơng trình hồi quy đƣờng thẳng: Ŷ = a+ bt Trong đó: a,b là những tham số quy định vị trí của đƣờng hồi quy Từ phƣơng trình này, bằng phƣơng pháp bình phƣơng nhỏ nhất hoặc thông qua việc đặt thứ tự thời gian (t) trong dãy số để tính các tham số a,b. Nguyễn Trung Kiên – Lớp CT1301 25
  26. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Nếu đặt thứ tự thời gian t sao cho t khác 0 ( 0), ta có các công thức tính tham số sau: yt y. t a 22 tt b = y a. t Nếu đặt thứ tự thời gian t sao cho khác 0 ( =0), ta có các công thức tính tham số sau: y yt. ayb 2 n t 2.2.2. Mô hình hồi quy giữa các tiêu thức * Mô hình hồi quy tuyến tính giữa hai tiêu thức Từ việc xây dựng phƣơng trình hồi quy tuyến tính giữa các tiêu thức đã nêu ở phần trên, ta có thể dự đoán các giá trị của Y trong tƣơng lai khi các biến trong hàm hồi quy thay đổi, cụ thể: Đối với phƣơng trình tuyến tính giản đơn: Yx= a+ bx Trong đó: a, b là những tham số quy định vị trí của đƣờng hồi quy. Hằng số a là điểm cắt trục tung (biểu hiện của tiêu thức kết quả) khi tiêu thức nguyên nhân x bằng 0. Độ dốc b chính là lƣợng tăng giảm của tiêu thức kết quả khi tiêu thức nguyên nhân thay đổi. Từ phƣơng trình này, ta sẽ dự đoán đƣợc giá trị của tiêu thức kết quả trong tƣơng lai khi có sự thay đổi của tiêu thức nguyên nhân. Tƣơng tự nhƣ trong hồi quy giản đơn, trong hồi quy bội, giá trị dự đoán của Y có đƣợc tƣơng ứng với các giá trị cho trƣớc của k biến X bằng các thay các giá trị của k biến X vào phƣơng trình hồi quy bội. Các giá trị cho trƣớc của biến X lần lƣợt là x1,n+1,x2,n+1, ,xk,n+1 thì giá trị dự đoán Yn+1 sẽ là: Yn+1= a+ b1 x1,n+1 + b2 x2,n+1+ + bkxk,n+1 Nguyễn Trung Kiên – Lớp CT1301 26
  27. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 2.3. Dự báo dựa vào hàm xu thế và biến động thời vụ Phƣơng pháp dự báo này áp dụng đối với hiện tƣợng nghiên cứu chịu tác động của nhiều nhân tố biến động. Nhƣ biến động thời vụ, biến động xu hƣớng và biến động bất thƣờng. - Mô hình dự báo sẽ có thể dựa vào hàm xu thế kết hợp với biến động thời vụ: Yt= Ŷ+tv+bt - Hoặc dự báo dựa vào hàm xu thế kết hợp nhân tố với biến động thời vụ: Yt= Ŷx tv xbt Trong đó: Ŷ: Mức độ lý thuyết xác định từ hàm xu thế ( hoặc các phƣơng pháp nêu trên) tv: Ảnh hƣởng của nhân tố thời vụ bt: Ảnh hƣởng của nhân tố bất thƣờng Nhìn chung, hàm xu thế, chỉ số thời vụ đƣợc xác định từng mô hình còn những nhân tố biến động bất thƣờng thƣờng không dự báo đƣợc, do vậy mô hình chỉ còn lại hai nhân tố: biến động xu hƣớng và biến động thời vụ. 2.3.1. Dự báo dựa vào mô hình cộng * Trƣớc tiên xác định hàm xu thế tuyến tính sản lƣợng doanh nghiệp có dạng là: Ŷ = a + bt Trong đó: a, b là các tham số quy định vị trí của hàm xu thế tuyến tình, đƣợc tính theo công thức sau: 12t . y n 1 by2 j m. n ( n 1) mm2 y mn.1 abj mn.2 Nguyễn Trung Kiên – Lớp CT1301 27
  28. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Trong đó: n: Số năm m: Khoảng cách thời gian trong một năm (m= 4 đối với quý, m=12 đối với năm) t: Thứ tự thời gian trong dãy số (năm) * Tính các mức độ mang tính thời vụ theo công thức sau: m 1 tv= y - y - b(i- ) với i= 1,2,3,4 i j 2 Sau khi xác định xong hàm xu thế và biến động thời vụ thì mô hình dự báo kết hợp cộng giữa xu thế biến động và tính thời vụ có dạng: Yt = Ŷ + tv 2.3.2. Dự báo dựa vào mô hình nhân Mô hình dự báo theo kết hợp nhân có dạng: Yt = Ŷ x tv Để dự báo theo mô hình này, trƣớc hết phải tính đƣợc hàm xu thế, hàm xu thế trong trƣờng hợp này phải đƣợc loại trừ biến động thời vụ bằng cách xây dựng dãy số bình quân trƣợt ( yt ) với số lƣợng mức độ bằng 4 với tài liệu quý và 12 với tài liệu tháng. yt Từ đó ta tính đƣợc , từ đó xác định thành phần thời vụ (tvt) bằng cách tính y t các số bình quân tvt sau đó tính hệ số điều chỉnh H: m H = ( với m= 4) đối với tài liệu quý, 12 đối với tài liệu tháng ) tvt Từ đó tính chỉ số thời vụ Itv = x H Sau khi xác định đƣợc tvt thì xác định dãy số ft là dãy số đã loại bỏ thành phần yt thời vụ nhƣ sau: ft tvt Nguyễn Trung Kiên – Lớp CT1301 28
  29. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 2.4. Dự báo theo phƣơng pháp san bằng mũ Phƣơng pháp san bằng mũ (hay còn gọi là phƣơng pháp dự đoán bình quân mũ) là một phƣơng pháp dự đoán thống kê ngắn hạn hiện đƣợc sử dụng nhiều trong công tác dự đoán thực tế trên thế giới. Phƣơng pháp san bằng mũ coi giá trị thông tin của mỗi mức độ là tăng dần kể từ đầu dãy số cho đến cuối dãy số. Vì trên thực tế ở những thời gian khác nhau thì hiện tƣợng nghiên cứu chịu sự tác động của những nhân tố khác nhau và cƣờng độ không giống nhau. Các mức độ ngày càng mới (ở cuối dãy số thời gian) càng cần phải đƣợc chú ý đến nhiều hơn so với các mức độ cũ (ở đầu dãy số). Hay nói cách khác, mức độ càng xa so với thời điểm hiện tại thì càng ít giá trị thông tin, do đó càng ít ảnh hƣởng đến mức độ dự đoán. Tuỳ thuộc vào đặc điểm dãy số thời gian (chuỗi thời gian) có biến động xu thế, biến động thời vụ hay không mà phƣơng pháp san bằng mũ có thể sử dụng một trong các phƣơng pháp cơ bản sau: 2.4.1. Mô hình đơn giản (phương pháp san bằng mũ đơn giản) Điều kiện áp dụng: đối với dãy số thời gian không có xu thế và không có biến động thời vụ rõ rệt. Trƣớc hết, dãy số thời gian đƣợc san bằng nhờ có sự tham gia của các số bình quân mũ, tức là các số bình quân di động gia quyền theo quy luật hàm số mũ. Theo phƣơng pháp này, ở thời gian t nào đó dựa vào các giá trị thực tế đã biết để ƣớc lƣợng giá trị hiện tại (thời gian t) của hiện tƣợng và giá trị hiện tại này để dự toán giá trị tƣơng lai (thời gian t+1). Mô hình san bằng mũ giản đơn đƣợc Brown xây dựng năm 1954 dựa trên 2 nguyên tắc: - Trọng số của các quan sát trong dãy số thời gian càng giảm đi khi nó càng cách xa hiện tại. - Sai số dự báo hiện tại (ký hiệu et = yt- Ŷt) Phải đƣợc tính đến trong những dự báo kế tiếp. Giả sử ở thời gian t, có mức độ thực tế là yt, mức độ dự đoán là Ŷt. Mức độ dự đoán của hiện tƣợng ở thời gian (t+1) có thể viết: Nguyễn Trung Kiên – Lớp CT1301 29
  30. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Ŷt+1 = αyt + (1 - α) Ŷt Đặt 1 , ta có: Ŷt+1 = αyt + λ Ŷt (*) α và λ đƣợc gọi là các tham số san bằng với α + λ = 1 và α, λ 0;1 . Nhƣ vậy mức độ dự đoán Ŷt+1 là trung bình cộng gia quyền của yt và Ŷt với quyền số tƣơng ứng là α và λ. - Mức độ dự đoán của hiện tƣợng ở thời gian t là: Ŷt = α Ŷt-1 + Ŷt-1 thay vào (*) ta có: 2 Ŷt+1 = αyt + λαŶt-1 + λ Ŷt-1 - Mức độ dự đoán của hiện tƣợng ở thời gian (t-1) là: Ŷt-1 = αYt-2 + λŶt-2 thay vào (*) 2 3 Ta có: Ŷt+1 = αyt + λαŶt-1 + λ αŶt-2 + λ Ŷt-2 - Mức độ dự đoán của hiện tƣợng ở thời gian (t-2) là: Ŷt-2 = αYt-3 + λŶt-3 thay vào ta có: 2 3 4 Ŷt+1 = αyt + λαŶt-1 + λ αŶt-2 + λ Ŷt-3 + λ Ŷt-4 Bằng cách tiếp tục tƣơng tự thay vào các mức độ dự đoán Ŷt-3 , Ŷt-4 ta sẽ có công thức tổng quát. Trong đó: Ŷt+1: Số bình quân mũ tại thời điểm t+1 yt-i: Các mức độ thực tế của của hiện tƣợng tại thời điểm (t-i) (i=0 n) Ŷt-1: Số bình quân mũ tại thời điểm (t-i) ( i=0 n) α và λ đƣợc gọi là các tham số san bằng (α và λ là hằng số với α + λ =1 và α, λ .) n: Số lƣợng các mức độ của dãy số thời gian Nguyễn Trung Kiên – Lớp CT1301 30
  31. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Vì λ 0;1 nên khi i ii11 00Yti i 1 Thì i 1 Khi đó công thức tổng quát trở thành: Nhƣ vậy: mức độ dự đoán Ŷt+1 là trung bình cộng gia quyền của các mức độ của dãy số thời gian mà trong đó quyền số giảm dần theo dạng mũ (khi i= 0 n) tuỳ thuộc vào mức độ cũ của dãy số. Vì thế, phƣơng pháp này đƣợc gọi là phƣơng pháp san bằng mũ. Có 2 vấn đề quan trọng nhất trong phƣơng pháp san bằng mũ: - Thứ nhất: hệ số san bằng mũ α α là hệ số san để điều chỉnh trong số của các quan sát riêng biệt của dãy số thời gian. Vì vậy, khi lựa chọn phải vừa đảm bảo kết quả dự báo sẽ gần với quan sát thực tế, vừa phải đảm bảo tính linh hoạt (nhanh nhạy với các thay đổi ở gần hiện tại). Với =1 thì theo phƣơng trình dự báo (1). Giá trị dự báo Ŷt+1 bằng giá trị thực tế ở thời kỳ ngay liền trƣớc (Yt+1) và các mức độ trƣớc đó không đƣợc tính đến. Với =0 theo phƣơng trình dự báo (1). Giá trị dự báo Ŷt+1 bằng giá trị dự báo ở thời kỳ trƣớc (Ŷt) và giá trị thực tế ở thời kỳ ngay liền trƣớc không đƣợc tính đến. Nếu đƣợc chọn càng lớn thì các mức độ càng mới sẽ càng đƣợc chú ý, thích hợp với chuỗi thời gian không có tính ổn định cao. Ngƣợc lại, nếu đƣợc chọn càng nhỏ thì các mức độ càng cũ sẽ càng đƣợc chú ý, thích hợp với chuỗi thời gian có tính ổn định cao. Do đó, phải dựa vào đặc điểm biến động của hiện tƣợng qua thời gian và kinh nghiệm nghiên cứu để lựa chon cho phù hợp. Nói chung, giá trị tốt nhất là giá trị làm cho tổng bình phƣơng sai số dự đoán nhỏ nhất. SSE= Nguyễn Trung Kiên – Lớp CT1301 31
  32. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Đặt et = yt - Ŷt là các sai số dự đoán ở thời gian t hay còn gọi là phần dƣ ở thời gian t. Theo kinh nghiệm của các nhà dự báo thì thích hợp cho vận phƣơng pháp san mũ có thể đƣợc chọn bằng. : độ dài chuỗi thời gian - Thứ hai: Xác định giá trị ban đầu (điều kiện ban đầu) ký hiệu y0 Phƣơng pháp san bằng mũ đƣợc thực hiện theo phép đệ quy, để tính Ŷt+1 thì phải có Ŷt, để có Ŷt thì phải có Ŷt-1. Do đó để tính toán cần phải phải xác định giá trị ban đầu (y0) dựa vào một số phƣơng pháp. + Có thể lấy mức độ đầu tiên của dãy số. + Trung bình của một số các mức độ của dãy số 2.4.2. Mô hình xu thế tuyến tính và không có biến động thời vụ (Mô hình san mũ Holt – Winters) Mô hình này thƣờng áp dụng đối với sự biến động của hiện tƣợng qua thời gian có xu thế là tuyến tính và không có biến động thời vụ. - Giả sử chúng ta có dãy số thời gian y1, y2, y3, , yn với biến động có tính xu thế. Bước 1: Chọn các hệ số α,β (0 < α,β < 1) Nếu chọn hằng số san nhỏ tức là chúng ta coi các mức độ hiện thời của dãy số ít ảnh hƣởng đến mức độ dự báo. Ngƣợc lại nếu chọn hằng số san lớn tức là chúng ta muốn dãy số san số mũ phản ứng mạnh với những thay đổi hiện tại. Bước 2: Tiến hành san mũ cho giá trị ƣớc lƣợng và xu thế của dãy số: Coi giá trị của dãy số thời gian là tổng của 2 thành phần: Thành phần trung bình có trọng số của các giá trị thực tế (ký hiệu là St – giá trị ƣớc lƣợng của hiện tƣợng ở thời điểm t) và thành phần xu thế (ký hiệu là Tt). Ta có mô hình san số mũ: y S T t 1 tt Nguyễn Trung Kiên – Lớp CT1301 32
  33. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Trong đó: S y(1 ) S T y (1 ) S t t t1 ( t 1) t t TSST( ) (1 ). t t t1 ( t 1) Đặt S2 = Y2 T2 = Y2 – Y1 Tiến hành san số mũ từ thời điểm thứ 3 trở đi, ta có: SYST3 3(1 )( 2 2 ) TSST3( 3 2 ) (1 ) 2 SYST4 4(1 )( 3 3 ) TSST4( 4 3 ) (1 ) 3 Bước 3: Sử dụng mức và xu thế đã đƣợc san số mũ tại thời điểm để dự đoán cho các thời điểm trong tƣơng lai để dự đoán giá trị của hiện tƣợng ở thời điểm tƣơng lai t + 1: y S T t 1 tt Ở thời điểm tƣơng lai (t + h) (h=2, 3 ) y S hT th tt 2.4.3. Mô hình xu thế tuyến tính và biến động thời vụ Mô hình này thƣờng áp dụng đối với dự báo thời gian mà các mức độ của nó là tài liệu tháng hoặc quý của một số năm mà các mức độ trong dãy số đƣợc lập lại sau 1 khoảng thời gian h (h = 4 đối với quý, h = 12 đối với năm). Việc dự đoán có thể đƣợc thực hiện theo một trong hai mô hình sau:  + Mô hình cộng yt 1 St T t V t 1 Trong đó: S y V( t h ) (1 ) S T t t t1 ( t 1) TSST( ) (1 ) t t t1 ( t 1) V( y S ) (1 ) V t t t() t h Nguyễn Trung Kiên – Lớp CT1301 33
  34. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng  + Mô hình nhân: yt 1 ( St T t ). V t 1 Trong đó yt SSTt(1 )( t1 ( t 1) ) V() t h TSSTt(1 t 1 ) (1 ) t 1 y VVt (1 ). t S ()th t Với ,, là các tham số san bằng nhận giá trị trong đoạn [0;1]. nhận giá trị tốt nhất khi tổng bình phƣơng sai số là nhỏ nhất. SSE( y y )2 min t t Tham số không đƣợc xét một cách khách quan mà ít nhiều thông qua trực giác chủ quan, kết quả dự báo sẽ phụ thuộc vào sự lựa chọn các tham số này. Với a0 (0) có thể là mức độ đầu tiên trong dãy số. a1(0) có thể là lƣợng tăng (giảm) tuyệt đối trung bình. Sj(0): Là các chỉ số thời vụ ban đầu (j=1,2,3 ,k); k = 4 đối với quý; k = 12 đối với tháng. Nếu t = 1, 2, 3, 4, 5, , n. Là thứ tự thời gian hay tƣơng ứng với thứ tự các mức độ theo thời ký trong chuỗi thời gian thì yếu tố thời vụ Vj(0) của các mức độ trong chuỗi thời gian đƣợc tính sẽ tƣơng ứng với các giá trị t ≤ k. V j chỉ số bình quân thời vụ cho một quý hay một tháng của mỗi năm trong chuỗi thời gian. y V t j y t Yt mức độ trong chuỗi thời gian ở thời gian t. Nguyễn Trung Kiên – Lớp CT1301 34
  35. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Vj chỉ số thời vụ của từng quý hoặc tháng trong từng năm nay ở thời gian t: yt Số bình quân trƣợt để loại trừ thành phần thời vụ và thành phần ngẫu nhiên với số lƣợng mức độ bằng 4 đối với tài liệu quý và bằng 12 đối với tài liệu tháng. k H V j Nếu phải lựa chọn một trong hai mô hình để dự đoán thì tuỳ thuộc vào đặc điểm biến động của hiện tƣợng: Đối với hiện tƣợng ít biến đổi qua thời gian thì dùng mô hình cộng. Đối với hiện tƣợng biến đổi nhiều qua thời gian thì dùng mô hình nhân. * Ưu, nhược điểm của phương pháp san bằng mũ: - Ƣu điểm: Đơn giản và có kết quả tƣơng đối chính xác phù hợp với dự đoán ngắn hạn cho các nhà kinh doanh cũng nhƣ lập kế hoạch ngắn hạn ở cấp vĩ mô. Hệ thống dự báo có thể đƣợc điều chỉnh thông qua 1 tham số duy nhất (tham số san bằng mũ) Dễ dàng chƣơng trình hoá vì chỉ phải thực hiện một số phép toán sơ cấp để xác định giá trị dự báo. - Hạn chế: Phƣơng pháp san bằng mũ chỉ bó hẹp trong phạm vi dự báo ngắn hạn vì không tính đến sự thay đổi cấu trúc của chuỗi thời gian mà phải tuân thủ tính ổn định theo thời gian của các quý trình kinh tế - xác hội. Nguyễn Trung Kiên – Lớp CT1301 35
  36. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng CHƢƠNG 3: THỰC NGHIỆM CÁC BÀI TOÁN DỰ BÁO 3.1. Phần mềm IBM SPSS Modeler 3.1.1. Giới thiệu Hiện tại trên thế giới có rất nhiều phần mềm đƣợc áp dụng vào giải quyết các bài toán dự báo nhƣ: Focat X, Eviews, SPSS và SPSS Modeler của hãng IBM là 1 trong số đó. SPSS Modeler là một bộ công cụ khai thác dữ liệu cho phép ngƣời dùng nhanh chóng xây dựng các mô hình dự báo sử dụng chuyên môn kinh doanh và triển khai chúng vào hoạt động thƣơng mại để cải thiện việc ra quyết định. SPSS Modeler hỗ trợ toàn bộ quá trình khai thác dữ liệu, từ dữ liệu tới những kết quả kinh doanh tốt hơn. SPSS Modeler cung cấp đa dạng các phƣơng pháp mô hình hoá lấy từ học máy, trí tuệ nhân tạo và thống kê. Cho phép ngƣời dùng chuyển hóa dữ liệu thành những thông tin mới và phát triển các mô hình dự báo. 3.1.2. Các chức năng trong SPSS Modeler 1. Lấy nguồn dữ liệu: Nguồn dữ liệu bao gồm tập dữ liệu với rất nhiều các định dạng giúp ngƣời sử dụng dễ dàng đƣa dữ liệu của mình vào để xử lý nhƣ là ; Exel, SPSS, SQL, Hình 3.1.2. 1 Nguồn dữ liệu Nguồn dữ liệu hay còn gọi là dữ liệu thô nghĩa là dữ liệu chƣa qua quá trình tinh chỉnh, là nguồn dữ liệu gốc, nguồn dữ liệu ban đầu. Nguyễn Trung Kiên – Lớp CT1301 36
  37. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 2. Trích chọn dữ liệu: Hình 3.1.2. 2 Trích chọn dữ liệu Chọn nguồn dữ liệu phù hợp nhất với yêu cầu bài toán đặt ra. Dữ liệu đƣợc chọn phải chứa những thông tin đầy đủ liên quan đến yêu cầu cần đặt ra, phải thỏa mãn các tiêu chí nhất định nào đó. 3. Biến đổi dữ liệu: Biến đổi dữ liệu là quá trình chuẩn hóa và làm mịn dữ liệu để đƣa dữ liệu về dạng ngắn gọn và đơn giản giúp giải quyết bài toán một cách nhanh nhất. Hình 3.1.2. 3 Biến đổi dữ liệu Biến đổi dữ liệu ban đầu thành các dữ liệu chuẩn nhất, có thể thêm các trƣờng dữ liệu cần thiết hoặc bỏ đi các trƣờng dữ liệu không cần thiết. Hình 3.1.2. 4 Lọc các trƣờng dữ liệu Nguyễn Trung Kiên – Lớp CT1301 37
  38. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Biến đổi dữ liệu thành các dữ liệu mới với những thuộc tính mới và các trƣờng dữ liệu mới. Hình 3.1.2. 5 Biến đổi trƣờng và thuộc tính dữ liệu Có thể biến đổi thành các loại dữ liệu sau: Range (khoảng cách, hàng), Default (mặc định), Flag (dạng cờ), Set (tập hợp), Ordered Set, Typeless, Discrete 4. Xử lý dữ liệu. Đây đƣợc xem là bƣớc quan trọng và tốn nhiều thời gian nhất của toàn quá trình. Hình 3.1.2. 6 Xử lý dữ liệu Trong quá trình này sử dụng các thuật toán phân hoạch, các thuật toán phân cụm phân cấp để xử lý dữ liệu nhƣ thuật toán K-means, PAM, CLARA, BIRCH, . 5. Đánh giá và biểu diễn kết quả. Đây là kết quả của toàn bộ quá trình. Kết quả đƣợc thể hiện dƣới các dạng khác nhau nhƣ bảng biểu (Exel, Table, ) hay dƣới dạng đồ thị (Graphboard, Plot, Distribution, histogram, collection, multiplot, Web, Timelot, Evaluation, ) giúp đƣa ra kết quả gần gũi với ngƣời sử dụng, có cái nhìn trực quan hơn đối với yêu cầu đƣợc đặt ra. Nguyễn Trung Kiên – Lớp CT1301 38
  39. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Hình 3.1.2. 7 Đánh giá và biểu diễn kết quả Sau khi kết quả đƣợc đƣa ra thì đánh giá kết quả đó có đúng yêu cầu của bài toán không, có thỏa mãn tiêu chí hay điều kiện nhất định nào đó hay không. 3.2. Áp dụng phần mềm IBM SPSS Modeler vào bài toán dự báo 3.2.1. Bài toán 1 (sử dụng phương pháp định tính) 3.2.1.1. Phát biểu bài toán: Với số liệu có đƣợc từ Ban chỉ đạo tổng điều tra dân số và nhà ở trung ƣơng, Tổng cục thống kê – Cục thống kê thành phố Hải Phòng, 11/2008. Hãy dự báo nhu cầu máy vi tính của thành phố Hải Phòng sau năm 2008. 3.2.1.2. Phương pháp thực hiện: a. Lựa chọn phƣơng pháp chuyên gia: Giả định để có nhu cầu mua máy vi tính các chuyên gia nhận định phải có đủ các tiêu chí sau: Độ tuổi từ 15-55 tuổi. Phải đang đi học hoặc đang đi làm. Trong gia đình phải có ti vi+ xe máy+ ĐT cố định+ chƣa có máy vi tính. Trong tập Ho.sav chứa rất nhiều thông tin trong đó có dữ liệu về độ tuổi, đi học, làm việc. Trong tập Nguoi.sav chứa rất nhiều thông tin trong đó có dữ liệu về tài sản của từng ngƣời nhƣ ti vi, xe máy, máy vi tính, điện thoại cố định. Nguyễn Trung Kiên – Lớp CT1301 39
  40. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bảng 3.2. 1 Diễn giải Ký hiệu Diễn giải Miền giá trị C5 Độ tuổi 0-120 C12 Đi học 1.00 = “có” ; 2.00 = “không” C20 Làm việc 1.00 = “có” ; 2.00 = “không” C57_1 Ti vi 1.00 = “có” ; 2.00 = “không” C57_3 Xe máy 1.00 = “có” ; 2.00 = “không” C57_4 Máy vi tính 1.00 = “có” ; 2.00 = “không” C57_8 ĐT cố định 1.00 = “có” ; 2.00 = “không” b. Sử dụng phần mềm IBM SPSS Modeler để dự báo và đƣa ra kết quả dự báo: Bước 1: Từ tập Ho.sav, chọn nút Type, thay đổi kiểu dữ liệu. Hình 3.2.1. 1 Chọn nút Type Nguyễn Trung Kiên – Lớp CT1301 40
  41. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 2: Chọn nút Filter, nhấn đúp vào nút Filter, loại bỏ một số trƣờng dữ liệu không cần thiết. Hình 3.2.1. 2 Chọn nút Filter Bước 3: Chọn nút Select, nhấn đúp chọn Lauch Expression Builder (Tại đây chọn các trƣờng và giá trị phù hợp theo yêu cầu bài toán)/ Check/ OK/ OK. Hình 3.2.1. 3 Chọn nút select Nguyễn Trung Kiên – Lớp CT1301 41
  42. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 4: Xử lý tƣơng tự với tập Nguoi.sav Hình 3.2.1. 4 Xử lý với tập Nguoi.sav Bước 5: Chọn nút Merge, nhấn đúp chọn Filter (Tại đây tắt các trƣờng trùng tên)/OK. Hình 3.2.1. 5 Chọn nút Merge Nguyễn Trung Kiên – Lớp CT1301 42
  43. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 6: Chọn nút Statistics, nhấn đúp chọn Setting/Examine (chọn trƣờng C5) và Statistics (tích chọn ô Count)/ Run. Hình 3.2.1. 6 Chọn nút Statistic Bước 7: Tại dòng Count thể hiện nhu cầu số lƣợng về máy vi tính cần tìm. Hình 3.2.1. 7 Kết quả số lƣợng Nguyễn Trung Kiên – Lớp CT1301 43
  44. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 8: Chọn nút Table, nhấn đúp và chọn Run. Hình 3.2.1. 8 Chọn nút Table Qua bảng cho thấy kết quả đƣa ra đúng với các tiêu chí lựa chọn của các chuyên gia. Hình 3.2.1. 9 Bảng kết quả Nguyễn Trung Kiên – Lớp CT1301 44
  45. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 9: Chọn nút Distribution, nhấn đúp chọn Plot (chọn trƣờng cho Field và Color)/ Run. Hình 3.2.1. 10 Chọn nút Distribution Tại tab Table thể hiện % và số lƣợng nhu cầu máy vi tính của từng huyện (quận). Hình 3.2.1. 11 Bảng kết quả Nguyễn Trung Kiên – Lớp CT1301 45
  46. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 3.2.2. Bài toán 2 (sử dụng phương pháp định lượng) 3.2.2.1. Phát biểu bài toán: Cho bảng số liệu sau. Dự báo giá bán tháng 10 của các mặt hàng. Bảng 3.2. 2 Giá bán sản phẩm STT Sản phẩm Mã số ĐVT Tháng 1 Tháng 2 Tháng 3 Tháng 4 Tháng 5 Tháng 6 Tháng 7 Tháng 8 Tháng 9 1 Trâu thịt hơi 141101 đ/kg 64,749 64,965 65,000 65,000 64,119 64,245 64,121 64,624 65,737 2 Bò thịt hơi 141201 đ/kg 72,875 73,099 71,728 71,721 73,375 72,498 72,371 7,265 72,969 3 Lợn thịt hơi 145001 đ/kg 54,247 49,473 46,289 46,947 45,492 41,352 42,270 41,871 39,975 4 Lợn con giống 145002 đ/kg 44,994 54,542 51,488 54,496 51,710 48,150 46,524 46,622 47,133 5 Gà ta thịt hơi 146201 đ/kg 87,989 90,000 88,983 94,977 106,099 96,604 99,361 103,489 99,434 6 Gà CN thịt hơi 146202 đ/kg 50,743 53,747 50,925 46,706 45,252 46,483 41,170 42,249 50,915 7 Gà giống 146203 đ/kg 22,997 23,738 23,044 22,427 22,180 22,714 22,371 22,518 20,798 đ/10 8 Trứng gà 146204 33,742 34,623 32,945 32,193 32,700 32,125 32,297 32,100 31,976 quả 9 Vịt thịt hơi 146301 đ/kg 42,857 44,230 41,418 36,683 43,499 40,152 35,256 35,274 35,490 10 Ngan thịt hơi 146302 đ/kg 61,740 65,249 63,712 61,106 68,480 62,208 60,510 58,334 57,446 Nguyễn Trung Kiên – Lớp CT1301 46
  47. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 3.2.2.2. Phương pháp thực hiện: a. Lựa chọn phƣơng pháp dự báo: bình quân di động có quyền số. Giả sử rằng ta có quyền số của tháng gần nhất là 3; cách 2 tháng trƣớc là 2,5; cách 3 tháng trƣớc là 2; 4 tháng trƣớc là 1,5; 5 tháng trƣớc là 1. b. Sử dụng phần mềm IBM SPSS Modeler để dự báo và đƣa ra kết quả dự báo: Bước 1: Từ File excel 123.xls, chọn nút Type, thay đổi kiểu dữ liệu. Hình 3.2.2. 1 Chọn nút Type Bước 2: Chọn nút Filter, loại bỏ một số trƣờng dữ liệu không cần thiết. Hình 3.2.2. 2 Chọn nút Filter Nguyễn Trung Kiên – Lớp CT1301 47
  48. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 3: Chọn nút Derive, nhấn đúp chọn tab Setting, tại Derive Field nhập tên tháng 10 sẽ dự báo; tại Derive as chọn Formula; tại Field Type chọn trƣờng cho tháng 10; tại Formula nhập công thức tính toán dự báo./OK. Hình 3.2.2. 3 Chọn nút Derive Bước 4: Chọn nút Table, nhấn đúp và chọn Run. Hình 3.2.2. 4 Chọn nút Table Qua bảng cho thấy kết quả dự báo giá bán tháng 10 của các mặt hàng. Hình 3.2.2. 5 Kết quả Nguyễn Trung Kiên – Lớp CT1301 48
  49. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 3.2.3. Bài toán 3 (sử dụng phương pháp định lượng) 3.2.3.1. Phát biểu bài toán: Cho tài liệu về sản lƣợng của doanh nghiệp A. Dự báo sản lƣợng 4 quý tiếp theo của doanh nghiệp. Bảng 3.2. 3 Sản lƣợng doanh nghiệp A Năm (t) Sản lƣợng (nghìn tấn) Mức Cộng độ Chỉ số theo bình thời vụ cùng quân 2002 2003 2004 2005 2006 quý từng yi Itv y quý y j Quý yi I 20 25 27 31 29 132 26,4 0,678 II 25 32 30 37 36 160 32 0,82 II 38 38 45 44 47 212 42,4 1,14 IV 40 60 55 62 58 275 55 1,41 Cộng theo cùng năm 123 155 157 174 170 779 38,95 ty. 123 310 471 696 850 3.2.3.2. Phương pháp thực hiện: a. Lựa chọn phƣơng pháp dự báo: dựa vào hàm xu thế và biến động thời vụ (dựa vào mô hình cộng). b. Sử dụng phần mềm IBM SPSS Modeler để dự báo và đƣa ra kết quả dự báo: Nguyễn Trung Kiên – Lớp CT1301 49
  50. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 1: Từ File DL02.xls, chọn nút Filter, loại bỏ một số trƣờng dữ liệu. không cần thiết. Hình 3.2.3. 1 Chọn nút Filter Bước 2: Chọn nút Type, nhấn đúp và thay đổi kiểu dữ liệu. Hình 3.2.3. 2 Chọn nút Type Bước 3: Chọn nút Time Intervals. Hình 3.2.3. 3 Chọn nút Time Intervals Nguyễn Trung Kiên – Lớp CT1301 50
  51. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Chọn dữ liệu phù hợp cho 2 tab Intervals và Forecast. Hình 3.2.3. 4 Xử lý nút Time Intervals Bước 4: Chọn nút Time Series, nhấn đúp chọn tab Model. Chọn Exponential Smoothing cho Method, trong Criterial chọn Winters Additive (mô hình cộng)/OK. Hình 3.2.3. 5 Chọn nút Time Series Nhấn Run đƣợc kết quả. Hình 3.2.3. 6 Kết quả xử lý Time Series Nguyễn Trung Kiên – Lớp CT1301 51
  52. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Bước 5: Chọn nút Filter để loại bỏ các trƣờng không cần thiết và chọn nút Table. Sản lƣợng dự báo cho 4 quý năm 2009 đƣợc hiển thị trong bảng kết quả. Hình 3.2.3. 7 Bảng kết quả dự báo Bước 6: Hiển thị kết quả qua biểu đồ: chọn nút Multiplot và Plot. Hình 3.2.3. 8 Chọn nút Multiplot và Plot Nguyễn Trung Kiên – Lớp CT1301 52
  53. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Hình 3.2.3. 9 Biểu đồ kết quả qua Multiplot Hình 3.2.3. 10 Biểu đồ kết quả qua Plot Nguyễn Trung Kiên – Lớp CT1301 53
  54. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng KẾT LUẬN Dự báo nói chung là một bài toán khá thú vị và có ảnh hƣởng rất lớn đến việc xác lập các kế hoạch hành động. Nó có một vai trò đặc biệt quan trọng nhất là đối với các đơn vị làm kinh tế trong giai đoạn kinh tế thị trƣờng đầy tính cạnh tranh. Ngƣời nhận định đúng về tƣơng lai sẽ là ngƣời chiến thắng. Bất cứ một nhận định nào cũng đều có cơ sở suy luận của nó. Cơ sở đó có thể là việc tổng kết kinh nghiệm đã diễn ra trong quá khứ, có thể là các quy luật đã đƣợc xác lập hoặc các suy luận logic nhƣng nhìn chung mọi cơ sở đều xuất phát từ dữ liệu lịch sử. Song không có nghĩa là nếu ta có dữ liệu lịch sử tốt, có các phƣơng pháp tiến hành dự báo phù hợp, giải thích đƣợc quá khứ một cách chính xác là ta có thể yên tâm với kết quả dự báo của mình. Dự báo bao giờ cũng chỉ là dự báo. Các sự kiện, biến cố ngẫu nhiên làm ảnh hƣởng đến kết quả dự báo thì trong một chừng mực nào đó ta không thể xác định đƣợc do không thể lập luận đơn giản từ các con số nhƣng nó lại là một yếu tố chi phối rất lớn đến kết quả dự báo. Ánh hƣởng của các yếu tố ngẫu nhiên có tác động thực nhƣ thế nào đến dự báo thì hoàn toàn phụ thuộc vào nội dung, bản chất của từng biến cố đã hoặc sắp xảy ra mà ta nhận biết đƣợc. Việc cảm nhận về các ảnh hƣởng đó là tùy vào nhận định của chuyên gia. Rõ ràng là yêu cầu về việc tích hợp hai phƣơng pháp định lƣợng - định tính là một nhu cầu có thực và sẽ làm tăng độ chính xác cho các bài toán dự báo. Qua đồ án chúng tôi đã giới thiệu 1 cách khái quát về khái niệm, các phƣơng pháp cũng nhƣ nguyên lý xây dựng hệ thống phân tích và dự báo. Bên cạnh đó việc áp dụng phần mềm SPSS Modeler giải quyết các bài toán dự báo sẽ giúp ngƣời dùng chuyển hóa dữ liệu và giải quyết nhanh chóng cũng nhƣ phát triển các bài toán, mô hình dự báo, hỗ trợ việc ra quyết định. Nguyễn Trung Kiên – Lớp CT1301 54
  55. Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng TÀI LIỆU THAM KHẢO TÀI LIỆU TIẾNG VIỆT [1] Lê Văn Dụy: Mô hình dự báo ngắn hạn, Thông tin Khoa học Thống kê- Viện Khoa học Thống kê, 2008. [2] Lê Xuân Phƣơng: Ứng dụng phương pháp chuyên gia dự báo trong lĩnh vực Bưu chính – Viễn thông, Tạp chí Công nghệ Thông tin và Truyền thông, 2004. [3] Nguyễn Thị Thanh Huyền, Nguyễn Văn Huân, Vũ Xuân Nam: Bài giảng phân tích và dự báo kinh tế, Trƣờng đại học Thái Nguyên, 2009. [4] Nguyễn Trọng Hoài, Phùng Thanh Bình, Nguyễn Khánh Duy: Dự báo và phân tích dữ liệu trong kinh tế và tài chính, NXB ĐH Thống kê, 2009. [5] Nguyễn Văn Cao, Trần Thái Ninh: Giáo trình Lý thuyết xác suất và Thống kê toán, NXB ĐH Kinh Tế Quốc Dân, 2008. [6] Trần Ngọc Vũ: Giáo trình Hướng dẫn sử dụng SPSS, Hà Nội, 3/2005. [7] Sổ tay điều tra viên địa bàn mẫu, Ban chỉ đạo tổng điều tra dân số và nhà ở trung ƣơng, Tổng cục thống kê – Cục thống kê thành phố Hải Phòng, 11/2008. [8] bao-va-kha-nang-ap-dung-mot-so-mo-hinh-trong-du-bao-bien-dong-tai-nguyen-va- moi-truong-tai-viet-nam TÀI LIỆU TIẾNG ANH [1] John E.Hanke, at el: Business forecastin, NXB Pearson 2010. [2] Thomas L, Saaty, Luis G. Vargas: Prediction - Projection and Forecasting, Kluwer Academic Publishers, 1991. [3] [4] /14.2/en/ Nguyễn Trung Kiên – Lớp CT1301 55