Bài giảng Kiến trúc máy tính - Chương 2: Bộ xử lý trung tâm CPU

pdf 66 trang huongle 5290
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kiến trúc máy tính - Chương 2: Bộ xử lý trung tâm CPU", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_kien_truc_may_tinh_chuong_2_bo_xu_ly_trung_tam_cpu.pdf

Nội dung text: Bài giảng Kiến trúc máy tính - Chương 2: Bộ xử lý trung tâm CPU

  1. 10/01/2017 Chương 2 Bộ xử lý trung tâm CPU (Central Processing Unit) Nội dung • Bộ xử lý trung tâm • Pipeline • Bộ nhớ chính • Bộ nhớ thứ cấp • Hệ thống I/O Tổ chức của CPU • Cấu trúc cơ bản của CPU 1
  2. 10/01/2017 Tổ chức của CPU • Cấu trúc cơ bản của CPU (tiếp) – Đơn vị điều khiển (Control Unit - CU): điều khiển hoạt động của máy tính theo chương trình đã định sẵn. – Đơn vị số học và logic (Arithmetic and Logic Unit - ALU): thực hiện các phép toán số học và phép toán logic. – Tập thanh ghi (Register File - RF): lưu giữ các thông tin tạm thời phục vụ cho hoạt động của CPU. – Đơn vị nối ghép bus (Bus Interface Unit - BIU): kết nối và trao đổi thông tin giữa bus bên trong (internal bus) và bus bên ngoài (external bus). Tổ chức của CPU • Đơn vị số học và luận lý ALU – Thực hiện các phép toán số học và phép toán luận lý: • Số học: Cộng, trừ, nhân, chia, tăng, giảm, đảo dấu, • Luận lý: AND, OR, XOR, NOT, phép dịch bit, Tổ chức của CPU • Đơn vị điều khiển CU – Điều khiển nhận lệnh từ bộ nhớ đưa vào thanh ghi lệnh – Tăng nội dung của PC để trỏ sang lệnh kế tiếp – Giải mã lệnh đã được nhận để xác định thao tác mà lệnh yêu cầu – Phát ra các tín hiệu điều khiển thực hiện lệnh – Nhận các tín hiệu yêu cầu từ bus hệ thống và đáp ứng với các yêu cầu đó. 2
  3. 10/01/2017 Tổ chức của CPU • Các tín hiệu đưa đến đơn vị điều khiển – Clock: tín hiệu xung nhịp từ mạch tạo dao động bên ngoài. – Mã lệnh từ thanh ghi lệnh đưa đến để giải mã. – Các cờ từ thanh ghi cờ cho biết trạng thái của CPU. – Các tín hiệu yêu cầu từ bus điều khiển • Các tín hiệu phát ra từ đơn vị điều khiển – Các tín hiệu điều khiển bên trong CPU: • Điều khiển các thanh ghi • Điều khiển ALU – Các tín hiệu điều khiển bên ngoài CPU: • Điều khiển bộ nhớ • Điều khiển các mô-đun nhập xuất Hoạt động của chu trình lệnh • Chu trình lệnh – Nhận lệnh (Fetch Instruction - FI) – Giải mã lệnh (Decode Instruction - DI) – Nhận toán hạng (Fetch Operands - FO) – Thực hiện lệnh (Execute Instruction - EI) – Cất toán hạng (Write Operands - WO) – Ngắt (Interrupt Instruction - II) Hoạt động của chu trình lệnh • Chu trình lệnh (tiếp) 3
  4. 10/01/2017 Hoạt động của chu trình lệnh • Nhận lệnh (Fetch) – CPU đưa địa chỉ của lệnh cần nhận từ bộ đếm chương trình PC ra bus địa chỉ – CPU phát tín hiệu điều khiển đọc bộ nhớ – Lệnh từ bộ nhớ được đặt lên bus dữ liệu và được CPU chép vào thanh ghi lệnh IR – CPU tăng nội dung PC để trỏ sang lệnh kế tiếp Hoạt động của chu trình lệnh • Giải mã lệnh (Decode) – Lệnh từ thanh ghi lệnh IR được đưa đến đơn vị điều khiển – Đơn vị điều khiển tiến hành giải mã lệnh để xác định thao tác phải thực hiện – Giải mã lệnh xảy ra bên trong CPU • Nhận dữ liệu (Fetch Operand) – CPU đưa địa chỉ của toán hạng ra bus địa chỉ – CPU phát tín hiệu điều khiển đọc – Toán hạng được đọc vào CPU – Tương tự như nhận lệnh Hoạt động của chu trình lệnh • Nhận dữ liệu gián tiếp – CPU đưa địa chỉ ra bus địa chỉ – CPU phát tín hiệu điều khiển đọc – Nội dung ngăn nhớ được đọc vào CPU, đó chính là địa chỉ của toán hạng – Địa chỉ này được CPU phát ra bus địa chỉ để tìm ra toán hạng – CPU phát tín hiệu điều khiển đọc – Toán hạng được đọc vào CPU 4
  5. 10/01/2017 Hoạt động của chu trình lệnh • Thực hiện lệnh (Execute) – Có nhiều dạng tuỳ thuộc vào lệnh – Có thể là: • Đọc/Ghi bộ nhớ • Nhập/ xuất • Chuyển dữ liệu giữa các thanh ghi với nhau • Chuyển dữ liệu giữa thanh ghi và bộ nhớ • Thao tác số học/logic • Chuyển điều khiển (rẽ nhánh) • Ngắt • Hoạt động của chu trình lệnh • Ghi toán hạng (Write) – CPU đưa địa chỉ ra bus địa chỉ – CPU đưa dữ liệu cần ghi ra bus dữ liệu – CPU phát tín hiệu điều khiển ghi – Dữ liệu trên bus dữ liệu được chép đến vị trí xác định Hoạt động của chu trình lệnh • Ngắt (Interrupt) – Nội dung của bộ đếm chương trình PC (địa chỉ trở về sau khi ngắt) được đưa ra bus dữ liệu – CPU đưa địa chỉ (thường được lấy từ con trỏ ngăn xếp SP) ra bus địa chỉ – CPU phát tín hiệu điều khiển ghi bộ nhớ – Địa chỉ trở về trên bus dữ liệu được ghi ra vị trí xác định (ở ngăn xếp) – Địa chỉ lệnh đầu tiên của chương trình con điều khiển ngắt được nạp vào PC 5
  6. 10/01/2017 Hoạt động của chu trình lệnh • Ngắt (tiếp) Đơn vị điều khiển • Gồm 2 loại: – Đơn vị điều khiển vi chương trình (Microprogrammed Control Unit) – Đơn vị điều khiển phần cứng (Hardwired Control Unit) Đơn vị điều khiển • Đơn vị điều khiển vi chương trình – Bộ nhớ vi chương trình Mạch (ROM) lưu trữ các vi chương tuần trình (microprogram) tự – Một vi chương trình bao gồm các vi lệnh (microinstruction) – Mỗi vi lệnh mã hoá cho một vi thao tác (microoperation) – Để hoàn thành một lệnh cần thực hiện một hoặc một vài vi chương trình – Tốc độ chậm 6
  7. 10/01/2017 Đơn vị điều khiển • Đơn vị điều khiển phần cứng – Sử dụng vi mạch phần cứng để giải mã và tạo các tín hiệu điều khiển thực hiện lệnh – Tốc độ nhanh – Đơn vị điều khiển phức tạp Kỹ thuật đường ống lệnh • Khái niệm – Mỗi chu trình lệnh cần thực hiện bằng nhiều thao tác – Kỹ thuật đơn hướng (Scalar): Thực hiện tuần tự từng thao tác cho mỗi lệnh chậm – Kỹ thuật đường ống (Pipeline): Thực hiện song song các thao tác cho nhiều lệnh đồng thời nhanh hơn – Ví dụ chu trình 1 lệnh gồm 5 bước: • Nhận lệnh (I) • Giải mã lệnh (D) • Nhận toán hạng (F) • Thực hiện lệnh (E) • Cất toán hạng (W) Kỹ thuật đường ống lệnh • So sánh scalar và pipeline – Scalar Chu kỳ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 – Nhiều chu Lệnh 1 I D F E W kỳ máy cho Lệnh 2 I D F E W Lệnh 3 I D F E W 1 lệnh Chu kỳ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Lệnh 1 I D F E W Lệnh 2 I D F E W – Pipeline Lệnh 3 I D F E W – Mỗi chu kỳ Lệnh 4 I D F E W máy thực Lệnh 5 I D F E W Lệnh 6 I D F E W hiện xong 1 Lệnh 7 I D F E W lệnh Lệnh 8 I D F E W Lệnh 9 I D F E W Lệnh 10 I D F E W Lệnh 11 I D F E W 7
  8. 10/01/2017 Kỹ thuật đường ống lệnh • Các trở ngại của đường ống lệnh – Thực tế không thể luôn đạt 1 chu kỳ máy/lệnh do các trở ngại dẫn đến sự gián đoạn của ống lệnh – Trở ngại cấu trúc: do nhiều công đoạn dùng chung một tài nguyên – Trở ngại dữ liệu: lệnh sau sử dụng dữ liệu kết quả của lệnh trước – Trở ngại điều khiển: do các lệnh rẽ nhánh gây ra Kỹ thuật đường ống lệnh • Trở ngại về cấu trúc – Nguyên nhân: Dùng chung tài nguyên – Khắc phục: • Nhân tài nguyên để tránh xung đột • Làm trễ – Ví dụ 1: Bus dữ liệu truyền lệnh và dữ liệu Bus lệnh riêng, bus dữ liệu riêng (cache lệnh và cache dữ liệu) – Ví dụ 2: Lệnh nhân cần nhiều chu kỳ thực thi (E) Kỹ thuật đường ống lệnh • Trở ngại về dữ liệu – Nguyên nhân: lệnh sau sử dụng dữ liệu kết quả của lệnh trước – Các dạng: 8
  9. 10/01/2017 Kỹ thuật đường ống lệnh • Trở ngại về dữ liệu (tiếp) Kỹ thuật đường ống lệnh • Trở ngại về dữ liệu (tiếp) – RAW Kỹ thuật đường ống lệnh • Trở ngại về điều khiển – Do lệnh rẽ nhánh gây ra – Đây là dạng trở ngại gây thiệt hại nhiều nhất cho ống lệnh: toàn bộ các lệnh đang thực thi trong ống phải huỷ Chu kỳ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Lệnh 1 I D F E W Lệnh 2 I D F E BRA 25 IF Zero Lệnh 3 I D F Lệnh 4 I D Lệnh 5 I Lệnh 25 I D F E W Lệnh 26 I D F E W Lệnh 27 I D F E W 9
  10. 10/01/2017 Cấu trúc bộ xử lý tiên tiến Cấu trúc bộ xử lý tiên tiến • Các đơn vị xử lý dữ liệu chuyên dụng – Các đơn vị số nguyên (ALU) – Các đơn vị số dấu chấm động (FPU) – Các đơn vị chức năng đặc biệt (SFU) • Đơn vị xử lý dữ liệu âm thanh • Đơn vị xử lý dữ liệu hình ảnh • Đơn vị xử lý dữ liệu vector • Mục đích: Tăng khả năng xử lý các chức năng chuyên biệt Cấu trúc bộ xử lý tiên tiến • Bộ nhớ cache – Được tích hợp trên chip vi xử lý – Bao gồm hai đến ba mức cache – Cache L1 gồm hai phần tách rời: • Cache lệnh (Instruction cache) • Cache dữ liệu (Data cache) Giải quyết xung đột khi nhận lệnh và dữ liệu – Cache L2 và L3: chung cho lệnh và dữ liệu • Mục đích: Tăng hiệu suất truy cập bộ nhớ chính 10
  11. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Đơn vị quản lý bộ nhớ – Thường gọi là đơn vị MMU (Memory Management Unit) dùng để quản lý bộ nhớ ảo – Chuyển đổi địa chỉ ảo (trong chương trình) thành địa chỉ vật lý (trong bộ nhớ) – Cung cấp cơ chế phân trang/phân đoạn – Cung cấp chế độ bảo vệ bộ nhớ • Mục đích : Tăng dung lượng bộ nhớ chính bằng cách sử dụng bộ nhớ phụ Cấu trúc bộ xử lý tiên tiến • Các kiến trúc máy tính song song – Nhu cầu giải các bài toán lớn ngày càng nhiều, cần những máy tính cực mạnh có khả năng xử lý tốc độ cao – Kiến trúc máy tính tuần tự (Von-Neumann) tiến đến giới hạn tốc độ, một bộ xử lý duy nhất khó nâng cao hơn nữa khả năng xử lý – Các kiến trúc máy tính song song giúp tăng hiệu suất tính toán cho máy tính: – Kiến trúc song song mức lệnh IPL (Instruction-level parallelism) : Tăng số lượng lệnh thi hành được trên cùng 1 đơn vị thời gian – Kiến trúc song song mức xử lý (Machine parallelism) : Tăng số lượng đơn vị xử lý phần cứng – Cần kết hợp cả 2 kiến trúc song song để tạo ra các máy tính có hiệu suất cao Cấu trúc bộ xử lý tiên tiến • Kiến trúc song song mức lệnh – Siêu đường ống (Superpipeline) • Chia mỗi thao tác trong chu trình lệnh ra n bước nhỏ ống lệnh dài hơn • Cần 1/n chu kỳ máy cho mỗi thao tác – Siêu hướng (Superscalar) • Sử dụng nhiều ống lệnh CPU gồm nhiều đơn vị chức năng, cho phép thi hành nhiều lệnh đồng thời • Mỗi chu kỳ máy thực hiện được nhiều lệnh – VLIW (Very Long Instruction Word) • Ghép nhiều lệnh đơn vào 1 từ máy để thực hiện đồng thời • Ví dụ : CPU Itanium họ IA-64 của Intel cho phép ghép 3 lệnh/từ máy gọi là bundle gồm 128 bit 11
  12. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Superpipeline Chu kỳ 1 2 3 4 5 6 7 Lệnh 1 I1 I2 D1 D2 F1 F2 E1 E2 W1 W2 Lệnh 2 I1 I2 D1 D2 F1 F2 E1 E2 W1 W2 Lệnh 3 I1 I2 D1 D2 F1 F2 E1 E2 W1 W2 Lệnh 4 I1 I2 D1 D2 F1 F2 E1 E2 W1 W2 Lệnh 5 I1 I2 D1 D2 F1 F2 E1 E2 W1 W2 Chu kỳ 1 2 3 4 5 6 7 8 9 Lệnh 1 I D F E W • Super- Lệnh 2 I D F E W Lệnh 3 I D F E W scalar Lệnh 4 I D F E W Lệnh 5 I D F E W Lệnh 6 I D F E W Lệnh 7 I D F E W Lệnh 8 I D F E W Lệnh 9 I D F E W Lệnh 10 I D F E W Cấu trúc bộ xử lý tiên tiến • VLIW • Ví dụ: Khuôn dạng lệnh của CPU Intel Itanium Cấu trúc bộ xử lý tiên tiến • Kiến trúc song song mức xử lý – Tích hợp nhiều bộ xử lý đồng thời để tăng khả năng thi hành chương trình – Các xu hướng phát triển: • Đa chương (multi-programming) • Đa luồng (multi-threading) • Đa nhân (multi-core) • Đa xử lý (multi-processing) • Đa máy tính (multi-computer) 12
  13. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Kiến trúc song song mức xử lý (tiếp) (a) On-chip parallelism (b) Coprocessor (c) Multiprocessor (d) Multicomputer (e) Grid Cấu trúc bộ xử lý tiên tiến • Multi-core Cấu trúc bộ xử lý tiên tiến • Ví dụ : CPU Intel Core i7 gồm 4 nhân 13
  14. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Multi-processor – Sử dụng bus chung hoặc switch – Sử dụng bộ nhớ chung hoặc riêng biệt Sơ đồ UMA (Uniform Memory Access) dùng bus chung và bộ nhớ chung Cấu trúc bộ xử lý tiên tiến • Multi-processor (tiếp) – Sơ đồ NUMA (Non-Uniform Memory Access) dùng bus chung và bộ nhớ riêng Cấu trúc bộ xử lý tiên tiến • Multi-processor (tiếp) – Sơ đồ UMA (Uniform Memory Access) dùng switch và bộ nhớ riêng – Còn gọi là hệ thống đa xử lý đối xứng SMP (Symmetric Multi- Processors) 14
  15. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Multi-processor (tiếp) – Sơ đồ multi-processor dùng bộ nhớ chung Cấu trúc bộ xử lý tiên tiến • Ví dụ: Hệ thống SUN E25K (NUMA multi-processor) 72 CPU Dual-core UltraSPARC IV+ 1.95GHz 32MB Cache L3 1.15 TB RAM 250TB HDD Cấu trúc bộ xử lý tiên tiến • Multi-computer – Phân loại theo Flynn (1966): Căn cứ vào số lượng lệnh và số lượng dữ liệu có thể xử lý là 1 hay nhiều • Single instruction, single data stream – SISD • Single instruction, multiple data stream – SIMD • Multiple instruction, single data stream – MISD • Multiple instruction, multiple data stream- MIMD 15
  16. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Sơ đồ phân loại Flynn Cấu trúc bộ xử lý tiên tiến • Ví dụ về SIMD Cấu trúc bộ xử lý tiên tiến • Cluster – Là 1 dạng máy tính loại MIMD gồm nhiều máy tính độc lập kết nối qua mạng tốc độ cao, mỗi máy có CPU, BN và IO riêng – Dùng phương pháp truyền thông báo (Message Passing) để trao đổi thông tin (bằng phần mềm) • MPI (Message Passing Interface) • PVM (Parallel Virtual Machine) – Gồm 2 loại • NOW (Network of Workstations) hoặc COW (Cluster of Workstations) : Kết nối qua LAN • Grid : Kết nối qua Internet 16
  17. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Cluster (tiếp) Cấu trúc bộ xử lý tiên tiến • Message-passing multi-computer Cấu trúc bộ xử lý tiên tiến • Ví dụ: Siêu máy tính Bluegen của IBM 500 TFLOPS (teraFLOPS) 2 core PowerPC 440 700 MHz 4MB L3 17
  18. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Ví dụ: Siêu máy tính Red Storm của Cray Cấu trúc bộ xử lý tiên tiến • So sánh 2 siêu máy tính Bluegen & Red Storm Cấu trúc bộ xử lý tiên tiến • Top 10 siêu máy tính 06/2010 trên trang top500.org Rank Site Computer Oak Ridge National Laboratory Jaguar - Cray XT5-HE Opteron Six Core 2.6 GHz 1 United States Cray Inc. National Supercomputing Centre in Shenzhen Nebulae (Tinh Vân) - Dawning TC3600 Blade, Intel X5650 2 China (Thâm Quyến) Dawning Roadrunner - BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / DOE/NNSA/LANL 3 Opteron DC 1.8 GHz, Voltaire Infiniband United States IBM National Institute for Computational Kraken XT5 - Cray XT5-HE Opteron Six Core 2.6 GHz 4 Sciences/University of Tennessee Cray Inc. United States Forschungszentrum Juelich (FZJ) JUGENE - Blue Gene/P Solution 5 Germany IBM NASA/Ames Research Center/NAS Pleiades - SGI Altix ICE 8200EX/8400EX, Xeon HT QC 3.0 Ghz 6 United States SGI National SuperComputer Center in Tianjin/NUDT Tianhe-1 (Tinh Hà) - NUDT TH-1 Cluster, Xeon E5540/E5450 7 China (Thiên Tân) NUDT DOE/NNSA/LLNL BlueGene/L - eServer Blue Gene Solution 8 United States IBM Argonne National Laboratory Intrepid - Blue Gene/P Solution 9 United States IBM National Renewable Energy Laboratory Red Sky - Sun Blade x6275, Xeon X55xx 2.93 Ghz, Infiniband 10 United States Sun 18
  19. 10/01/2017 Cấu trúc bộ xử lý tiên tiến • Top 10 siêu máy tính 06/2011 trên trang top500.org Rank Site Computer RIKEN Advanced Institute for Computational K computer, SPARC64 VIIIfx 2.0GHz 1 Science - Japan Fujitsu National Supercomputing Center in Tianjin Tianhe-1A (Tinh Hà) X5670 2.93Ghz 6C, NVIDIA GPU 2 (Thiên Tân) – China NUDT DOE/SC/Oak Ridge National Laboratory Jaguar - Cray XT5-HE Opteron 6-core 2.6 GHz 3 United States Cray Inc. National Supercomputing Centre in Shenzhen Nebulae (Tinh Vân) Intel X5650, NVidia Tesla C2050 GPU 4 (Thâm Quyến) – China Dawning GSIC Center, Tokyo Institute of Technology TSUBAME 2.0 G7 Xeon 6C X5670, Nvidia GPU, 5 Japan NEC/HP DOE/NNSA/LANL/SNL Cielo - Cray XE6 8-core 2.4 GHz 6 United States Cray Inc. NASA/Ames Research Center/NAS Pleiades Xeon HT QC 3.0/Xeon 5570/5670 2.93 Ghz 7 United States SGI DOE/SC/LBNL/NERSC Hopper - Cray XE6 12-core 2.1 GHz 8 United States Cray Inc. Commissariat a l'Energie Atomique (CEA) Tera-100 - Bull bullx super-node S6010/S6030 9 France Bull SA DOE/NNSA/LANL Roadrunner - PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz 10 United States IBM Cấu trúc bộ xử lý tiên tiến • Top 10 siêu máy tính 06/2012 trên trang top500.org Rank Site Computer DOE/NNSA/LLNL Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom 1 United States IBM RIKEN Advanced Institute for Computational K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect 2 Science Japan Fujitsu DOE/SC/Argonne National Laboratory Mira - BlueGene/Q, Power BQC 16C 1.60GHz, Custom 3 United States IBM Leibniz Rechenzentrum SuperMUC - iDataPlex DX360M4, Xeon E5-2680 8C 4 Germany 2.70GHz, Infiniband FDR IBM National Supercomputing Center in Tianjin Tianhe-1A - NUDT YH MPP, Xeon X5670 6C 2.93 GHz, 5 China NVIDIA 2050 NUDT DOE/SC/Oak Ridge National Laboratory Jaguar - Cray XK6, Opteron 6274 16C 2.200GHz, Cray 6 United States Gemini interconnect, NVIDIA 2090 Cray Inc. CINECA Fermi - BlueGene/Q, Power BQC 16C 1.60GHz, Custom 7 Italy IBM Forschungszentrum Juelich (FZJ) JuQUEEN - BlueGene/Q, Power BQC 16C 1.60GHz, Custom 8 Germany IBM CEA/TGCC-GENCI Curie thin nodes - Bullx B510, Xeon E5-2680 8C 2.700GHz, 9 France Infiniband QDR Bull National Supercomputing Centre in Shenzhen Nebulae - Dawning TC3600 Blade System, Xeon X5650 6C 10 (NSCS) China 2.66GHz, Infiniband QDR, NVIDIA 2050 Dawning Cấu trúc bộ xử lý tiên tiến • Top 10 siêu máy tính 11/2012 trên trang top500.org Rank Site System Cores DOE/SC/Oak Ridge National Laboratory Titan - Cray XK7 , Opteron 6274 16C 2.200GHz, 1 560.640 United States Cray Inc. DOE/NNSA/LLNL Sequoia - BlueGene/Q, Power BQC 16C 1.60 Hz, 2 1.572.864 United States IBM RIKEN Advanced Institute for Computational Science K computer, SPARC64 VIIIfx 2.0GHz, 3 705.024 Japan Fujitsu DOE/SC/Argonne National Laboratory Mira - BlueGene/Q, Power BQC 16C 1.60GHz, 4 786.432 United States IBM Forschungszentrum Juelich (FZJ) JUQUEEN - BlueGene/Q, Power BQC 16C 5 393.216 Germany 1.60GHz, IBM Leibniz Rechenzentrum SuperMUC - iDataPlex DX360M4, Xeon E5-2680 6 147.456 Germany 8C 2.70GHz, IBM Texas Advanced Computing Center/Univ. of Texas Stampede - PowerEdge C8220, Xeon E5-2680 8C 7 204.900 United States 2.700GHz, Intel Xeon Phi Dell National Supercomputing Center in Tianjin Tianhe-1A - NUDT YH MPP, Xeon X5670 6C 2.93 8 186.368 China GHz, NVIDIA 2050 NUDT CINECA Fermi - BlueGene/Q, Power BQC 16C 1.60GHz, 9 163.840 Italy IBM IBM Development Engineering DARPA Trial Subset - Power 775, POWER7 8C 10 63.360 United States 3.836GHz IBM 19
  20. 10/01/2017 Bộ nhớ (Memory) Nội dung • Tổng quan về hệ thống nhớ • Bộ nhớ bán dẫn • Bộ nhớ chính • Bộ nhớ cache • Bộ nhớ ngoài • Bộ nhớ ảo Tổng quan về hệ thống nhớ • Các đặc trưng của hệ thống nhớ – Vị trí • Bên trong CPU: – Tập thanh ghi • Bộ nhớ trong: – Bộ nhớ chính – Bộ nhớ cache • Bộ nhớ ngoài: các thiết bị lưu trữ – Dung lượng • Độ dài từ nhớ (tính bằng bit) • Số lượng từ nhớ 20
  21. 10/01/2017 Tổng quan về hệ thống nhớ • Các đặc trưng của hệ thống nhớ (tiếp) – Đơn vị truyền • Từ nhớ (word) • Khối nhớ (block) – Phương pháp truy cập • Truy cập tuần tự (băng từ) • Truy cập trực tiếp (các loại đĩa) • Truy cập ngẫu nhiên (bộ nhớ bán dẫn) • Truy cập kết hợp (cache) Tổng quan về hệ thống nhớ • Các đặc trưng của hệ thống nhớ (tiếp) – Hiệu năng (performance) • Thời gian truy cập • Tốc độ truyền – Kiểu vật lý • Bộ nhớ bán dẫn • Bộ nhớ từ • Bộ nhớ quang – Các đặc tính vật lý • Tự mất/ Không tự mất (volatile/ nonvolatile) • Xoá được/ không xoá được Tổng quan về hệ thống nhớ • Phân cấp hệ thống nhớ 21
  22. 10/01/2017 Tổng quan về hệ thống nhớ • Độ tin cậy bộ nhớ – Nguyên tắc chung: cần tạo ra và lưu trữ thêm thông tin dư thừa. • Từ dữ liệu cần ghi vào bộ nhớ: m bit • Cần tạo ra và lưu trữ từ mã: k bit • Lưu trữ (m+k) bit – Phát hiện lỗi • Kiểm tra chẵn/ lẻ (parity): Mỗi byte dữ liệu cần 1 bit kiểm tra • Checksum • CRC (Cyclic Redandancy Check) – Phát hiện và sửa lỗi • Dữ liệu được mã hoá bằng các bộ mã có khả năng sửa lỗi ECC (Error Correction Code), ví dụ : Mã Hamming • Mỗi byte hoặc block dữ liệu cần nhiều bit kiểm tra hơn Tổng quan về hệ thống nhớ • Độ tin cậy bộ nhớ (tiếp) Bộ nhớ bán dẫn • Phân loại – ROM (Read Only Memory) • Bộ nhớ chỉ đọc • Không tự mất dữ liệu khi cắt nguồn điện – RAM (Random Access Memory) • Bộ nhớ đọc/ ghi • Tự mất dữ liệu khi cắt nguồn điện – Cache • Bộ nhớ có tốc độ cao nhưng dung lượng thấp • Trung gian giữa bộ nhớ chính và thanh ghi trong CPU • Ngày nay thường được tích hợp sẵn trong CPU 22
  23. 10/01/2017 Bộ nhớ bán dẫn • ROM – Thông tin được ghi khi sản xuất – Không xoá/ sửa được nội dung khi sử dụng – Ứng dụng: • Thư viện các chương trình con • Các chương trình điều khiển hệ thống nhập xuất cơ bản BIOS (Basic Input Output System) • Phần mềm kiểm tra khi bật máy POST (Power On Self Test) • Phần mềm khởi động máy tính (OS loader) • Vi chương trình Bộ nhớ bán dẫn • Phân loại ROM – Mask ROM • Thông tin được ghi khi sản xuất • Không xoá/ sửa được nội dung • Giá thành rất đắt – PROM (Programmable ROM) • Khi sản xuất chưa có nội dung (ROM trắng) • Cần thiết bị chuyên dụng để ghi • Cho phép ghi được một lần, gọi là OTP (One Time Programmable) hoặc WORM (Write-Once-Read-Many) – EPROM (Erasable PROM) • Có thể xóa bằng tia cực tím UV (Ultra Violet) • Cần thiết bị chuyên dụng để ghi • Ghi/ xoá được nhiều lần Bộ nhớ bán dẫn • Phân loại ROM (tiếp) – EEPROM (Electrically EPROM) • Xóa bằng mạch điện, không cần tia UV Không cần tháo chip ROM ra khỏi máy tính • Có thể ghi theo từng byte • 2 chế độ điện áp: – Điện áp cao : Ghi + Xoá – Điện áp thấp : Chỉ đọc – Flash memory (Bộ nhớ cực nhanh) • EEPROM sản xuất bằng công nghệ NAND, tốc độ truy cập nhanh, mật độ cao • Xóa bằng mạch điện; Ghi theo từng block • Ngày nay được sử dụng rộng rãi dưới dạng thẻ nhớ (CF, SD, ) , thanh USB, ổ SSD (thay thế cho ổ đĩa cứng) 23
  24. 10/01/2017 Bộ nhớ bán dẫn • RAM – Bộ nhớ đọc-ghi (Read/Write Memory) – Có thể ghi/ xoá trong quá trình sử dụng Làm bộ nhớ chính trong máy tính – Tự mất dữ liệu khi cắt nguồn điện. Chỉ lưu trữ thông tin tạm thời khi chạy chương trình, khi kết thúc chương trình cần lưu trữ dữ liệu ra bộ nhớ ngoài – Có hai loại: • SRAM (Static RAM): RAM tĩnh • DRAM (Dynamic RAM): RAM động Bộ nhớ bán dẫn • SRAM – Các bit được lưu trữ bằng các Flip-Flop – Thông tin ổn định, không tự mất dữ liệu theo thời gian – Cấu trúc phức tạp – Dung lượng chip nhỏ – Tốc độ truy cập nhanh – Đắt tiền – Dùng làm bộ nhớ cache Bộ nhớ bán dẫn • DRAM – Các bit được lưu trữ trên mạch tụ điện – Tự mất dữ liệu theo thời gian cần phải có mạch làm tươi (refresh) – Cấu trúc đơn giản – Dung lượng lớn – Tốc độ chậm hơn – Rẻ tiền hơn – Dùng làm bộ nhớ chính 24
  25. 10/01/2017 Bộ nhớ bán dẫn • Phân loại DRAM theo cơ chế hoạt động – FPM (Fast Page Mode) • Truy cập theo từng trang bộ nhớ (cùng hàng khác cột) – EDO (Enhanced Data Out) • Khi xuất dữ liệu có thể đồng thời đọc địa chỉ của ô nhớ kế tiếp • Cho phép đọc nhanh gấp đôi so với RAM thường – SDRAM (Synchronous DRAM) • Đồng bộ với system clock CPU không cần chu kỳ chờ • Truyền dữ liệu theo block – RDRAM (Rambus DRAM) • Bộ nhớ tốc độ cao, truyền dữ liệu theo block • Do công ty Rambus và Intel sản xuất để sử dụng cho CPU Pentium 4 khi mới xuất hiện năm 2000 • Giá thành đắt nên ngày nay ít sử dụng Bộ nhớ bán dẫn • Phân loại DRAM theo cơ chế hoạt động (tiếp) – DDR-SDRAM (Double Data Rate-SDRAM) • Phiên bản cải tiến của SDRAM nhằm nâng cao tốc độ truy cập nhưng có giá thành rẻ hơn RDRAM • Gởi dữ liệu 2 lần trong 1 chu kỳ clock – DDR2/ DDR3: Gởi dữ liệu 4 hoặc 8 lần trong 1 chu kỳ clock Bộ nhớ bán dẫn • Phân loại DRAM theo hình thức đóng gói – SIMM (Single Inline Memory Module) – DIMM (Dual Inline Memory Module) – RIMM (Rambus Inline Memory Module) – SO-DIMM (Small Outline DIMM) – SO-RIMM (Small Outline RIMM) 25
  26. 10/01/2017 Bộ nhớ bán dẫn • Tổ chức của chip nhớ n – Các đường địa chỉ: An-1 ÷ A0 có 2 từ nhớ – Các đường dữ liệu: Dm-1 ÷ D0 độ dài từ nhớ = m bit n – Dung lượng chip nhớ = 2 * m bit – Các đường điều khiển: • Tín hiệu chọn chip CS (Chip Select) • Tín hiệu điều khiển đọc OE (Output Enable) • Tín hiệu điều khiển ghi WE (Write Enable) • Các tín hiệu điều khiển thường tích cực với mức 0 Bộ nhớ bán dẫn • Tổ chức bộ nhớ 1 chiều và 2 chiều Bộ nhớ bán dẫn • Tổ chức bộ nhớ hai chiều – Có n đường địa chỉ: n = n1 + n2 • 2n1 hàng, • mỗi hàng có 2n2 từ nhớ, – Có m đường dữ liệu: • mỗi từ nhớ có độ dài m-bit. – Dung lượng của chip nhớ: • [2n1 x (2n2 x m)] bit = (2n1+n2 x m) bit = (2n x m) bit. – Hoạt động giải mã địa chỉ: • Bước 1: bộ giải mã hàng chọn 1 trong 2n1 hàng. • Bước 2: bộ giải mã cột chọn 1 trong 2n2 từ nhớ (cột) của hàng đã được chọn. 26
  27. 10/01/2017 Bộ nhớ bán dẫn • Tổ chức của DRAM – Dùng n đường địa chỉ dồn kênh cho phép truyền 2n bit địa chỉ – Tín hiệu chọn địa chỉ hàng RAS (Row Address Strobe) – Tín hiệu chọn địa chỉ cột CAS (Column Address Strobe) 2n – Dung lượng DRAM = 2 x m bit Bộ nhớ bán dẫn • Thiết kế mô-đun nhớ bán dẫn – Dung lượng chip nhớ 2n x m bit – Cần thiết kế để tăng dung lượng: • Thiết kế tăng độ dài từ nhớ • Thiết kế tăng số lượng từ nhớ • Thiết kế kết hợp: tăng cả độ dài và số lượng từ nhớ – Qui tắc: ghép nối các chip nhớ song song (tăng độ dài) hoặc nối tiếp bằng mạch giải mã (tăng số lượng) Bộ nhớ bán dẫn • Tăng độ dài từ nhớ – VD: • Cho chip nhớ SRAM 4K x 4 bit • Thiết kế mô-đun nhớ 4K x 8 bit – Giải: • Dung lượng chip nhớ = 212 x 4 bit • chip nhớ có: – 12 chân địa chỉ – 4 chân dữ liệu • mô-đun nhớ cần có: – 12 chân địa chỉ – 8 chân dữ liệu – Tổng quát • Cho chip nhớ 2n x m bit • Thiết kế mô-đun nhớ 2n x (k.m) bit • Dùng k chip nhớ 27
  28. 10/01/2017 Bộ nhớ bán dẫn • Ví dụ: Tăng độ dài từ nhớ Bộ nhớ bán dẫn • Tăng số lượng từ nhớ – VD: • Cho chip nhớ SRAM 4K x 8 bit • Thiết kế mô-đun nhớ 8K x 8 bit – Giải: • Dung lượng chip nhớ = 212 x 8 bit • Chip nhớ có: – 12 chân địa chỉ – 8 chân dữ liệu • Dung lượng mô-đun nhớ = 213 x 8 bit – 13 chân địa chỉ – 8 chân dữ liệu Bộ nhớ bán dẫn • Ví dụ: Tăng số lượng từ nhớ 28
  29. 10/01/2017 Bộ nhớ bán dẫn • Bài tập – Tăng số lượng từ gấp 4 lần: • Cho chip nhớ SRAM 4K x 8 bit • Thiết kế mô-đun nhớ 16K x 8 bit • Gợi ý: Dùng mạch giải mã 2 4 – Tăng số lượng từ gấp 8 lần: • Cho chip nhớ SRAM 4K x 8 bit • Thiết kế mô-đun nhớ 32K x 8 bit • Gợi ý: Dùng mạch giải mã 3 8 – Thiết kế kết hợp: • Cho chip nhớ SRAM 4K x 4 bit • Thiết kế mô-đun nhớ 8K x 8 bit Bộ nhớ chính • Các đặc trưng cơ bản – Chứa các chương trình đang thực hiện và các dữ liệu đang được sử dụng – Tồn tại trên mọi hệ thống máy tính – Bao gồm các ô nhớ được đánh địa chỉ trực tiếp bởi CPU – Dung lượng của bộ nhớ chính trên thực tế thường nhỏ hơn không gian địa chỉ bộ nhớ mà CPU có thể quản lý. – Việc quản lý logic bộ nhớ chính tuỳ thuộc vào hệ điều hành người lập trình chỉ sử dụng bộ nhớ logic. Bộ nhớ chính • Tổ chức bộ nhớ đan xen (interleaved memory) – Độ rộng của bus dữ liệu để trao đổi với bộ nhớ: m = 8, 16, 32, 64,128 bit – Các ô nhớ được tổ chức theo byte tổ chức bộ nhớ vật lý khác nhau – m=8 bit một băng nhớ tuyến tính 29
  30. 10/01/2017 Bộ nhớ chính • Tổ chức bộ nhớ đan xen (tiếp) – m = 16 bit hai băng nhớ đan xen Bộ nhớ chính • Tổ chức bộ nhớ đan xen (tiếp) – m = 32 bit bốn băng nhớ đan xen Bộ nhớ chính • Tổ chức bộ nhớ đan xen (tiếp) – m = 64 bit tám băng nhớ đan xen 30
  31. 10/01/2017 Bộ nhớ cache • Nguyên tắc chung của cache – Nguyên lý cục bộ : Một chương trình thường sử dụng 90% thời gian chỉ để thi hành 10% câu lệnh – Cache được đặt giữa CPU và bộ nhớ chính nhằm tăng tốc độ truy cập bộ nhớ của CPU – Ví dụ: • Cấu trúc chương trình tuần tự • Vòng lặp có thân nhỏ • Cấu trúc dữ liệu mảng Bộ nhớ cache • Thao tác trên bộ nhớ cache – CPU yêu cầu nội dung của ô nhớ – CPU kiểm tra trên cache với dữ liệu này – Nếu có, CPU nhận dữ liệu từ cache (nhanh) – Nếu không có thực hiện 2 bước sau: • Đọc Block chứa dữ liệu từ bộ nhớ chính vào cache (chậm hơn) • Chuyển dữ liệu từ cache vào CPU Bộ nhớ cache • Cấu trúc chung của cache – Bộ nhớ chính có 2N byte nhớ • Bộ nhớ chính và cache được chia thành các khối có kích thước bằng nhau • Bộ nhớ chính: B0, B1, B2, , Bp-1 (p Blocks) • Bộ nhớ cache: L0, L1, L2, , Lm-1 (m Lines) • Kích thước của Block = 8,16,32,64,128 byte 31
  32. 10/01/2017 Bộ nhớ cache • Cấu trúc chung của cache (tiếp) – Một số Block của bộ nhớ chính được nạp vào các Line của cache. – Nội dung Tag (thẻ nhớ) cho biết Block nào của bộ nhớ chính hiện đang được chứa ở Line đó. – Khi CPU truy cập (đọc/ghi) một từ nhớ, có hai khả năng xảy ra: • Từ nhớ đó có trong cache (cache hit) • Từ nhớ đó không có trong cache (cache miss) Bộ nhớ cache • Tổ chức bộ nhớ cache – Kích thước cache • Cache càng lớn càng hiệu quả nhưng đắt tiền • Cần nhiều thời gian để giải mã và truy cập – Kỹ thuật ánh xạ : Phương pháp xác định vị trí dữ liệu trong cache • Ánh xạ trực tiếp (Direct mapping) • Ánh xạ kết hợp toàn phần (Fully associative mapping) • Ánh xạ kết hợp theo bộ (Set associative mapping) – Giải thuật thay thế • Phương pháp chọn lựa vùng nhớ nào lưu trong cache để tăng hiệu suất sử dụng cache Bộ nhớ cache • Ánh xạ trực tiếp – Mỗi Block của bộ nhớ chính chỉ có thể được nạp vào một Line của cache: • B0 L0 • B1 L1 Cache line Main Memory blocks s • 0 0, m, 2m, 3m 2s–m • B L m-1 m-1 1 1, m+1, 2m+1 2s–m+1 • B L m 0 m–1 m–1, 2m–1, 3m–1 2s–1 • Bm+1 L1 • – Tổng quát • Bj chỉ có thể nạp vào L(j mod m) • m là số Line của cache. 32
  33. 10/01/2017 Bộ nhớ cache • Ánh xạ trực tiếp (tiếp) Bộ nhớ cache • Đặc điểm của ánh xạ trực tiếp – Mỗi một địa chỉ N bit của bộ nhớ chính gồm ba vùng: • Vùng Word gồm W bit xác định một từ nhớ trong Block hay Line: – 2W = kích thước của Block hay Line • Vùng Line gồm L bit xác định một trong số các Line trong cache: – 2L = số Line trong cache = m • Vùng Tag gồm T bit: – T = N - (W+L) – Bộ so sánh đơn giản – Giá thành rẻ – Tỷ lệ cache hit thấp (vd: 2 block cùng map vào 1 line) 33
  34. 10/01/2017 Bộ nhớ cache • Ánh xạ kết hợp toàn phần – Mỗi Block có thể nạp vào bất kỳ Line nào của cache. – Địa chỉ của bộ nhớ chính bao gồm hai vùng: • Vùng Word giống như trường hợp ánh xạ trực tiếp. • Vùng Tag dùng để xác định Block của bộ nhớ chính. – Tag xác định Block đang nằm ở Line đó • Đặc điểm – So sánh đồng thời Block nhớ với tất cả các Tag mất nhiều thời gian – Tỷ lệ cache hit cao. – Bộ so sánh phức tạp. Bộ nhớ cache • Ánh xạ kết hợp toàn phần (tiếp) 34
  35. 10/01/2017 Bộ nhớ cache • Ánh xạ kết hợp theo bộ – Cache đươc chia thành các bộ (Set) – Mỗi một Set chứa một số Line – Ví dụ: • 4 Line/Set 4-way associative mapping – Ánh xạ theo nguyên tắc sau: • B0 S0 • B1 S1 • B2 S2 • Bộ nhớ cache • Ánh xạ kết hợp theo bộ (tiếp) 35
  36. 10/01/2017 Bộ nhớ cache • Đặc điểm ánh xạ kết hợp theo bộ – Kích thước Block = 2W Word – Vùng Set có S bit dùng để xác định một trong số V = 2S Set (dùng để xác định Set nào trong cache) – Vùng Tag có T bit: T = N - (W+S) dùng để xác định Line nào có trong Set – Mỗi Block bộ nhớ có thể ánh xạ vào Line bất kỳ trong 1 Set tương ứng – Là phương pháp tổng hợp từ hai phương pháp trên – Thông thường sử dụng 2, 4, 8, 16 Lines/Set Bộ nhớ cache • Ví dụ về ánh xạ địa chỉ – Không gian địa chỉ bộ nhớ chính = 4GB – Dung lượng bộ nhớ cache là 256KB – Kích thước Line (Block) = 32byte. – Xác định số bit của các trường địa chỉ cho ba trường hợp tổ chức: • Direct mapping • Fully associative mapping • 4-way set associative mapping Bộ nhớ cache • Ví dụ: Direct mapping – Bộ nhớ chính : 4GB = 232 byte N = 32 bit – Cache : 256 KB = 218 byte. – Line : 32 byte = 25 byte W = 5 bit – Line trong cache : 218/ 25 = 213 Line L = 13 bit – T = 32 - (13 + 5) = 14 bit 36
  37. 10/01/2017 Bộ nhớ cache • Ví dụ: Fully associative mapping – Bộ nhớ chính : 4GB = 232 byte N = 32 bit – Line : 32 byte = 25 byte W = 5 bit – Số bit của vùng Tag : T = 32 - 5 = 27 bit Bộ nhớ cache • Ví dụ: 4-way set associative mapping – Bộ nhớ chính : 4GB = 232 byte N = 32 bit – Line : 32 byte = 25 byte W = 5 bit – Line trong cache = 218/ 25 = 213 Line – Một Set có 4 Line = 22 Line – Set trong cache = 213/ 22 = 211 Set S = 11 bit – Số bit của vùng Tag : T = 32 - (11 + 5) = 16 bit Bộ nhớ cache • Giải thuật thay thế cache – Mục đích: Giải thuật thay thế dùng để xác định Line nào trong cache sẽ được chọn để đưa dữ liệu vào cache khi không còn chỗ trống – Thường được cài đặt bằng phần cứng để tăng tốc độ xử lý – Đối với ánh xạ trực tiếp: • Không phải lựa chọn • Mỗi Block chỉ ánh xạ vào một Line xác định 37
  38. 10/01/2017 Bộ nhớ cache • Giải thuật thay thế với ánh xạ kết hợp – FIFO (First In First Out): Thay thế Block nào nằm lâu nhất ở trong Set đó – LFU (Least Frequently Used): Thay thế Block nào trong Set có số lần truy cập ít nhất trong cùng một khoảng thời gian – LRU (Least Recently Used): Thay thế Block ở trong Set tương ứng có thời gian lâu nhất không được tham chiếu tới. – Giải thuật tối ưu nhất: LRU Bộ nhớ cache • Đặc điểm ghi dữ liệu ra cache – Chỉ ghi vào 1 block trong cache khi nội dung trong bộ nhớ chính thay đổi – Nếu CPU ghi ra cache, ô nhớ tương ứng bị lạc hậu (invalid) cần update ra BN chính. Ngược lại, nếu ghi vào BN chính, nội dung trong cache sẽ bị invalid cần update lại cache – Trong hệ đa xử lý có nhiều CPU với cache riêng, khi ghi vào 1 cache, các cache khác sẽ bị invalid Bộ nhớ cache • Phương pháp ghi dữ liệu khi cache hit – Write-through: • Ghi cả cache và cả bộ nhớ chính • Tốc độ chậm • Cho phép CPU khác hoặc IO truy cập dữ liệu đã ghi từ BN – Write-back: • Chỉ ghi ra cache • Tốc độ nhanh • CPU khác hoặc IO không đọc được dữ liệu mới trong BN • Khi Block trong cache bị thay thế cần phải ghi Block này về bộ nhớ chính 38
  39. 10/01/2017 Bộ nhớ cache • Cache tách biệt và cache đồng nhất – Cache tách biệt (Split Cache): Tổ chức cache riêng cho dữ liệu và cache riêng cho lệnh chương trình • Tối ưu cho từng loại cache • Hỗ trợ kiến trúc pipeline • Phần cứng phức tạp – Cache đồng nhất (Unified Cache): Sử dụng 1 cache chung cho cả dữ liệu lẫn lệnh chương trình • Cân bằng về tỷ lệ cache hit • Phần cứng đơn giản Bộ nhớ cache • Ví dụ: Hệ thống cache trong CPU Intel Pentium 4 Bộ nhớ cache • Ví dụ: Hệ thống cache trong CPU Intel Core i7 39
  40. 10/01/2017 Bộ nhớ ngoài • Các kiểu bộ nhớ ngoài – Trống từ (Drum): Ngày nay không còn sử dụng – Băng từ (Tape): Chuyên dùng cho backup dữ liệu – Đĩa từ: Đang sử dụng rộng rãi nhất – Đĩa quang: Dùng để trao đổi dữ liệu giữa các máy tính và phân phối phần mềm – Flash Disk: Loại bộ nhớ bán dẫn gắn ngoài qua cổng USB, nhỏ gọn và thuận tiện để trao đổi dữ liệu – SSD (Solid State Disk): Cũng là bộ nhớ bán dẫn có dung lượng lớn giao tiếp với máy tính tương tự ổ đĩa cứng, tốc độ truy cập cao, ít tốn điện, không ồn, chống sốc tốt rất phù hợp với máy xách tay. Nhược điểm giá thành đắt. Bộ nhớ ngoài • Đĩa từ – Bao gồm đĩa mềm (floppy disk) và đĩa cứng (hard disk) – Các đặc tính đĩa từ • Đầu từ cố định hay đầu từ di động • Đĩa cố định hay thay đổi được (removable) • Một mặt hay hai mặt • Một tấm đĩa (đĩa mềm) hay nhiều tấm đĩa (đĩa cứng) • Cơ chế đầu từ – Tiếp xúc (đĩa mềm) – Không tiếp xúc Bộ nhớ ngoài • Đĩa từ (tiếp) – Đĩa mềm • 8”, 5.25”, 3.5” • Dung lượng nhỏ: chỉ tới 1.44MB • Tốc độ chậm • Hiện nay không sản xuất nữa – Đĩa cứng • Thường có nhiều tấm đĩa • Đang sử dụng rộng rãi • Dung lượng lớn (hiện nay có ổ 3TB – 2011) • Tốc độ đọc/ghi nhanh • Rẻ tiền 40
  41. 10/01/2017 Bộ nhớ ngoài • Cấu trúc vật lý đĩa cứng – Mặt đĩa – Track (cylinder) – Sector Bộ nhớ ngoài • Cấu trúc vật lý đĩa cứng (tiếp) • Track là các vòng tròn đồng tâm • Đơn vị đọc ghi: từng sector (~ 512Byte), có thể đọc ghi theo block nhiều sector (cluster) • Thời gian đọc ghi: • Seek time • Latency time • Transfer time • Đĩa quay với vận tốc góc không đổi CAV (constant angular velocity) Bộ nhớ ngoài • Cấu trúc vật lý đĩa cứng (tiếp) – Longitudial recording: Ghi tuyến tính – Perpendicular recording: Ghi trực giao – Cluster: Một bộ gồm nhiều sector 41
  42. 10/01/2017 Bộ nhớ ngoài • Định dạng sector Bộ nhớ ngoài • Kỹ thuật RAID – RAID: Redundant Array of Independent Disks – Ghép nhiều ổ đĩa vật lý để truy cập như 1 ổ luận lý • Tăng tốc độ truy cập (đọc ghi luân phiên và song song) • Tăng độ an toàn dữ liệu khi đĩa hư hỏng (ghi dư thừa hoặc ghi thêm thông tin ECC/parity) • Tăng dung lượng tối đa của đơn vị lưu trữ (nhiều đĩa) – Hiện có 7 loại thông dụng: RAID0 – RAID6 Bộ nhớ ngoài • RAID 0, 1 và 2 42
  43. 10/01/2017 Bộ nhớ ngoài • RAID 3 và 4 Bộ nhớ ngoài • RAID 5 và 6 Bộ nhớ ngoài • Tóm tắt kỹ thuật RAID 43
  44. 10/01/2017 Bộ nhớ ngoài • Đĩa quang (optical disk) – CD (compact disk) • Khả năng đọc/ghi: CD-ROM, CD-R, CD-RW • Đường kính: 12cm, 8cm • Dung lượng: 700MB, 200MB • Track: Ghi theo các vòng hướng tâm, tốc độ dài không đổi CLV (constant linear velocity) • Tốc độ đọc ghi: 1x – 52x (1x= ??) • Chuẩn định dạng: ISO 9660, UDF (Universal Disk Format) Bộ nhớ ngoài • Đĩa quang (tiếp) – DVD (Digital Versatile Disk): Loại đĩa dung lượng cao (so với CD), xuất phát từ đĩa phim video (Digital Video Disk) – Khả năng đọc ghi: DVD-ROM, DVD±R, DVD±RW, DVD-RAM – Số mặt/ số lớp: 1-2 mặt, 1-2 lớp/mặt Diameter Capacity – Đường kính: 12cm, 8cm Sides Layers (cm) (GB) – Tốc độ: 1x – 24x (1x=?) 1 1 8 1.46 1 2 8 2.66 – Đĩa DVD dung lượng cao 2 2 8 2.92 • HD-DVD (15-60GB) 2 4 8 5.32 1 1 12 4.7 • Blue ray (25-50GB) 1 2 12 8.54 2 2 12 9.4 2 4 12 17.08 Bộ nhớ ảo • Bộ nhớ thật – Không gian địa chỉ trong chương trình trùng với không gian địa chỉ trong bộ nhớ. Cho phép người lập trình truy cập trực tiếp vào 1 ô nhớ Khó bảo vệ bộ nhớ. – Khi thi hành, hệ điều hành nạp toàn bộ chương trình vào bộ nhớ (nạp trước) bộ nhớ máy tính phải đủ lớn để chạy các CT lớn – Chương trình được cấp phát 1 vùng nhớ có địa chỉ liên tục (cấp phát liên tục). HĐH sẽ thu hồi vùng nhớ sau khi chương trình kết thúc – Để thực hiện đa chương, HĐH cần chia BN ra nhiều vùng (partition), mỗi vùng cấp phát cho 1 CT – Khi bộ nhớ đầy • HĐH không cấp tiếp, các CT phải chờ đến khi có 1 vùng nhớ trống • HĐH cấp tiếp: Cần kỹ thuật tráo đổi (swapping) để ghi tạm vùng nhớ của 1 CT khác ra BN ngoài, lấy chỗ trống cấp cho CT mới 44
  45. 10/01/2017 Bộ nhớ ảo • Bộ nhớ thật (tiếp) Bộ nhớ ảo • Bộ nhớ ảo (Virtual Memory) – Không gian địa chỉ trong CT (địa chỉ ảo) được tách biệt với không gian địa chỉ trong BN (địa chỉ thực) CPU và HĐH sẽ phối hợp để ánh xạ (mapping) địa chỉ ảo trong CT thành địa chỉ thật trong BN – Việc ánh xạ và quản lý BN ảo được thực hiện qua đơn vị MMU (Memory Management Unit) Bộ nhớ ảo • Bộ nhớ ảo (tiếp) – Khi thi hành, hệ điều hành chỉ nạp các phần cần thiết của CT vào bộ nhớ (nạp theo yêu cầu), không cần nạp toàn bộ CT tránh lãng phí BN – Các CT được cấp phát nhiều vùng nhớ có địa chỉ tách biệt nhau (cấp phát không liên tục). – Sử dụng kỹ thuật tráo đổi (swapping) để ghi tạm thời các vùng nhớ chưa cần đến ra BN ngoài (swap-out) để lấy chỗ trống nạp thông tin cần thiết vào BN (swap-in) khi cần đến – BN ngoài thông dụng là đĩa cứng – Có 2 kỹ thuật BN ảo: • Kỹ thuật phân trang : Kích thước các vùng nhớ cố định • Kỹ thuật phân đoạn : Kích thước các vùng nhớ thay đổi 45
  46. 10/01/2017 Bộ nhớ ảo • Kỹ thuật phân trang (paging) – Không gian địa chỉ ảo trong CT được chia đều ra các trang ảo (virtual page, gọi tắt là page) có kích thước bằng nhau, mỗi trang là 1 đơn vị cấp phát BN của HĐH – Không gian địa chỉ thật trong BN cũng được chia đều thành các khung trang (page frame, gọi tắt là frame) có kích thước bằng 1 trang (thường là 4KB) – Khi có yêu cầu cấp phát BN, HĐH có thể nạp 1 trang theo yêu cầu vào bất cứ frame nào trong BN thật – Khi CT truy cập vào 1 trang chưa được cấp phát sẽ gây ra lỗi trang (page fault) HĐH phải xử lý bằng cách swapping với 1 trang khác chưa cần sử dụng đến (chậm) – HĐH cần 1 bảng quản lý để theo dõi trang nào đang được nạp vào frame nào trong BN cho mỗi CT, gọi là bảng trang (page table) Bộ nhớ ảo • Kỹ thuật phân trang (tiếp) Bộ nhớ ảo • Ví dụ về BN phân trang – BN ảo trong CT gồm 64KB được chia ra 16 trang, mỗi trang 4KB – BN thực gồm 32KB được chia ra 8 frame – BN đang được cấp phát như thể hiện trong bảng trang Bài tập: Hãy tính địa chỉ thật từ các địa chỉ ảo • 10.000 • 20.000 • 30.000 46
  47. 10/01/2017 Bộ nhớ ảo • Kỹ thuật phân đoạn (segmentation) – Quan điểm người lập trình về BN • Chương trình bao gồm nhiều module • Dữ liệu bao gồm nhiều array, chuỗi, • Khi truy cập sẽ căn cứ vào địa chỉ tương đối của module (lệnh thứ mấy) hay array (phần tử thứ mấy) Bộ nhớ ảo • Kỹ thuật phân đoạn (tiếp) – HĐH sẽ cấp phát BN theo từng đoạn (segment) có kích thước theo yêu cầu lập trình, người lập trình truy cập BN theo offset trong từng segment – Địa chỉ ảo có dạng (segment, offset) – Khi có yêu cầu cấp phát BN, HĐH có thể nạp 1 segment theo yêu cầu vào vùng trống trong BN thật. Nếu không có vùng trống đủ lớn HĐH cần dồn BN để tạo ra vùng trống đủ lớn. – Khi CT truy cập vào 1 segment chưa được cấp phát sẽ gây ra lỗi segment (segment fault) HĐH phải xử lý bằng cách swapping với 1 hoặc vài segment khác chưa cần sử dụng đến (chậm) – HĐH cần 1 bảng quản lý để theo dõi segment nào đang được nạp vào vị trí nào trong BN cho mỗi CT, gọi là bảng segment (segment table) Bộ nhớ ảo • Ví dụ về BN phân đoạn Ban đầu S1 swap-out S4 swap-out S3 swap-out Dồn bộ nhớ S7 swap-in S5 swap-in S6 swap-in 47
  48. 10/01/2017 Bộ nhớ ảo • Tổng quát việc truy cập bộ nhớ trong máy tính Bộ nhớ ảo • Ưu điểm BN ảo – Cho phép CT lớn hơn BN vẫn chạy được – Chỉ nạp phần CT nào cần đến vào BN tiết kiệm BN • Nhược điểm BN ảo – Tăng phí tổn hệ thống (overhead): Tốn thời gian tính toán địa chỉ ảo sang địa chỉ thật, tốn không gian BN chứa bảng trang/ segment – Truy cập BN chậm hơn so với quản lý BN thực: Cần gấp đôi thời gian truy cập BN. Khi có page/ segment fault việc truy cập BN biến thành truy cập IO • Cách khắc phục – Cần phần cứng đặc biệt hỗ trợ HĐH để quản lý BN – Cần giải thuật thay trang/ segment tối ưu Bộ nhớ ảo • Ví dụ: BN ảo trong CPU Intel Pentium 4 – Phân segment kết hợp phân trang 2 cấp • Phân segment: Segment 16 bit, Offset: 32 bit. • Phân trang: Địa chỉ tuyến tính 32 bit chia ra: Directory 10 bit, page 10 bit và offset 12 bit (4KB/trang) 48
  49. 10/01/2017 Hệ thống IO (Input Output System) Nội dung • Tổng quan về hệ thống IO • Điều khiển IO • Nối ghép thiết bị ngoại vi • Các thiết bị ngoại vi thông dụng Tổng quan về hệ thống IO • Giới thiệu chung – Chức năng của hệ thống IO: Trao đổi thông tin giữa máy tính với thế giới bên ngoài – Các thao tác cơ bản: • Nhập dữ liệu (Input) • Xuất dữ liệu (Output) – Các thành phần chính: • Các thiết bị ngoại vi • Các mô-đun IO (IO module) – Tất cả các thiết bị ngoại vi đều chậm hơn CPU và RAM Cần có các mô-đun IO để nối ghép các thiết bị ngoại vi với CPU và bộ nhớ chính 49
  50. 10/01/2017 Tổng quan về hệ thống IO • Cấu trúc cơ bản của hệ thống IO Tổng quan về hệ thống IO • Các thiết bị ngoại vi – Chức năng: chuyển đổi dữ liệu giữa bên trong và bên ngoài máy tính – Phân loại: • Thiết bị ngoại vi giao tiếp người-máy (người đọc): Bàn phím, Màn hình, Máy in, • Thiết bị ngoại vi giao tiếp máy-máy (máy đọc): Đĩa cứng, CDROM, USB, • Thiết bị ngoại vi truyền thông: Modem, Network Interface Card (NIC) Tổng quan về hệ thống IO • Tốc độ 1 số TBNV 50
  51. 10/01/2017 Tổng quan về hệ thống IO • Các thành phần của thiết bị ngoại vi – Bộ chuyển đổi tín hiệu: chuyển đổi dữ liệu giữa bên ngoài và bên trong máy tính – Bộ đệm dữ liệu: đệm dữ liệu khi truyền giữa mô-đun IO và thiết bị ngoại vi – Khối logic điều khiển: điều khiển hoạt động của thiết bị ngoại vi đáp ứng theo yêu cầu từ mô-đun IO Tổng quan về hệ thống IO • Chức năng của mô-đun IO: – Điều khiển và định thời – Trao đổi thông tin với CPU hoặc bộ nhớ chính – Trao đổi thông tin với thiết bị ngoại vi – Đệm giữa bên trong máy tính với thiết bị ngoại vi – Phát hiện lỗi của thiết bị ngoại vi Tổng quan về hệ thống IO • Không gian địa chỉ của CPU – Một số CPU quản lý duy nhất một không gian địa chỉ: • Không gian địa chỉ bộ nhớ: 2M địa chỉ – Một số CPU quản lý hai không gian địa chỉ tách biệt: • Không gian địa chỉ bộ nhớ: 2M địa chỉ • Không gian địa chỉ IO: 2I địa chỉ • Có tín hiệu điều khiển phân biệt truy nhập không gian địa chỉ • Tập lệnh có các lệnh IO chuyên dụng – Ví dụ: CPU Intel Pentium 4 • Không gian địa chỉ bộ nhớ = 236 byte = 64GB • Không gian địa chỉ IO = 216 byte = 64KB • Lệnh IO chuyên dụng: IN, OUT 51
  52. 10/01/2017 Tổng quan về hệ thống IO • Các phương pháp địa chỉ hoá cổng IO – IO riêng biệt (Isolated IO, IO mapped IO) • Cổng IO được đánh địa chỉ theo không gian địa chỉ IO • CPU trao đổi dữ liệu với cổng IO thông qua các lệnh IO chuyên dụng (IN, OUT) • Chỉ có thể thực hiện trên các hệ thống có quản lý không gian địa chỉ IO riêng biệt – IO theo bộ nhớ (Memory mapped IO) • Cổng IO được đánh địa chỉ theo không gian địa chỉ bộ nhớ • IO giống như đọc/ghi bộ nhớ • CPU trao đổi dữ liệu với cổng IO thông qua các lệnh truy nhập dữ liệu bộ nhớ • Có thể thực hiện trên mọi hệ thống Tổng quan về hệ thống IO • Ví dụ: So sánh 2 phương pháp IO Điều khiển IO • Các phương pháp điều khiển IO – IO bằng chương trình (Programmed IO) – IO điều khiển bằng ngắt (Interrupt Driven IO) – Truy nhập bộ nhớ trực tiếp DMA (Direct Memory Access) 52
  53. 10/01/2017 Điều khiển IO Điều khiển IO • IO bằng chương trình – Nguyên tắc chung: CPU điều khiển trực tiếp IO bằng chương trình cần phải lập trình IO. – Với IO riêng biệt: sử dụng các lệnh IO chuyên dụng (IN, OUT). – Với IO theo bản đồ bộ nhớ: sử dụng các lệnh trao đổi dữ liệu với bộ nhớ để trao đổi dữ liệu với cổng IO. Điều khiển IO • Các tín hiệu điều khiển IO – Tín hiệu điều khiển (Control): kích hoạt & khởi động thiết bị ngoại vi – Tín hiệu kiểm tra (Test): kiểm tra trạng thái của mô- đun IO và thiết bị ngoại vi – Tín hiệu điều khiển đọc (Read): yêu cầu môđun IO nhận dữ liệu từ thiết bị ngoại vi và đưa vào thanh ghi đệm dữ liệu, rồi CPU nhận dữ liệu đó – Tín hiệu điều khiển ghi (Write): yêu cầu môđun IO lấy dữ liệu trên bus dữ liệu đưa đến thanh ghi đệm dữ liệu rồi chuyển ra thiết bị ngoại vi 53
  54. 10/01/2017 Điều khiển IO • Hoạt động của IO bằng chương trình – CPU yêu cầu thao tác IO – Mô-đun IO thực hiện thao tác – Mô-đun IO thiết lập các bit trạng thái – CPU kiểm tra các bit trạng thái: • Nếu chưa sẵn sàng thì quay lại kiểm tra • Nếu sẵn sàng thì chuyển sang trao đổi dữ liệu với mô-đun IO • Đặc điểm – IO do ý muốn của người lập trình – CPU trực tiếp điều khiển IO – CPU đợi mô-đun IO tiêu tốn thời gian của CPU Điều khiển IO • IO điều khiển bằng ngắt – Sau khi gửi yêu cầu IO, CPU không phải đợi trạng thái sẵn sàng của mô-đun IO, CPU thực hiện một chương trình nào đó – Khi mô-đun IO sẵn sàng thì nó phát tín hiệu ngắt CPU – CPU thực hiện chương trình con IO tương ứng để trao đổi dữ liệu (trình xử lý ngắt) – CPU trở lại tiếp tục thực hiện chương trình đang bị ngắt Điều khiển IO • Hoạt động nhập dữ liệu: nhìn từ mô-đun IO – Mô-đun IO nhận tín hiệu điều khiển đọc từ CPU – Mô-đun IO nhận dữ liệu từ thiết bị ngoại vi, trong khi đó CPU làm việc khác – Khi đã có dữ liệu mô-đun IO phát tín hiệu ngắt CPU – CPU yêu cầu dữ liệu – Mô-đun IO chuyển dữ liệu đến CPU 54
  55. 10/01/2017 Điều khiển IO • Hoạt động nhập dữ liệu: nhìn từ CPU – Phát tín hiệu điều khiển đọc – Làm việc khác – Cuối mỗi chu trình lệnh, kiểm tra tín hiệu ngắt – Nếu bị ngắt: • Cất ngữ cảnh (nội dung các thanh ghi) • Thực hiện chương trình con ngắt để nhập dữ liệu • Khôi phục ngữ cảnh của chương trình đang thực hiện Điều khiển IO • Các vấn đề nảy sinh khi có ngắt: – Xác định được mô-đun IO nào phát tín hiệu ngắt ? – Có nhiều yêu cầu ngắt cùng xảy ra ? • Các phương pháp nối ghép ngắt – Sử dụng nhiều đường yêu cầu ngắt – Hỏi vòng bằng phần mềm (Software Poll) – Hỏi vòng bằng phần cứng (Daisy Chain or Hardware Poll) – Sử dụng bộ điều khiển ngắt lập trình được PIC (Programmable Interrupt Controller) Điều khiển IO • Nhiều đường yêu cầu ngắt – Mỗi mô-đun IO được nối với một đường yêu cầu ngắt – CPU phải có nhiều đường tín hiệu yêu cầu ngắt – Hạn chế số lượng mô-đun IO – Các đường ngắt được qui định mức ưu tiên 55
  56. 10/01/2017 Điều khiển IO • Hỏi vòng bằng phần mềm – CPU thực hiện phần mềm hỏi lần lượt từng mô- đun IO – Chậm – Thứ tự các mô-đun được hỏi vòng chính là thứ tự ưu tiên Điều khiển IO • Hỏi vòng bằng phần cứng – CPU phát tín hiệu chấp nhận ngắt (INTA) đến mô-đun IO đầu tiên – Nếu mô-đun IO đó không gây ra ngắt thì nó gửi tín hiệu đến mô-đun kế tiếp cho đến khi xác định được mô-đun gây ngắt – Thứ tự các mô-đun IO kết nối trong chuỗi xác định thứ tự ưu tiên Điều khiển IO • Bộ điều khiển ngắt lập trình được PIC – PIC có nhiều đường vào yêu cầu ngắt có qui định mức ưu tiên – PIC chọn một yêu cầu ngắt không bị cấm có mức ưu tiên cao nhất gửi tới CPU 56
  57. 10/01/2017 Điều khiển IO • Đặc điểm của IO điều khiển bằng ngắt – Có sự kết hợp giữa phần cứng và phần mềm – Phần cứng: gây ngắt CPU – Phần mềm: trao đổi dữ liệu – CPU trực tiếp điều khiển IO – CPU không phải đợi mô-đun IO hiệu quả sử dụng CPU tốt hơn • Ví dụ: Hệ thống ngắt trên máy PC – CPU Intel x86 có 1 chân tín hiệu ngắt – PIC 8259A có 8 đường ngắt – Có thể đấu nối nhiều PIC theo chế độ master/ slaver để tăng số lượng đường ngắt phục vụ cho nhiều thiết bị Điều khiển IO • DMA (Direct Memory Access) – IO bằng chương trình và bằng ngắt do CPU trực tiếp điều khiển: • Chiếm thời gian của CPU • Tốc độ truyền bị hạn chế vì phải chuyển dữ liệu qua CPU (thanh ghi có dung lượng nhỏ) – Để khắc phục dùng DMA • Thêm mô-đun phần cứng trên bus DMAC (DMA Controller) • DMAC điều khiển trao đổi dữ liệu giữa môđun IO với bộ nhớ chính 57
  58. 10/01/2017 Điều khiển IO • Sơ đồ cấu trúc của DMAC – Thanh ghi dữ liệu: chứa dữ liệu trao đổi – Thanh ghi địa chỉ: chứa địa chỉ ô nhớ dữ liệu – Bộ đếm dữ liệu: chứa số từ dữ liệu cần trao đổi – Logic điều khiển: điều khiển hoạt động của DMAC Điều khiển IO • Hoạt động DMA – CPU gửi tín hiệu cho DMAC • Vào hay Ra dữ liệu • Địa chỉ thiết bị IO (cổng IO tương ứng) • Địa chỉ đầu của mảng nhớ chứa dữ liệu nạp vào thanh ghi địa chỉ • Số từ dữ liệu cần truyền nạp vào bộ đếm dữ liệu – CPU làm việc khác – DMAC điều khiển trao đổi dữ liệu – Sau khi truyền được một từ dữ liệu thì: • nội dung thanh ghi địa chỉ tăng • nội dung bộ đếm dữ liệu giảm – Khi bộ đếm dữ liệu = 0, DMAC gửi tín hiệu ngắt CPU để báo kết thúc DMA Điều khiển IO • Các kiểu thực hiện DMA – DMA truyền theo khối (Block-transfer DMA): DMAC sử dụng bus để truyền xong cả khối dữ liệu – DMA lấy lén chu kỳ (Cycle Stealing DMA): DMAC cưỡng bức CPU treo tạm thời từng chu kỳ bus, DMAC chiếm bus thực hiện truyền một từ dữ liệu. – DMA trong suốt (Transparent DMA): DMAC nhận biết những chu kỳ nào CPU không sử dụng bus thì chiếm bus để trao đổi một từ dữ liệu. 58
  59. 10/01/2017 Điều khiển IO • Cấu hình DMA 1: Bus chung, DMA tách biệt – Mỗi lần trao đổi một dữ liệu, DMAC sử dụng bus hai lần • Giữa mô-đun IO với DMAC • Giữa DMAC với bộ nhớ – CPU bị treo khỏi bus 2 lần Điều khiển IO • Cấu hình DMA 2: Bus chung, DMA tích hợp – DMAC điều khiển một hoặc vài mô-đun IO – Mỗi lần trao đổi một dữ liệu, DMAC sử dụng bus một lần • Giữa DMAC với bộ nhớ – CPU bị treo khỏi bus 1 lần Điều khiển IO • Cấu hình DMA 3: Bus IO riêng – Bus IO tách rời hỗ trợ tất cả các thiết bị cho phép DMA – Mỗi lần trao đổi một dữ liệu, DMAC sử dụng bus một lần • Giữa DMAC với bộ nhớ – CPU bị treo khỏi bus 1 lần 59
  60. 10/01/2017 Điều khiển IO • Đặc điểm của DMA – CPU không tham gia trong quá trình trao đổi dữ liệu – DMAC điều khiển trao đổi dữ liệu giữa bộ nhớ chính với mô-đun IO (hoàn toàn bằng phần cứng) tốc độ nhanh – Phù hợp với các yêu cầu trao đổi mảng dữ liệu có kích thước lớn (Block devices) • Phân loại TBNV – Character devices – Block devices Điều khiển IO • Ví dụ: Chip DMA trong máy PC – Intel 8237A DMA Controller – Giao tiếp với CPU Intel x86 và DRAM – Khi DMA cần bus, nó gửi tín hiệu HRQ cho CPU – CPU trả lời bằng tín hiệu HLDA – DMA bắt đầu sử dụng bus Điều khiển IO • Kênh IO (IO channel) – Việc điều khiển IO được thực hiện bởi một bộ xử lý IO chuyên dụng – Bộ xử lý IO hoạt động theo chương trình của riêng nó – Chương trình của bộ xử lý IO có thể nằm trong bộ nhớ chính hoặc nằm trong một bộ nhớ riêng – Hoạt động theo kiến trúc đa xử lý • CPU gửi yêu cầu IO cho kênh IO • Kênh IO tự thực hiện việc truyền dữ liệu 60
  61. 10/01/2017 Nối ghép thiết bị ngoại vi • Các kiểu nối ghép – Nối ghép song song (parallel) – Nối ghép nối tiếp (serial) • Nối ghép song song – Truyền nhiều bit song song – Cần nhiều đường truyền dữ liệu – Tốc độ nhanh – Dễ bị nhiễu giữa các tín hiệu Nối ghép thiết bị ngoại vi • Nối ghép nối tiếp – Truyền lần lượt từng bit – Cần có bộ chuyển đổi từ dữ liệu song song sang nối tiếp hoặc/và ngược lại – Cần ít đường truyền dữ liệu – Tốc độ chậm hơn Nối ghép thiết bị ngoại vi • Các cấu hình nối ghép – Điểm tới điểm (Point to Point) • Mỗi cổng IO nối ghép với một thiết bị ngoại vi • Ví dụ: – SATA (Serial ATA) – SAS (Serial Atache SCSI) – Điểm tới đa điểm (Point to Multipoint) • Mỗi cổng IO cho phép nối ghép với nhiều thiết bị ngoại vi • Ví dụ: – SCSI (Small Computer System Interface): 7 hoặc 15 thiết bị – USB (Universal Serial Bus): 127 thiết bị – IEEE 1394 (FireWire): 63 thiết bị 61
  62. 10/01/2017 Nối ghép thiết bị ngoại vi • Ví dụ: Các cổng nối ghép ngoại vi trên PC – PS/2: nối ghép bàn phím và chuột – MiniDIN 6 chân – RJ45: nối ghép mạng – LPT (Line Printer): nối ghép với máy in, là cổng song song (Parallel Port) – 25 chân – COM (Communication): nối ghép với Modem, là cổng nối tiếp (Serial Port) - 9 hoặc 25 chân – USB (Universal Serial Bus): Cổng nối tiếp đa năng, cho phép nối ghép tối đa 127 thiết bị Nối ghép thiết bị ngoại vi • Ví dụ: Các cổng nối ghép trên card màn hình – VGA: Cổng nối ghép màn hình Analog– 15 chân – DVI: Cổng nối ghép màn hình Digital – S-Video – HDMI Nối ghép thiết bị ngoại vi • Ví dụ: Hệ thống bus ngoại vi trên máy PC 62
  63. 10/01/2017 Nối ghép thiết bị ngoại vi • Hệ thống bus ngoại vi trên máy PC (tiếp) – ISA (Industry Standard Architecture): Sử dụng trên máy PC 8086 (8 bit) và AT 80286 (16 bit) – MCA (Micro Channel Architecture): Sử dụng trên máy 80386 của IBM (32 bit) – EISA (Extended ISA) Sử dụng trên các máy 80386 tương thích (32 bit) – VL bus (VESA Local bus): Sử dụng trên các máy 80486 (32 bit) Nối ghép thiết bị ngoại vi • Hệ thống bus ngoại vi trên máy PC (tiếp) – AGP (Accelerated Graphics Port): Bus dành riêng cho card màn hình trên máy Pentium. Bao gồm các mức tốc độ 1x, 2x, 4x và 8x (1x=266MB/s). – PCI (Peripheral Component Interconnect): Sử dụng trên các máy Pentium (32 & 64 bit) • PCI-X: Sử dụng tần số xung nhịp cao hơn (66-133 MHz) so với PCI 33 MHz • PCI-E (PCI-Express): Cho phép truyền dữ liệu tốc độ cao, được sử dụng trong các máy PC đời mới. Gồm nhiều mức tốc độ: 1x, 2x, , 32x (1x: 1 Lane có 4 đường truyền nối tiếp 250 MB/s) Nối ghép thiết bị ngoại vi • Các cổng điều khiển đĩa – Đĩa mềm : Dùng cáp 34 chân kết nối tối đa 2 ổ mềm – Đĩa cứng/CD/DVD/SSD : • Chuẩn ST506 • Chuẩn ESDI • Chuẩn IDE/UDMA/PATA • Chuẩn SCSI • Chuẩn SATA • Chuẩn SAS 63
  64. 10/01/2017 Các thiết bị ngoại vi thông dụng • Thiết bị nhập – Bàn phím, chuột, scanner, digitizer, micro, đọc vân tay, đọc bar-code, camera, • Thiết bị xuất – Màn hình, máy in, máy vẽ, loa, projector, • Thiết bị mạng & truyền thông – Modem, Router, • Thiết bị lưu trữ – Đĩa mềm, đĩa cứng, SSD, CD, DVD, thẻ nhớ, Cahï hoûi ohn taäê • Bïí æaø ár? Troná caùc æoaïi Bïí, Bïí naøo æaø Bïí 2 chiefï. • Cho 1 oh nhzù coù ñòa chæ vaät æyù æaø 1256Â, cho bieát ñòa chæ daïná íeáment:offíet vzùi caùc ñoaïn 1256Â vaø 1240Â. • OÂ nhzù coù ñòa chæ vaät æyù 80FD2Â, zû troná ñoaïn naøo thr noù coù offíet = BFD2Â? • Xaùc ñònh ñòa chæ vaät æyù cïûa oh nhzù coù ñòa chæ æoáic 0A51Â:CD90Â Chuong 2 : Tổ chức CPU 191 Cahï hoûi ohn taäê • Theá naøo æaø biehn áizùi ñoaïn? • Sö ï åhaùc nhaï cz baûn áiö õa boä vi òö û æyù 8086 vaø 80286? • Thïyeát minh trrnh tö ï CPU thö ïc hieän cahï æeänh Mem(b)  Not Mem(a) • Chï åyø æeänh, chï åyø maùy. Cho bieát qïan heä áiö õa chï åyø cæocå, chï åyø maùy vaø chï åyø æeänh. • Qïan heä áiöõa taäê æeänh vaø åieán trïùc cïûa CPU Chuong 2 : Tổ chức CPU 192 64
  65. 10/01/2017 Cahï hoûi ohn taäê • Giaûi thích taïi íao åhi taêná tafn íoá òïná cæocå, áiaûm chï åyø ñait ítate cïûa boä nhzù, thehm cache cho CPU æaïi æaøm cho heä thoáná chaïy vzùi hieäï íïaát cao hzn. ? • Trrnh baøy chieán æö zïc chính æö ï trö õ thohná tin troná Cache? • Tính toác ñoä chïyeån áiao dö õ æieäï cïûa maùy tính coù CPU 486DX-66MÂz vaø maùy Pentiïm 100MÂz. • Phahn bieät RISC vaø CISC. • Trrnh baøy cz cheá ñö zøná oáná troná thö ïc thi cïûa CPU Chuong 2 : Tổ chức CPU 193 BÀI TẬP Bài 1 : Cho biết giá trị chuổi ‘XY’ được lưu trữ trong MT dướI dạng số hex và dạng số bin? Bài 2 : Cho biết giá trị ở hệ 10 của các số nguyên có dấu sau : a.10000000b b.01111111b Bài 3 : Cho đoạn code sau : MOV AH,7F INT 20H MOV AX,1234 Hãy cho biết giá trị của MOV BH,AL các thanh ghi AX,BX ? MOV BL,AH Chuong 2 : Tổ chức CPU 194 BÀI TẬP Bài 4: Cho đoạn code sau : MOV AL,81 ADD AL, 0FE INT 20H Giả sử các số đều là số có dấu. Giải thích kết quả chứa trong thanh ghi AL khi đoạn code trên được thực thi. Sử dụng giá trị ở hệ 10 để giải thích. Chuong 2 : Tổ chức CPU 195 65
  66. 10/01/2017 BÀI TẬP Bài 5: Giả sử thanh ghi trong MT của bạn dài 24 bits, cho biết giá trị của số dương lớn nhất mà thanh ghi này có thể chứa ở 2 hệ 2 và hệ 16? Bài 6 : Biến đổI địa chỉ sau thành địa chỉ tuyệt đối a. 0950:0100 b. 08F1:0200 Chuong 2 : Tổ chức CPU 196 Câu hỏi 66