Ngày đăng: 12/08/2020 14:54
NVIDIA đã thêm một biến thể thứ ba vào dòng GPU Ampere A100 đang phát triển của mình , A100 PCIe chuẩn chân cắm PCIe 4.0 và có kích thước chiều dài đầy đủ tiêu chuẩn so với bo mạch lửng mà chúng ta đã thấy trước đó.
Với sự ra mắt của kiến trúc Ampere và GPU Tensor Core A100 mới, chỉ sau một thời gian ngắn NVIDIA cũng đã công bố phiên bản PCIe của GPU này. Phiên bản A100 này giao tiếp qua cổng PCIe mang lại tính tương thích cao cho nhiều hệ thống giúp đáp ứng những khách hàng chỉ cần cắm vào máy chủ thiết kế tiêu chuẩn, không như chuẩn giao tiếp SXM4 nguyên bản của GPU này.
Là dòng sản phẩm cơ bản không thể thiếu, song song với dạng SXM của NVIDIA, GPU A100 PCIe của NVIDIA được tạo ra để hoàn chỉnh danh mục dòng sản phẩm GPU Tensor Core mới của NVIDIA. Trong khi NVIDIA sẵn sàng cung cấp các GPU dựa trên SXM – bao gồm cả các nền tảng NVIDIA HGX – vẫn có rất nhiều khách hàng cần sử dụng GPU trong các máy chủ rackmount dựa trên giao tiếp PCIe tiêu chuẩn. Hoặc đối với các workload nhỏ hơn, khách hàng không cần đến các carrier board HGX có đến 4 socket cho các GPU A100 dạng SXM4. Vì vậy, với card PCIe, NVIDIA có thể phục vụ phần còn lại của thị trường GPU mà các sản phẩm SXM4 của họ không thể tiếp cận.
Card GPU A100 PCIe chính là một kiến trúc A100 hoàn chỉnh, các thông số kỹ thuật giống hệt A100 SMX4 chỉ khác là nằm trong một form-factor khác và với TDP giảm từ 400W xuống 250W. Mặc dù điện năng giảm xuống đáng kể ( 38%), tuy nhiên hiệu năng mà form PCIe này mang lại sẽ bằng khoảng 90% so với phiên bản gốc, sử dụng được cho nhiều hệ thống và vấn đề về tản nhiệt sẽ nhẹ nhàng hơn. Bây giờ chúng ta có thể đoán rằng thẻ sẽ có xung nhịp thấp hơn để bù cho đầu vào TDP ít hơn nhưng NVIDIA đã cung cấp các con số tính toán cao nhất và những con số này vẫn không bị ảnh hưởng đối với biến thể PCIe. Hiệu suất FP64 vẫn được đánh giá là 9,7 / 19,5 TFLOPs, hiệu suất FP32 được đánh giá ở mức 19,5 / 156/312 TFLOP (Sparsity), hiệu suất FP16 được đánh giá là 312/624 TFLOP (Sparsity) & INT8 được đánh giá ở 624/1248 TOP (Sparsity).
Thông số kỹ thuật Tesla A100 dựa trên GPU NVIDIA Ampere GA100:
Khác với sự thay đổi ở form-factor và TDP, chỉ có khác biệt đáng chú ý khác cho A100 PCIe so với phiên bản SXM là số GPU có khả năng kết nối NVLink được hỗ trợ. Đối với card PCIe của họ, NVIDIA một lần nữa sử dụng các cầu nối NVLink để kết nối qua phía trên của các card A100, cho phép hai (và chỉ hai) card được liên kết với nhau. Với công nghệ NVLink thế hệ thứ 3, 12 liên kết NV Link được sử dụng đầy đủ cung cấp băng thông lên tới 600GB/s .
Supermicro sẽ cung cấp hệ thống GPU 4U A +, hỗ trợ tối đa tám GPU NVIDIA A100 PCIe và thêm tối đa hai khe cắm mở rộng PCI-E 4.0 hiệu suất cao cùng với các máy chủ GPU 1U, 2U và 4U khác.
Để tổng kết lại, trong khi NVIDIA không công bố thông tin cụ thể về giá cả hoặc thời điểm bán ra, card A100 PCIe mới sẽ sớm được cung cấp ra thị trường. Khả năng tương thích rộng hơn của card PCIe đã giúp NVIDIA tương thích đến hơn 50 hệ thống máy chủ tại thời điểm này, với 30 trong số các máy chủ đó sẽ được bán ra vào mùa hè này.