NVIDIA เผยรายละเอียดสถาปัตยกรรม Pascal มาพร้อมหน่วยความจำ HBM2, บัส NVLink

by mk
7 April 2016 - 12:26

NVIDIA เปิดตัวการ์ด Tesla P100 ตัวแรกที่ใช้สถาปัตยกรรมใหม่ "Pascal" ถึงแม้ว่า Tesla P100 ไม่ได้ออกแบบมาสำหรับเกมเมอร์ทั่วไป แต่บริษัทก็เริ่มออกมาให้ข้อมูลของสถาปัตยกรรม Pascal แล้ว

ตัวจีพียูของการ์ด Tesla P100 ใช้รหัสว่า GP100 เป็นการพัฒนาต่อจาก GM200 รุ่นก่อนที่ใช้สถาปัตยกรรม Maxwell

จุดเด่นของ GP100 คือเพิ่มจำนวน Streaming Multiprocessor (SM) เข้ามาเป็น 56 ตัว (รุ่นก่อน 24 ตัว) แต่ว่า SM แต่ละตัวมีจำนวนคอร์ CUDA ลดลงเหลือ 64 คอร์ (แยกเป็น 32+32 คอร์) แต่รวมจำนวนคอร์ทั้งหมด 3,584 คอร์ มากกว่ารุ่นก่อนที่มี 3,072 คอร์

ในแง่การประมวลผล GP100 ยังมีสัดส่วนหน่วยประมวลผลแบบ double precision มากขึ้นจากเดิม ดังนั้นประสิทธิภาพของการประมวลผลแบบ high-precision จึงเพิ่มขึ้นด้วย

ของใหม่อย่างที่สอง คือ เปลี่ยนชนิดของหน่วยความจำเป็น High Bandwidth Memory 2 (HBM2) แรมแบบใหม่ที่จัดเรียงเพิ่มแถวในแนวตั้ง มีแบนด์วิดท์มากขึ้นกว่าแรม GDDR5 ของเดิม นอกจากนี้ยังมีฟีเจอร์ตรวจสอบความผิดพลาดหรือ error correcting code (ECC) ในตัวด้วย

ฟีเจอร์อย่างที่สาม NVLink High Speed Interconnect บัสส่งข้อมูลความเร็วสูงตัวใหม่ ใช้ได้ทั้งการส่งข้อมูลระหว่างซีพียูกับจีพียูและจีพียูด้วยกันเอง (ตามภาพ) บัสตัวนี้มีแบนด์วิดท์สูงกว่า PCIe เดิมด้วย

สถาปัตยกรรมของหน่วยความจำ Unified Memory หรือการมองผืนหน่วยความจำเดียวกัน ใช้ได้ทั้งจากซีพียูและจีพียู โดยซอฟต์แวร์ CUDA จะบริหารหน่วยความจำให้อัตโนมัติ เดิมทีสถาปัตยกรรม Kepler/Maxwell จำกัดไม่ให้ซีพียูและจีพียูอ่านค่าหน่วยความจำตำแหน่งเดียวกันได้ และจำกัดขนาดของผืนหน่วยความจำ เท่ากับหน่วยความจำของจีพียูเท่านั้น

แต่พอมาถึงยุค Pascal ที่พยายามให้ซีพียูและจีพียูใกล้ชิดกันมากขึ้น (โดยเฉพาะในการใช้งานในซูเปอร์คอมพิวเตอร์) จึงขยายข้อจำกัดให้หน่วยความจำ Unified Memory ได้เท่ากับหน่วยความจำทั้งหมดของระบบ (ซีพียู+จีพียู) มีตำแหน่งที่เป็นไปได้ทั้งหมด 49 บิท มากกว่าหน่วยความจำในปัจจุบันที่มี 48 บิท ส่งผลให้สามารถมองหน่วยความจำของซีพียูกับจีพียูเป็นผืนเดียวกันได้

รายละเอียดของสถาปัตยกรรมฮาร์ดแวร์ Pascal ยังมีอีกมาก อ่านได้ตามลิงก์ที่มาครับ

ที่มา - NVIDIA Blog

Blognone Jobs Premium