Tesla เผยรายละเอียด Dojo ซูเปอร์คอมพิวเตอร์ที่ออกแบบเอง ใช้เทรนโมเดลให้ Autopilot

by mk
4 October 2022 - 06:19

Tesla อัพเดตความคืบหน้าของ Dojo ซูเปอร์คอมพิวเตอร์ที่บริษัทออกแบบเองเพื่อเทรน AI ที่ใช้ในระบบขับขี่อัตโนมัติ และเปิดตัวต่อสาธารณะครั้งแรกช่วงกลางปี 2021

Tesla บอกว่าเมื่อขนาดของโมเดลใหญ่ขึ้นเรื่อยๆ จนไม่มีเครื่องขนาดใหญ่มากพอที่จะรัน ทางออกเดียวคือการสร้างเครื่องคอมพิวเตอร์ที่ใหญ่มากพอขึ้นมาเอง

ซูเปอร์คอมพิวเตอร์ Dojo ถูกออกแบบมาใหม่ทั้งหมด ภายใต้วิสัยทัศน์ว่าต้องเป็นตัวเร่งการประมวลผล (accelerator) ผืนใหญ่ผืนเดียว (single scalable compute plane) ใช้ชิปออกแบบเองที่เรียกว่า D1 นำมาต่อกับ I/O + Power + Cooling กลายเป็น Training Tile ซึ่งบอกว่ามีพลังเท่ากับจีพียู 6 ชุดเลยทีเดียว

เมื่อได้ Training Tile แล้วก็นำมาประกอบกันเป็น System Tray (ถาดวางหน่วยประมวลผลระบบ) ไปเชื่อมกับ Interface Processor สำหรับการเชื่อมต่อพอร์ตภายนอก กลายเป็นหน่วยที่เรียกว่า Host Interface

สุดท้ายเมื่อนำมาต่อเป็นตู้ cabinet หลายๆ ตู้จะได้หน่วยประมวลผลที่เรียกว่า ExaPod มีสมรรถนะ 1.1 ExaFLOP

การออกแบบ Dojo เน้นการอัดหน่วยประมวลผลที่มีความหนาแน่น (density) สูง จึงต้องคิดเรื่องระบบจ่ายไฟ และระบบระบายความร้อนใหม่ทั้งหมด ระบบจ่ายไฟนั้นใช้ไฟฟ้าถึง 2 เมกะวัตต์ และตอนทดสอบจ่ายไฟครั้งแรกนั้น เทศบาลเมืองถึงกับต้องโทรมาหาเลยทีเดียว

Tesla บอกว่าจะเริ่มทดสอบ ExaPod ตัวแรกในไตรมาส 1/2023 และวางแผนจะมีทั้งหมด 7 ExaPod

ที่มา - Electrek

Blognone Jobs Premium