Meta เปิดตัว MTIA ชิป AI ตัวแรกที่บริษัทออกแบบเอง, สถาปัตยกรรม RISC-V คัสตอม

by mk
19 May 2023 - 03:22

Meta เปิดตัวชิปเร่งการประมวลผล AI รุ่นแรกของบริษัท ใช้ชื่อว่า MTIA v1 ย่อมาจาก Meta Training and Inference Accelerator

Meta ให้เหตุผลว่างานประมวลผล AI ของบริษัทในปัจจุบัน โดยเฉพาะงานกลุ่ม recommendation ในบริการโซเชียลต่างๆ ไม่ได้เหมาะกับ GPU มากนัก จึงออกแบบชิป ASIC ขึ้นมาใหม่ให้สอดคล้องกับโมเดล recommendation ของบริษัทเอง และเน้นการปรับแต่งมาเพื่อ PyTorch ซึ่งเป็นไลบรารีประมวลผล AI ที่เกิดจาก Meta ด้วย

MTIA เป็นชิป ASICS แบบคัสตอมที่ Meta ออกแบบเองมาตั้งแต่ปี 2020 (แต่เพิ่งเปิดตัวต่อสาธารณะวันนี้) ใช้กระบวนการผลิต 7nm TSMC, สัญญาณนาฬิกา 800MHz, สมรรถนะ 102.4 TOPS (INT8) หรือ 51.2 TFLOPS (FP16) มีอัตราการใช้พลังงาน TDP 25W

ชิป MTIA ประกอบด้วยหน่วยย่อยเรียกว่า processing element (PE) จำนวนรวม 64 ตัว วางแบบตาราง 8x8 เชื่อมกันแบบ mesh network ยืดหยุ่นต่อการจัดกลุ่ม PE ต่องานแต่ละขนาด, PE แต่ละตัวมี 2 คอร์ เป็นชิปสถาปัตยกรรม RISC-V แบบคัสตอม โดย 1 คอร์จะมีส่วนขยายประมวลผลแบบเวกเตอร์ด้วย, PE แต่ละตัวมี SRAM ขนาดเล็ก 128KB สำหรับเก็บข้อมูลเรียกใช้งานรวดเร็ว

ในชิปยังมีแรม SRAM ขนาด 128MB แชร์กันระหว่าง PE ทุกตัว, แรมนอกชิปเป็น LPDDR5 ขนาดรวม 128GB

ชิป MTIA แต่ละตัวจะถูกนำมาติดตั้งบนบอร์ด M.2 เพื่อเสียบเข้ากับเซิร์ฟเวอร์ที่มีซีพียูหลักผ่าน PCIe Gen4 โดยตัวบอร์ด MTIA ใช้พลังงานเพียง 35W, เซิร์ฟเวอร์หนึ่งตัวมีชิป MTIA รวม 12 ตัว โดยเชื่อมต่อ MTIA ของแต่ละเครื่องโดยตรงได้ผ่านสวิตช์ PCIe เพื่อไม่ให้ทราฟฟิกต้องวิ่งผ่านซีพียูเสมอไป

ซอฟต์แวร์ของ MTIA ปรับแต่งมาเพื่อ PyTorch โดยเฉพาะ ทีมพัฒนาซอฟต์แวร์ได้สร้างตัวรันไทม์ของ PyTorch ที่รันบน MTIA เพื่อปรับแต่งประสิทธิภาพให้เหมาะสม และตอนนี้กำลังพัฒนาซอฟต์แวร์ของ MTIA ให้ทำงานร่วมกับ PyTorch 2.0 ที่เป็นการปรับปรุงครั้งใหญ่ด้วย

ผลการทดสอบชิป MTIA เทียบกับหน่วยประมวลผลแบบอื่นคือ NNPI accelerator และ GPU พบว่า MTIA มีประสิทธิภาพต่อพลังงาน (efficiency) ดีกว่าชิปทั้งสองแบบในโมเดลขนาดเล็กและขนาดกลาง แต่ถ้าเป็นโมเดลขนาดใหญ่ยังแพ้ GPU แบบดั้งเดิมอยู่ ซึ่งทีม MTIA บอกว่ารับทราบเรื่องนี้และจะหาวิธีปรับปรุงต่อไป

ที่มา - Meta AI Blog

Blognone Jobs Premium