รู้จักซีพียู 18 คอร์ของ Blue Gene/Q ว่าที่ซูเปอร์คอมพิวเตอร์ที่แรงที่สุดในโลก

by mk
25 August 2011 - 06:26

Blue Gene เป็นชื่อโครงการพัฒนาซูเปอร์คอมพิวเตอร์ของ IBM ซึ่งที่ผ่านมาก็มี "สถาปัตยกรรม" ซูเปอร์คอมออกมาแล้วหลายรุ่น เช่น รุ่นแรก Blue Gene/L ที่เคยโค่น Earth Simulator เป็นคอมพิวเตอร์ที่เร็วที่สุดในโลก, รุ่นสอง Blue Gene/P ที่ใช้กับซูเปอร์คอมที่เร็วที่สุดในยุโรป

ตอนนี้ IBM กำลังพัฒนาสถาปัตยกรรมรุ่นที่สาม Blue Gene/Q ซึ่งจะใช้ในซูเปอร์คอมพิวเตอร์ชื่อ Sequoia ที่มีพลังประมวลผลสูงถึง 20 PetaFLOPS (แชมป์ปัจจุบัน K Computer ของฟูจิตสึ อยู่ที่ 8.1 PetaFLOPS)

ในงานสัมมนาวิชาการด้านหน่วยประมวลผล Hot Chips เมื่อกลางเดือนสิงหาคมที่ผ่านมา วิศวกรของ IBM ได้เผยรายละเอียดซีพียูของ Blue Gene/Q ที่ออกแบบมาเป็นพิเศษ (โดยอิงอยู่บนสถาปัตยกรรม Power ของ IBM) ที่น่าสนใจคือมันมีจำนวนคอร์แปลกๆ ที่ 18 คอร์

คอร์

ซีพียูของ Blue Gene/Q จะประกอบด้วย "คอร์" ย่อยๆ ตามแนวทางการออกแบบซีพียูสมัยใหม่ โดย "คอร์" ที่ว่าจะใช้สถาปัตยกรรม Power A2 ที่ IBM สร้างขึ้นมาสำหรับอุปกรณ์เครือข่าย

คอร์ Power A2 ใช้ชุดคำสั่งแบบ 64 บิต หนึ่งคอร์มี 4 เธร็ด และแคช L1 จำนวน 32KB (แบ่งครึ่งสำหรับ data/instruction) ทำงานที่ 1.6GHz

ประเด็นที่น่าสนใจอีกอันคือ IBM เลือกจะลดความเร็วสัญญาณนาฬิกา และพลังไฟฟ้าลงที่ 0.8V เพื่อประหยัดพลังงาน ข้อเสียคือประสิทธิภาพต่อคอร์ลดลง ข้อดีคือการจ่ายไฟสม่ำเสมอกว่าเดิม และการซิงก์การทำงานของคอร์ทั้งหมดของระบบ (จำนวน 1.57 ล้านคอร์) ง่ายขึ้น ประหยัดไฟมากขึ้น

รายละเอียดเพิ่มเติมอ่านกันตามลิงก์นะครับ คงลงลึกแค่นี้

ซีพียู

ส่วนตัวซีพียูจะนำคอร์ Power A2 จำนวน 18 คอร์มารวมกัน โดยแบ่งงานกันดังนี้

  • 16 คอร์สำหรับงานประมวลผลทั่วไป
  • 1 คอร์สำหรับรันเซอร์วิสของลินุกซ์โดยเฉพาะ (ใช้ Red Hat Enterprise Linux) เพื่อไม่ให้งานของเซอร์วิสไปกระทบกับภาระงานในการประมวลผลหลัก ถือเป็นการออกแบบพิเศษตามลักษณะการใช้งานของ Blue Gene/Q
  • 1 คอร์สุดท้ายมีทิ้งไว้เฉยๆ เพื่อแก้ปัญหาเรื่องอัตราความสำเร็จในการผลิต (yield rate) อธิบายง่ายๆ ว่าผลิตชิป 17 คอร์ให้ใช้ได้ 100% มันยาก ผลิตชิป 18 คอร์ที่เสียตัวนึงแล้วเหลือให้ใช้ 17 คอร์นั้นง่ายกว่ามาก

นอกจากคอร์ทั้ง 18 แล้ว ในซีพียูยังมีส่วนประกอบอื่นๆ เช่น แคช L2, memory controller โดยทุกอย่างเชื่อมกันผ่าน crossbar (xbar switch) ดูรูปประกอบกันได้ตามลิงก์

การประกอบซีพียู

อันนี้เป็นอีกประเด็นที่น่าสนใจ หลังจากได้ซีพียูมา 1 ตัวแล้ว มันจะถูกรวมกับแรม DDR3 16GB เป็น "compute card" หนึ่งแผ่น จากนั้นจะเอา compute card จำนวน 32 ชุดรวมเป็น "node card" หนึ่งอัน (ขนาดเทียบได้กับเซิร์ฟเวอร์ 1U อันนี้ผมกะขนาดด้วยสายตาคร่าวๆ)

หนึ่งตู้แร็คจะใช้ node card รวม 32 ชุด และส่วนของ I/O อีกต่างหาก จากนั้นจึงจะนำแร็คไปรวมกันเป็นซูเปอร์คอมพิวเตอร์ต่อไป (ภาพประกอบตามลิงก์)

ซูเปอร์คอมพิวเตอร์

ตอนนี้มีลูกค้าของ IBM เตรียมจะใช้ Blue Gene/Q สองราย ได้แก่

  • ห้องปฏิบัติการวิจัย Lawrence Livermore ระบบชื่อ Sequoia พลังประมวลผล 20 PetaFLOPS กำหนดเสร็จปี 2012
  • ห้องปฏิบัติการวิจัย Argonne ระบบชื่อ Mira พลังประมวลผล 10 PetaFLOPS กำหนดเสร็จปี 2012 เช่นกัน

ที่มา - The Register

Blognone Jobs Premium