จากงาน IDF 2008 Taipei งานนี้มีการเปิดเผยรายละเอียดของ Nehalem หรือชื่ออย่างเป็นทางการว่า Core i7 ที่กำลังจะวางตลาด (ส่งมอบให้กับผู้ผลิต) ในเดือนหน้า ผมคิดว่ารายละเอียดค่อนข้างเคลียร์กว่าที่เราเคยเห็นมาจากที่อื่นๆ งานนี้เลยเอามาสรุปให้ดูกันอีกทีครับ
Nehalem เป็นชื่อของ Micro-Architecture ใหม่จากอินเทลที่ต่อมาจาก Core Micro-Architecture เดิม โดยการออกแบบในรอบนี้อินเทลเน้นความเป็นโมดูลของสถาปัตยกรรมไว้แต่แรก ทำให้สามารถปรับตัวซีพียูให้เหมาะกับแต่ละงานได้ตามความเหมาะสมในอนาคต
ความเปลี่ยนแปลงที่ชัดเจนที่สุดคงเป็นเรื่อง
ของการรวมชุดควมคุมหน่วยความจำเข้าไว้ในซีพียู (Integrated Memory Controller - IMC) เพื่อลดระยะเวลาในการเข้าถึงหน่วยความจำ ส่วนนี้เป็นส่วนที่อินเทลเสียเปรียบเอเอ็มดีสมัย Opteron รุ่งเรื่องค่อนข้างชัด โดยเฉพาะในงานที่ต้องการใช้หน่วยความจำมากๆ เช่นการทำฐานข้อมูลในหน่วยความจำ ความเร็วในส่วนนี้จะมีผลมากขึ้นอย่างชัดเจน
QuickPath Interconnection (QPI) เป็นส่วนที่อินเทลนมาใช้โต้กับ HyperTransport ของทางเอเอ็มดี โดยตัว QPI นั้นจะเป็นการต่อแบบจุดต่อจุดแทนที่จะเป็นบัสเช่น HyperTransport ข้อดีคือความเร็วในการอ้างถึงหน่วยความจำจากซีพียูอื่นๆ
QPI เป็นสิ่งส่วนที่มาเติมเต็มให้กับ IMC ได้เป็นอย่างดีเพราะปัญหาของการใช้ต่อหน่วยความจำไว้กับซีพียูคือเมื่อมีการอ้างถึงหน่วยความจำในซีพียูอื่นๆ แล้วความเร็วจะตกลงอย่างชัดเจน แต่ QPI จะเข้ามาแก้ปัญหาด้วยการสร้างช่องทางความเร็วสูงที่ให้แต่ละซีพียูข้ามไปใช้หน่วยความจำของซีพียูตัวอื่นๆ ได้โดยความเร็วไม่ตกลงมากนัก งานนี้อินเทลโชว์ว่าความเร็วแทบจะเท่ากับ latency ของ Xeon ตัวปัจจุบัน ส่วนการอ้างหน่วยความจำในที่ติดกับซีพียูนั้นจะเร็วขึ้นร้อยละ 40
ข้อสงสัยข้อหนึ่งของ QPI คือแม้ความเร็วจะไม่ค่อยลดลงเมื่อมีการเพิ่มจำนวนซ็อกเก็ตในเครื่อง แต่นั่นก็หมายความว่าแต่ละซีพียูต้องมีโมดูล QPI เพิ่มขึ้นไปเรื่อยๆ ในส่วนนี้ผมยังสงสัยว่าถ้าซีพียู 8 ซ็อกเก็ตนี่ก็ค้องมี QPI อยู่ 8 ชุด มันจะสมเหตุสมผลแค่ไหนในการผลิต?
HyperThread เป็นสิ่งที่อินเทลเคยพลาดไปครั้งหนึ่งเมื่อสามปีที่แล้ว เพราะการจัดการแคชที่ไม่ฉลาดพอ ทำให้เมื่อเปิด HyperThread แล้วเครื่องกลับช้าลงในบางกรณี (เจอบ่อยในซอฟต์แวร์ฐานข้อมูล) แต่งานนี้อินเทลก็โชว์ HyperThread อีกครั้ง ว่าเพิ่มประสิทธิภาพได้ร้อยละ 10-30 แน่นอนว่ารอบนี้การจัดการแคชจะฉลาดกว่าเดิม
ชุดคำสั่งที่เพิ่มขึ้นมาใน Nehalem คือ SSE4.2 มีสองส่วนที่เพิ่มเข้ามาคือ SSTNI ที่เร่งความเร็วในการจัดการกับตัวอักษร จุดมุ่งหมายหลักของชุดคำสั่งนี้คือการเร่งความเร็วในการประมวลผล XML นั่นเอง
อีกส่วนหนึ่งคือ ATA ที่ใช้เร่งความเร็วในงานเฉพาะอย่าง เช่น CRC32 ที่ใช้เร่งความเร็วสำหรับพวก Network Storage ที่ต้องทำ Check-sum ทั้งหลาย อีกส่วนคือ POPCNT ที่เช่นทำ Pattern Recognition
Macro Fusion เป็นส่วนที่ผมไม่แน่ใจว่ามีในซีพียูรุ่นก่อนๆ รีเปล่า แต่โดยปรกติแล้วด้วยสถาปัตยกรรมแบบ CISC ทำให้ซีพียูต้องแตกคำสั่งที่ซับซ้อนมากๆ ออกเป็นคำสั่งง่ายๆ หลายคำสั่งเพื่อเพิ่มความเร็ว แต่ในบางกรณีที่ตัวซอฟต์แวร์มีการใช้คำสั่งง่ายๆ จำนวนมากๆ Macro Fusion จะรวบคำสั่งเหล่านั้นเข้าเป็นคำสั่งเดียวกันเพื่อเพิ่มความเร็วได้อีกทาง
Virtualization มีมาตั้งแต่ Core 2 Duo ใน Nahelem ก็ออกแบบใหม่ให้สลับ Virtual Machine ได้เร็วขึ้นร้อยละ 40 ส่วนนี้ได้มาจากสองส่วนคือการสร้าง Virtual CPU ID ทำให้แต่ VM มองเห็นซีพียูเป็นคนละตัวกัน และย้ายงานการจัดการหน่วยความจำเสมือนไปอยู่ในซีพียูแทนที่จะเป็นตัวซอฟต์แวร์เหมือนแต่ก่อน
Turbo Boost แบ่งออกเป็นสองส่วนคือเมื่อซีพียูทำงานแค่บางคอร์ เราสามารถปิดคอร์ที่ไม่ทำงานแล้วไปเร่งความเร็วให้กับคอร์ที่เหลือได้ อีกส่วนหนึ่งคือเมื่อซีพียูเย็นพอ หามีการใช้งานหนักๆ ตัวซีพียูจะ Overdrive ตัวเองให้เร็วขึ้นทุกคอร์ได้เป็นเวลาสั้นๆ แล้วลดความเร็วลง กรณีแบบนี้ทำให้คอมพิวเตอร์สามารถตอบสนองได้ดีขึ้น เช่นการเรนเดอร์เว็บที่ทำแค่แป๊บเดียว แต่เราอยากให้เร็วเท่าที่จะเป็นไปได้เป็นต้น
ของแถมสุดท้ายคือผู้ผลิตเมนบอร์ดรอวางตลาดกันเป็นแผงแล้วครับ ผมเห็นยี่ห้อ Tyan (สปอนเซอร์งานนี้) ยี่ห้อเดียวประมาณครึ่งโหล ส่วนยี่ห้ออื่นๆ ก็มีกันครบ ขาดแต่ของอินเทลเอง???
จบรายงานเรื่องแรกครับ วันนี้จริงๆ ยังมีอีกสองสามประเด็น แล้วผมจะทยอยเขียนเข้ามาเรื่อยๆ