เมื่อเดือนกรกฎาคม 2558 ที่ผ่านมา มีข่าวใหญ่ในแวดวงไอทีไทยคือ ธนาคารกสิกรไทยแจ้งปิดระบบทั้งหมดนานถึง 2 วันเพื่อปรับปรุงระบบใหม่ทั้งหมด ซึ่งสุดท้ายการปรับปรุงระบบดำเนินไปอย่างราบรื่น และธนาคารสามารถกลับมาให้บริการได้ก่อนกำหนดด้วยซ้ำ
การปิดปรับปรุงระบบครั้งนี้ก็ถือเป็นกรณีศึกษาที่น่าสนใจ เพราะ เพราะธนาคารกสิกรไทยเป็นธนาคารใหญ่ ระบบงานมีความซับซ้อนสูง มีลูกค้ามาก การปิดระบบนานขนาดนี้ย่อมส่งผลต่อลูกค้ามาก เราจึงขอสัมภาษณ์ คุณสมคิด จิรานันตรัตน์ รองกรรมการผู้จัดการ ธนาคารกสิกรไทย ผู้บริหารสายงานระบบของธนาคาร ดูแลระบบโครงสร้างพื้นฐานของธนาคารทั้งหมด เพื่อขอรับทราบข้อมูลของโครงการนี้
ประกาศการปิดปรับปรุงระบบไอทีของธนาคารกสิกรไทย
ธนาคารกสิกรไทยมีเป้าหมายตั้งแต่ 10 ปีที่แล้วว่าต้องการปรับปรุงระบบไอทีขนานใหญ่ เพื่อให้ทันสมัย คล่องตัว สามารถบริการลูกค้าได้ดีกว่าเดิม ซึ่งครอบคลุมระบบไอทีทุกส่วน โครงการนี้มีชื่อเรียกภายในว่า Kasikornbank Transformation หรือ KT
ระบบไอทีที่สำคัญที่สุด คือ ระบบไอทีหลักของธนาคาร หรือที่เรียกกันว่า core banking ที่ทำงานพื้นฐานของธนาคารทั้งหมด ตั้งแต่ระบบบัญชีของลูกค้า ฝากเงิน ถอนเงิน โอนเงิน ฯลฯ ระบบเดิมใช้งานมานาน 30 ปีแล้ว ยังทำงานได้ดีแต่ขาดความยืดหยุ่น ยิ่งในยุคที่เทคโนโลยีด้านการธนาคารเปลี่ยนไป มีความต้องการใหม่ๆ มากขึ้น ระบบเดิมจึงมีข้อจำกัดมากขึ้นเรื่อยๆ จนได้เวลาต้องเปลี่ยนแปลง
การปิดระบบในเดือนกรกฎาคมจึงเป็นการเปลี่ยน core banking นั่นเอง เราถอดเปลี่ยนระบบ core banking เก่าออก ใส่ตัวใหม่เข้าไป และเชื่อมระบบ core banking ตัวใหม่เข้ากับระบบเดิมที่รันอยู่แล้ว ในสายตาของลูกค้าอาจไม่เห็นการเปลี่ยนแปลง แต่ในมุมของธนาคารนี่คือการอัพเกรดระบบพื้นฐานทั้งหมด อนาคตเราจะสามารถออกผลิตภัณฑ์ทางการเงินใหม่ๆ ได้เร็วกว่าเดิมมาก
สิ่งที่ลูกค้ามองเห็นอาจไม่เยอะ แต่ไม่ใช่ไม่มีเลย ตอนนี้ระบบใหม่เรามีสาขาได้ไม่จำกัด การเปิดบัญชีแล้วขอย้ายสาขา ระบบเดิมต้องมีเลขบัญชีใหม่ ระบบใหม่ใช้เลขบัญชีเดิมได้เลย อีกอย่างคือระบบเก่าจะมีหยุดตอนกลางคืนเป็นช่วงๆ ถ้าใครเคยใช้คงรู้ แต่ระบบใหม่ทำงานได้ 24x7 ไม่มีหยุดพัก ประสิทธิภาพของระบบใหม่ดีขึ้นกว่าเดิมมาก เพราะใช้ระบบฐานข้อมูลที่เน้น performance โดยเฉพาะ
ผมเป็น CIO (ประธานเจ้าหน้าที่ฝ่ายสารสนเทศ) มานาน 21 ปี เคยอยู่มาแล้วทั้งตลาดหลักทรัพย์ และธนาคารหลายแห่ง เคยทำโครงการยากๆ มาบ้าง ต้องบอกว่าไม่เคยทำอะไรยากเท่านี้ ระบบซับซ้อนมาก มีระบบย่อยๆ หลายร้อยระบบ มีคนมาเกี่ยวข้องเยอะมาก ช่วงปกติเรามีคนทำงานเป็นพันคน ช่วงย้ายระบบ (cut over) มีคนมาเกี่ยวข้องเป็นหมื่นๆ คน พนักงานทุกสาขาต้องมาเกี่ยวข้องด้วย เพราะต้องช่วยทดสอบระบบให้ผ่าน ผ่านแล้วไม่พอ ต้องใช้งานระบบใหม่ให้เป็นด้วย
โครงการนี้ใช้เงินมหาศาล ตลอดสิบปีที่ผ่านมาใช้เงินลงทุนประมาณ 3 หมื่นล้านบาท มีเวนเดอร์และพาร์ทเนอร์มาเกี่ยวข้องมากมาย ส่วนไหนที่คนของเราทำไม่ได้ เวนเดอร์ทำไม่ได้ เราต้องเชิญผู้เชี่ยวชาญจากทั่วโลกมาช่วยกันทำ ฝรั่งบางคนมาเจอกันในโครงการนี้จนแต่งงานกันก็มี ในบรรดาผู้เชี่ยวชาญจากต่างประเทศที่ดึงเข้ามาช่วย ทุกคนก็พูดเหมือนกันว่าซับซ้อนมาก
ต้องบอกว่าโครงการที่ซับซ้อนแบบนี้ เตรียมตัวเท่าไรก็ไม่สามารถเตรียมได้ 100% แน่นอนว่าเราต้องเตรียมตัวมาดี แต่หลายครั้งก็ต้องทำไปแก้กันไป ปรับเปลี่ยนกันไป
โครงการ KT มีอายุนานเกือบ 10 ปีแล้ว แต่มาทำเรื่อง core banking กันช่วงประมาณ 4-5 ปีหลังนี้เอง ระหว่างทางเจอปัญหามาเยอะ แต่สุดท้ายทางธนาคารก็มีการตัดสินใจครั้งสำคัญให้โครงการเดินหน้าต่อ ช่วง 2 ปีที่ผ่านมาเป็นช่วงที่เราเริ่มเห็นแสงสว่างว่าต้องทำอะไรถึงจะเวิร์ค และก็ทำกันมาเรื่อยๆ อย่างเต็มที่ จนถึงวันเปลี่ยนระบบเมื่อเดือนกรกฎาคม
จากประสบการณ์แล้ว การบริหารโครงการใหญ่ขนาดนี้ จะต้องประเมิน ระหว่างความยากของโครงการ (complexity) เปรียบเทียบกับขีดความสามารถของคนและการจัดการโครงการ (capability) ซึ่งในที่นี้หมายถึงผู้เกี่ยวข้องทั้งหมด ไม่ใช่เฉพาะพนักงานของธนาคาร
ถ้าหาก gap ตรงนี้กว้างเกินไป โอกาสที่จะดำเนินโครงการให้ประสบความสำเร็จเป็นเรื่องยากมาก ทางออกคือต้องลด complexity ลงมา ควบคู่ไปกับการเพิ่ม capability ของคนและการจัดการ เพื่อปิดช่องว่างนี้ให้ได้ นี้คือสิ่งที่เราทำมาตลอดในรอบ 5 ปีที่ผ่านมา
การเพิ่ม capability คือถ้าคนไม่พอต้องหาคนเพิ่ม ถ้าความสามารถไม่พอ ต้องหาผู้เชี่ยวชาญภายนอกเข้ามาช่วย
ส่วนการลด complexity ก็ทำได้หลายทาง ตั้งแต่แบ่งเฟสทำ ลดขนาดโครงการแต่ละส่วนให้เล็กลง ที่สำคัญคือต้องลดชิ้นส่วนที่เคลื่อนไหว (moving part) ไม่ให้มีจำนวนมากเกินไป ดังนั้นต้องมีส่วนใดส่วนหนึ่งเป็นแกนหลักก่อน ยืนยันว่าไม่เปลี่ยนแปลงสเปกแน่นอน ส่วนอื่นๆ ที่สำคัญรองลงไปอาจอนุโลมให้เปลี่ยนแปลงได้ หมุนรอบแกนได้ แต่ถ้าปล่อยให้ทุกส่วนในโครงการไม่อยู่นิ่ง ไม่มีแกน รับรองว่าหาทางจบไม่ได้
คุณสมคิด จิรานันตรัตน์ รองกรรมการผู้จัดการ ธนาคารกสิกรไทย
จริงๆ 2 วันที่เราเปลี่ยนระบบเป็นแค่ปลายทาง แต่ระยะเตรียมตัวก่อนหน้านั้นยากกว่ากันเยอะ เพราะเราต้องควบคุมการเปลี่ยนแปลงให้ได้ทุกจุด เมื่อถึงระยะเวลาหยุดสเปกให้นิ่ง (frozen zone) เราต้องขอร้องให้หน่วยงานภายในหยุดการเปลี่ยนแปลงทุกอย่าง เช่น ห้ามขยายสาขาเพิ่ม ห้ามออกผลิตภัณฑ์ใหม่ ทุกคนต้องหยุดเพื่อให้เวลาการเปลี่ยนระบบ ตรงนี้ไม่ง่ายเพราะธนาคารเป็นหน่วยงานใหญ่ มีคนมาเกี่ยวข้องเยอะ
นอกจากนั้นแล้วเรายังต้องทำสิ่งสำคัญ 2 ประการคือ ทดสอบ และ ซ้อม ซึ่งเป็นคนละเรื่องกัน
การทดสอบคือดูว่าระบบใหม่แข็งแรงแค่ไหน มีคุณภาพแค่ไหน รองรับโหลดปริมาณเยอะๆ ได้หรือไม่ ซึ่งเราต้องทดสอบกันหลายขั้นตอน ทดสอบต่อเชื่อมระบบภายในทีละชิ้น ทดสอบการทำงานเสมือนจริง ให้ผู้ใช้เข้ามาลองทำงานจริงๆ บนระบบใหม่แล้วดูว่าเป็นอย่างไร
พอทดสอบตัวระบบเสร็จ เราต้องซ้อมเอาระบบขึ้น production ซึ่งซับซ้อนมาก มีขั้นตอนที่ต้องทำ 4-5 พันขั้นตอนในช่วงเปลี่ยนระบบ 2 วัน และการซ้อมไม่ใช่ทำแค่ตัวระบบ แต่ต้องบริหารจัดการคนที่เข้ามาซ้อมด้วย เพราะทุกสาขาต้องสแตนด์บายรอเปลี่ยนระบบพร้อมกันหมด
การซ้อมขึ้นระบบช่วยให้กระบวนการทุกอย่างไหลไปได้ เพราะพนักงานทุกสาขาต้องมาฝึกอบรมระบบใหม่ ซ้อมทำให้เป็น เสร็จแล้วต้องสอบด้วยว่าทำได้จริงหรือเปล่า พอสอบได้แล้วต้องซ้อมอีก เพราะในโลกไอที ถึงแม้ตอนซ้อมจะทำได้ แต่ไม่มีใครรู้ว่าวันจริงจะเกิดอะไรขึ้น ทุกคนก็ลุ้นเต็มที่
เราซ้อมทั้งหมด 6 รอบ มีจับเวลาด้วยว่าทำได้เร็วแค่ไหน
การซ้อมรอบแรก ผลออกมาขลุกขลักเป็นปกติ กว่าระบบจะขึ้นได้คือ สี่โมงเย็นของวันอาทิตย์ (ปิดระบบวันศุกร์ เปิดระบบวันอาทิตย์) พอรอบที่สองเร็วขึ้นเป็นบ่ายสองโมง รอบที่สามเร็วขึ้นเป็นสิบเอ็ดโมงเช้า พอรอบที่สี่ เราตั้งเป้าว่าเจ็ดโมงเช้าต้องสำเร็จ เพื่อให้ธนาคารสาขาในห้างสามารถเปิดทำการตอนสิบเอ็ดโมงได้ ซึ่งเราก็ทำได้ รอบที่ห้าซ้อมซ้ำตามแผนเจ็ดโมงอีก
ที่เราต้องประกาศต่อสาธารณะว่าเราจะเปิดให้บริการตอนค่ำวันอาทิตย์ เป็นเพราะว่าต้องเผื่อกรณี worst case ถ้าไม่สำเร็จต้อง rollback กลับไปใช้ระบบเก่า ซึ่งประมาณแล้วจะเสร็จตอนค่ำวันอาทิตย์ แต่ในวันจริงสามารถดำเนินการได้ตามแผน พอถึงเจ็ดโมงเช้า ระบบเริ่มกลับมารันตามปกติแล้ว
การซ้อม 5 ครั้งแรกเป็นการซ้อมในสภาพแวดล้อมจำลอง (mock up) แต่รอบที่ 6 เราเรียกว่าเป็น dress rehearsal เป็นภาษาละครคือซ้อมแสดงกับชุดจริง ฉากจริง นั่นคือการซ้อมขึ้นระบบกับเครื่องจริง เอาระบบขึ้น production เพื่อให้มั่นใจว่าทุกระบบสามารถเชื่อมต่อกันได้ใน production environment จริง การตัดสินใจเลือกวันที่ Go Live ต้องแน่ใจล่วงหน้า 2-3 เดือน และให้คณะกรรมการเป็นผู้ตัดสินใจ
ถึงแม้ซ้อมดีแค่ไหน วันจริงก็ยังมีปัญหาเล็กๆ น้อยๆ อยู่ดี ปัญหาที่เราพบเป็นเรื่องพอร์ตของฮาร์ดแวร์ตัวหนึ่งทำงานผิดปกติ ไม่ได้เสียแต่ส่งข้อมูลช้าเกินกว่าที่ควร กว่าเราจะหาสาเหตุเจอและสั่ง disable พอร์ตนั้นก็เสียเวลาไปพอสมควร แต่สุดท้ายก็ผ่านมาได้
ในวันจริงพอทุกอย่างพร้อมแล้ว ได้เวลาตัดสินใจ Go Live เป็นการตัดสินใจร่วมกันทั้งทางฝั่ง Business และ IT แต่เมื่อทุกอย่างเตรียมมาพร้อมขนาดนี้ ผลงานออกมาตามแผน บอร์ดก็ให้ความไว้วางใจเรา
ยังมีอีกเยอะเลย เพราะที่ผ่านมา ระบบไอทีอื่นๆ ต้องหยุดรอ core banking ให้เสร็จก่อน
อันนี้เหมือนกับการปิดถนนทำรถไฟฟ้าแล้วจะบอกว่าการจราจรยังปกติ คงเป็นไปไม่ได้ ดังนั้นระบบอื่นต้องหยุดรอดู core banking ก่อน แต่ก็มีบางระบบที่สำคัญมากและสามารถทำขนานไปได้ คือระบบด้าน mobile และระบบที่เกี่ยวกับข้อมูล
พอตอนนี้ core banking เสร็จแล้ว ระบบอื่นก็เดินหน้าเต็มที่
ปัจจุบันพฤติกรรมของคนเปลี่ยนไป เทคโนโลยี mobile เข้ามาทำให้ความคาดหวังของคนเปลี่ยนไปจากเดิม ธนาคารต้องปรับตัวตามความคาดหวังของคนให้ทัน
การโอนเงิน เมื่อก่อนยุ่งยาก ต้องโอนเงินแล้วเอาใบสลิปมาส่งแฟ็กซ์ให้กัน พอมาเป็นยุคนี้ โอนเงินผ่านมือถือ มีไฟล์สลิปให้พร้อม ส่งผ่าน LINE แป๊บเดียวจบ ลูกค้าคาดหวังว่ากระบวนการทั้งหมดต้องเร็วกว่าเดิม ไม่ต้องทำงานหลายขั้นตอน ไม่ต้องไปสาขา มีความสะดวกกว่าเดิม
ตอนนี้ transaction ของ mobile banking เพิ่มสูงมาก ส่วนตัวมองว่าธนาคารยังปรับตัวได้ไม่ทันความคาดหวังของลูกค้าด้วยซ้ำ ตอนนี้แอพธนาคารยังทำได้แค่ความสามารถพื้นฐาน โอน เติม จ่าย ยังไม่สามารถเข้ามาอยู่ในชีวิตประจำวันของลูกค้าได้มากนัก เราอยากไปให้ไกลกว่านี้ ก็อยากทำให้ดีขึ้น มีหลายอย่างที่เราทดสอบกันอยู่ในแล็บ และหวังว่าจะนำมาใช้ได้ในเร็ววัน
ประเด็นด้าน security ต้องบอกว่า mobile banking ปลอดภัยกว่า online banking ด้วยซ้ำ เพราะเราล็อคกัน 3 ชั้น เป็น 3-factor authentication คือเช็ครหัสผ่านปกติ เช็คตัวเครื่องฮาร์ดแวร์ และเช็ค OTP และตรวจสอบเบอร์โทรศัพท์ผ่านเครือข่ายของ network operator ด้วย ซึ่งถ้าเป็น online หรือเชื่อมต่อผ่าน Wi-Fi จะถือว่าเป็น open network ไม่ปลอดภัยเท่ากับการต่อแบบ cellular
อย่างแรกเลยคือ คัดเลือกคนที่จะเข้ามาร่วมงาน ไม่ว่าจะเป็นเวนเดอร์หรือพาร์ทเนอร์ ขอให้เลือกคนที่มีประสบการณ์ เข้าใจสภาพแวดล้อมการทำงานของเรา คุยรู้เรื่อง มี commitment ยอมทุ่มเทเพื่อให้โครงการสำเร็จ การเลือกคนตรงนี้ไม่ง่าย แต่ถ้าเลือกได้ โอกาสสำเร็จจะมีสูงมาก
อย่างที่สองคือการจัดการ ทำอย่างไรเราจะได้รับการสนับสนุนจากทุกฝ่าย ตั้งแต่บอร์ดลงมาจนถึงคนทำงาน จัดการให้ทุกองคาพยพไปในทิศทางเดียวกัน ต้องวางแผนให้ทุกคนทำงานในจังหวะเวลา (timing) เดียวกัน นอกจากนี้ต้องสนใจเรื่องการวางตัวคน ต้องรู้ว่าช่วงไหนของโครงการต้องการคนแบบไหน ถ้าทำแล้วติดปัญหา จะต้องเอาใครเข้ามาช่วยแก้
อย่างที่สามคือการควบคุม moving part อย่างที่กล่าวไปแล้ว อย่าปล่อยให้มี moving part เยอะจนคุมไม่ได้ แน่นอนว่าเราไม่สามารถแก้ปัญหาได้ทุกจุด ถ้าเจอ defect ในระบบก็ต้องเลือกว่าอันไหนแก้ อันไหนปล่อย เพราะการแก้ defect จะมีผลกระทบ (side effect) เสมอ ทำไม่ดีแล้วจะไปกระทบส่วนอื่น กลายเป็นว่าไม่มีทางจบสักที
อย่างสุดท้ายคือโครงการที่ยาวนานแบบนี้มีความเครียดสะสม ช่วงที่ทำไปแล้วไม่เห็นแสงสว่างว่าจะทำได้สำเร็จหรือไม่ มีคนอยากออกจากโครงการเยอะ อารมณ์คือไม่ทำแล้ว ไม่เอาแล้ว แต่ในช่วงที่ทำไปแล้วเริ่มเห็นเป้าหมาย เหมือนเราเดินป่าแล้วหลงทาง รู้ว่าอีกสิบกิโลถึงถนนแน่นอน ต่อให้เดินไกลแค่ไหนก็ไม่บ่นแล้ว ทุกคนทุ่มเทแม้ว่าเนื้องานจะหนักที่สุด ดังนั้นต้องพยายามให้ทีมงานทุกคนเห็นอนาคตว่าจะไปทางไหน และให้ทุกคนรู้ว่าเป็นคนสำคัญที่จะช่วยให้โครงการประสบความสำเร็จ
โครงการนี้ใหญ่และซับซ้อนมาก แต่เราก็ทำได้สำเร็จ คนที่อยู่ในโครงการนี้ทุกคนคงมีความภาคภูมิใจ ผมก็ขอขอบคุณทุกคนที่ทุ่มเทกันแบบสุดหัวใจ เพราะถ้าเราไม่ร่วมมือกัน ในองค์กรยังมีการแบ่งฝักแบ่งฝ่าย คงไม่มีทางเสร็จตามเวลา ก็ขอขอบคุณในความเสียสละ ความมุ่งมั่น ความตั้งใจ ขอบคุณมากๆ ครับ