Large Language Model

Tags:
Node Thumbnail

OpenAI มีฟังก์ชัน Voice Mode ใน ChatGPT ให้ใช้งานตั้งแต่กันยายนปีที่แล้ว ซึ่ง ChatGPT สามารถโต้ตอบเป็นเสียงพูดได้ โดยระบุว่าเสียงที่ออกมานั้นใช้นักพากย์มืออาชีพ

อย่างไรก็ตามในตัวเลือก 5 เสียงที่มีให้ใช้งานได้แก่ Breeze, Cove, Ember, Juniper และ Sky ตัวเลือกเสียงอันหลังสุด Sky กลายเป็นประเด็นเมื่อมีคนตั้งข้อสงสัยว่าน้ำเสียงนั้นคล้ายกับนักแสดง Scarlett Johansson (Natasha Romanoff ใน Black Widow)

OpenAI ยืนยันว่าเสียงของ Sky เป็นของนักพากย์มืออาชีพหญิงคนหนึ่ง ที่พูดแบบธรรมชาติ และไม่ใช่ Scarlett Johansson แต่จะไม่เปิดเผยตัวตนเพื่อความเป็นส่วนตัว โดย OpenAI จะเริ่มปิดการใช้งานเสียง Sky ชั่วคราวเพื่อตรวจสอบเรื่องนี้เพิ่มเติม

Tags:
Node Thumbnail

ในงาน Google I/O 2024 ของใหม่อย่างหนึ่งที่เรียกเสียงฮือฮาในงานคือการโชว์โมเดล Gemini Nano รันในมือถือแอนดรอยด์โดยตรง ทำงานออฟไลน์ แล้วสามารถตรวจสอบการสนทนาที่เป็น scam หลอกหลวงได้ เป็นการโชว์ประโยชน์ของการรันโมเดลในมือถือให้เห็นชัดๆ ว่าทำอะไรได้บ้าง

หลังจากนั้นกูเกิลยังได้ออกวิดีโอเซสชัน Android on-device AI under the hood มาอธิบายรายละเอียดของการรันโมเดลในมือถือแอนดรอยด์เพิ่มเติม มีรายละเอียดดังนี้

Tags:
Node Thumbnail

OpenAI ประกาศเพิ่มปรับปรุงเครื่องมือวิเคราะห์ข้อมูลใน ChatGPT โดยรองรับการเพิ่มไฟล์โดยตรงจาก Google Drive และ Microsoft OneDrive แล้ว (ได้ทั้งคู่นะ ไม่เหมือนแอปเดสก์ท็อป)

ฟังก์ชันเพิ่มไฟล์โดยตรงจาก Google Drive หรือ Microsoft OneDrive รองรับไฟล์ในหลายฟอร์แมตทั้งเอกสาร, สเปรดซีต หรือสไลด์นำเสนอข้อมูล สามารถขยายพื้นที่ของไฟล์ในหน้า ChatGPT เพื่อดูข้อมูลประกอบได้ รองรับข้อมูลที่ถูกปรับปรุงเรียลไทม์ในระหว่างการสนทนาวิเคราะห์ข้อมูล

Tags:
Node Thumbnail

กูเกิลเปิดโครงการทดลอง Built-in AI เตรียมนำ Gemini Nano มารันใน Chrome โดยตรง เปิดทางให้เบราว์เซอร์มี API ในกลุ่ม LLM เพิ่มเติม

ฟีเจอร์ที่เว็บไซต์จะสามารถใช้งาน LLM บนเว็บได้ เช่น การช่วยสรุป หรือถามตอบคำถามในเนื้อหาบนเว็บเอง ไปจนถึงการเป็นตัวช่วยผู้ใช้เขียนเนื้อหา หรือตรวจคำผิด

ทุกวันนี้เว็บไซต์หลายแห่งรันโมเดลปัญญาประดิษฐ์บนเว็บอยู่แล้ว แต่การใช้งานแบบทุกวันนี้ทำให้ผู้ใช้ต้องดาวน์โหลดไฟล์ขนาดนับร้อยเมกะไบต์ทุกเว็บ และอาจใช้งานฟีเจอร์ต่างๆ ของเครื่องเช่น GPU หรือ NPU ได้จำกัด การที่เบราว์เซอร์มี API โดยตรงให้เลยจะทำให้ออปติไมซ์ได้ดีขึ้น

Tags:
Node Thumbnail

กูเกิลโชว์ Gemini Nano โมเดลปัญญาประดิษฐ์สำหรับโทรศัพท์รุ่นใหม่รองรับอินพุตหลายรูปแบบทั้งภาพ, เสียง, และข้อความ พร้อมกับความสามารถของแอป Gemini ที่ผูกเข้ากับระบบของแอนดรอยด์เต็มตัว

Gemini Nano อ่านภาพได้ ทำให้สามารถบรรยายภาพได้โดยไม่ต้องมีข้อมูลล่วงหน้า กูเกิลใส่ความสามารถนี้ในฟีเจอร์ TalkBack ที่ช่วยผู้มองเห็นได้จำกัด ทำให้สามารถบรรยายภาพได้อย่างละเอียด นอกจากนี้ยังสามารถฟังเสียงได้ ทำให้สามารถฟังเสียงการสนทนาตลอดเวลาและแจ้งเตือนทันทีเมื่อพบว่าบทสนนนาน่าจะเป็นการหลอกลวง ฟีเจอร์นี้จะเป็นแบบ opt-in ต้องเปิดใช้งานเอง และจะเปิดให้ใช้ภายในปีนี้ (ไม่ระบุประเทศที่รองรับ)

Tags:
Node Thumbnail

กูเกิลอัพเดต Gemini Advanced เวอร์ชั่นผู้ใช้ทั่วไป เป็น Gemini 1.5 Pro ทำให้รองรับ context window ขนาด 1 ล้านโทเค็นแบบเดียวกับการใช้งานแบบเดียวกับการใช้งานผ่าน API รองรับการอัพโหลดข้อมูลขนาดใหญ่เข้าไปยังแชตได้โดยตรง โดยมีฟีเจอร์ใหม่หลักๆ ได้แก่

Tags:
Node Thumbnail

กูเกิลอัพเดตโมเดล Gemini 1.5 Pro โดยขยาย context window เป็น 2 ล้านโทเค็น ทำให้สามารถรองรับข้อมูลขนาดใหญ่มาก และเชื่อฟังคำสั่งมากขึ้น โดยเฉพาะคำสั่งฟอร์แมต์เอาท์พุต หรือพฤติกรรมของ AI และการวางแผนการทำงานได้ดีขึ้นทำให้สามารถเรียกฟังก์ชั่นภายนอกได้มากขึ้น

นอกจากนี้กูเกิลยังเปิดตัว Gemini 1.5 Flash ที่ราคาประหยัดลงแต่ประสิทธิภาพยังใกล้เคียง Gemini 1.5 Pro โดยอาศัยเทคนิค distillation ที่ดึงความสามารถจากโมเดลขนาดใหญ่ และรองรับ context window ขนาด 1 ล้านโทเค็นเท่ากับรุ่นใหญ่ ราคาค่าใช้งาน 0.35 ดอลลาร์ต่อล้านโทเค็น

Gemini 1.5 Pro และ 1.5 Flash เปิดให้ใช้งานได้ทั้งทาง Google AI Studio และ Vertex AI ส่วนเวอร์ชั่น 2 ล้านโทเค็นยังทดสอบวงปิดต้องขอใช้งาน

Tags:
Node Thumbnail

เมื่อคืนที่ผ่านมา OpenAI เปิดตัว GPT-4o พร้อมกับประกาศเปลี่ยน tokenizer ใหม่โดยอาศัย 20 ภาษาต้นแบบในการบีบอัดข้อมูล ทำให้ภาษาต่างๆ ประหยัดโทเค็นยิ่งขึ้น แม้ภาษาไทยจะไม่อยู่ในรายชื่อ 20 ภาษา แต่ผลการทดลองก็พบว่าภาษาไทยนั้นประหยัดโทเค็นลงเท่าตัว

tokenizer ของ GPT-4o สามารถจับคำหรือส่วนของคำในภาษาไทยได้ชัดเจน คำสามัญเช่น "ของ" หรือ "จำนวน" ก็สามารถมองเป็นโทเค็นเดียวได้ทันที เทียบกับ tokenizer ของ GPT-4 ที่ไม่สามารถรวบตัวอักษรหลายตัวในภาษาไทยเข้าด้วยกันได้เลย ทำให้จำนวนโทเค็นกับจำนวนตัวอักษรใกล้เคียงกัน

Tags:
Node Thumbnail

ในงานแถลงข่าวเปิดตัว GPT-4o เมื่อคืนนี้ OpenAI ยังประกาศว่าฟีเจอร์หลายอย่างที่เคยจำกัดให้เฉพาะลูกค้าเสียเงินเท่านั้น ตอนนี้ขยายมารองรับผู้ใช้งานแบบฟรีทุกคนด้วย มีรายละเอียดดังนี้

  • ใช้งานแชทบอตคัสคอม GPTs และใน GPT Store (แต่สร้างไม่ได้)
  • ใช้งาน GPT-4 ที่ระดับ Intelligence
  • วิเคราะห์ข้อมูลและตาราง
Tags:
Node Thumbnail

update: เวอร์ชั่นแรกขอข่าวนี้พาดหัวว่ายังไม่รองรับภาษาไทย แต่เมื่อทดสอบแล้วจำนวนโทเค็นในภาษาไทยลดลงกว่าเท่าตัว

ในงานเปิดตัว GPT-4o ของ OpenAI นอกจากประเด็นโมเดลมีประสิทธิภาพสูงขึ้นแล้ว ยังมีประเด็นการออปติไมซ์ tokenizer เพื่อให้ใช้งานภาษาอื่นๆ นอกจากภาษาอังกฤษได้ดีขึ้น โดยทีมงาน OpenAI เลือกมา 20 ภาษารวมถึงภาษาอังกฤษแต่ยังไม่มีภาษาไทย ทำให้ภาษาเหล่านี้ใช้งานได้มีประสิทธิภาพมากขึ้นเพราะคำในภาษาเหล่านี้มีจำนวนโทเค็นน้อยลง

Tags:
Node Thumbnail

OpenAI เปิดตัว GPT-4 รุ่นใหม่ในชื่อ GPT-4o (โฟร์-โอ) ความสามารถใกล้เคียง GPT-4 แต่ความเร็วสูงกว่า ขณะที่ยังมีความสามารถรองรับอินพุตหลายแบบ (multimodal) สามารถฟังเสียงและอ่านภาพได้โดยไม่ต้องการโมเดลปัญญาประดิษฐ์ speech-to-text แยก

เนื่องจากประสิทธิภาพ GPT-4o สูงกว่าทำให้ OpenAI สามารถเปิดให้ผู้ใช้ทุกคนใช้งานได้ฟรีโดยมีโควต้ามากขึ้น สำหรับการใช้งานฝั่ง API ราคาของ GPT-4o จะถูกกว่า GPT-4 Turbo ลงครึ่งหนึ่ง ความเร็วโดยรวมเพิ่มขึ้นเท่าตัว และโควต้าการใช้งานเพิ่มขึ้นถึง 5 เท่า

Tags:
Node Thumbnail

Wikimedia Foundation ผู้ให้บริการ Wikipedia ทดสอบปลั๊กอินเบราว์เซอร์ Citation Needed เป็นการตรวจสอบข้อมูลในเว็บด้วยการค้นหาข้อมูลในวิกิมาอ้างอิง โดยใช้ ChatGPT มาอ่านข้อความและหน้าเว็บอ้างอิงว่าเนื้อหาสนับสนุนกันหรือไม่

ปลั๊กอินเบราว์เซอร์ตัวนี้รับอินพุตโดยให้ผู้ใช้เลือกข้อความในเว็บใดๆ จากนั้นจะอาศัย ChatGPT ในการสร้างคำค้นหา และค้นหาหน้าวิกิด้วย API ของ Wikipedia เอง สุดท้ายจะใช้ ChatGPT ในการแยกประโยคที่เกี่ยวข้องและสรุปออกมาว่าเป็นเนื้อหาที่ผู้ใช้เลือกมานั้นสอดคล้องกับข้อความในหน้าวิกิหรือไม่

Tags:
Node Thumbnail

01.AI บริษัทปัญญาประดิษฐ์ที่ก่อตั้งโดย Kai-Fu Lee เปิดตัวโมเดล Yi เวอร์ชั่น 1.5 โดยชูประเด็นว่าโมเดลขนาด 9B นั้นสามารถทำคะแนนทดสอบชนะโมเดลโอเพนซอร์สขนาดใกล้เคียงกันได้ทั้งหมด (แม้่ว่านับจริงๆ Yi 9B จะใหญ่กว่าคนอื่นพอสมควรก็ตาม)

ทีมงาน 01.AI ระบุว่า Yi ฝึกด้วยชุดข้อมูลคุณภาพสูงขนาดใหญ่มากถึงห้าแสนล้านโทเค็น แล้วฝึกต่อด้วยตัวอย่างอีกสามล้านชุด

Kai-Fu Lee ให้สัมภาษณ์กับ The Japan Times ว่าที่ผ่านมาตลาดแชตบอตในจีนยังไม่ดีพอใช้งาน ต่างจาก ChatGPT ที่เปิดตัวมาก็มีประโยชน์ใช้งานได้เลย และทาง 01.AI ก็เปิดตัว Wanzhi ผู้ช่วยปัญญาประดิษฐ์ที่ช่วยผู้ใช้ได้แบบเดียวกับ Microsoft Copilot แล้ว

Tags:
Node Thumbnail

Mayo Clinic รายงานถึงการพัฒนา RadOnc-GPT ผู้ช่วยวิเคราะห์โรคมะเร็งที่อาศัยข้อมูลการรักษามะเร็งในโรงพยาบาล Mayo Clinic เอง นำมา finetune โมเดล Llama 2 ของ Meta กระบวนการฝึกและการใช้งานทั้งหมดอยู่ในเน็ตเวิร์คของโรงพยาบาลเอง

Tags:
Node Thumbnail

IBM ปล่อยโมเดลปัญญาประดิษฐ์ Granite ที่ฝึกจากฐานข้อมูลโค้ด 116 ภาษา โดยโมเดลมี 4 ขนาดได้แก่ 3B, 8B, 20B, และ 34B แยกรุ่นพื้นฐานและรุ่นรับคำสั่ง (instruct) โดยเฉพาะรุ่น 8B นั้นความสามารถในการเขียนโปรแกรมเหนือกว่าโมเดลขนาดเดียวกันค่อนข้างมาก

กระบวนการฝึกโมเดลเวอร์ชั่น 34B นั้นพิเศษกว่าเวอร์ชั่นอื่นๆ เพราะอาศัยการ upscaling โดยนำโมเดล 20B ที่มี 52 ชั้นสองเวอร์ชั่น มาถอดฝั่ง output 8 ชั้น และ input ของอีกโมเดลหนึ่ง 8 ชั้น แล้วนำมาต่อกันเป็น 34B ข้อมูลที่ใช้ฝึกนั้นมีตั้งแต่ GitHub Code Clean, StarCoderData, และโค้ดอื่นๆ รวมถึง

Tags:
Node Thumbnail

Alibaba Cloud ประกาศว่า Tongyi Qianwen หรือ Qwen โมเดลปัญญาประดิษฐ์ภาษาขนาดใหญ่หรือ LLM มีหน่วยงานนำไปติดตั้งใช้งานแล้วมากกว่า 90,000 แห่ง สะท้อนความต้องการใช้งานที่เพิ่มต่อเนื่องจาก ทั้งจากกลุ่มอุตสาหกรรมอิเล็กทรอนิกส์, ยานยนต์ จนถึงเกม

โดย Alibaba Cloud ได้อัปเดตโมเดล Qwen นี้ในเวอร์ชันล่าสุด Qwen2.5 โดยมีจุดเด่นคือการให้เหตุผล ประเมินโค้ด และทำความเข้าใจภาษาได้ดีกว่าเวอร์ชันก่อนหน้า Qwen2.0

Tags:
Node Thumbnail

Meta ประกาศเพิ่มเครื่องมือช่วยสร้างโฆษณาพลัง AI สำหรับผู้ลงโฆษณา จากเดิมความสามารถหลักคือการสร้างฉากพื้นหลังให้กับสินค้า คราวนี้เครื่องมือ AI ทำได้มากกว่านั้นแล้ว

ของใหม่ที่ประกาศได้แก่

Tags:
Node Thumbnail

The Information รายงานข่าวลือว่า ไมโครซอฟท์กำลังเทรนโมเดลภาษาขนาดใหญ่ของตัวเองชื่อ MAI-1 มีขนาด 5 แสนล้านพารามิเตอร์ และมีศักยภาพทำงานได้ระดับเดียวกับโมเดลของ OpenAI, Google หรือ Anthropic ในปัจจุบัน โครงการนี้มีหัวหน้าโครงการคือ Mustafa Suleyman ผู้ร่วมก่อตั้ง DeepMind ที่เพิ่งย้ายจากบริษัท Inflection AI มาเป็นซีอีโอ Microsoft AI

ข่าวของ MAI-1 มีความสำคัญตรงที่เป็นครั้งแรกที่ไมโครซอฟท์ทำโมเดล LLM เอง หลังจากต้องพึ่งพาโมเดล GPT ของ OpenAI มาตลอดในช่วงประมาณ 2 ปีที่ผ่านมา และปัญหาดราม่าภายใน OpenAI น่าจะเป็นสิ่งเตือนใจไมโครซอฟท์ว่าไม่ควรพึ่งพาบริษัทภายนอกมากจนเกินไป

Tags:
Node Thumbnail

AppleInsider รายงานฟีเจอร์เกี่ยวกับ AI ที่จะมีในระบบปฏิบัติการ iOS 18 และ macOS 15 ที่แอปเปิลเตรียมเปิดตัวในงาน WWDC เดือนมิถุนายน โดยอ้างข้อมูลจากแหล่งข่าวที่เกี่ยวข้อง ซึ่งตอนนี้ซอฟต์แวร์อยู่ในขั้นตอนการทดสอบภายใน

โดยส่วนที่มีข้อมูลตอนนี้คือเบราว์เซอร์ Safari 18 ซึ่งจะมีฟีเจอร์ AI ดังต่อไปนี้

Tags:
Node Thumbnail

X เปิดตัวบริการใหม่ Stories ฟีเจอร์สรุปเรื่องราวของเทรนด์บน X ที่เกิดขึ้น ตามความสนใจของผู้ใช้งานแต่ละคน (Personalize) โดยอยู่ในส่วน Explore ของแอป ซึ่ง AI ที่ช่วยสรุปเนื้อหาให้ก็คือ Grok โมเดล AI จากบริษัท xAI ของ Elon Musk เจ้าของ X นั่นเอง

บริการ Stories สรุปเนื้อหานี้ จะเปิดให้ใช้งานเฉพาะลูกค้าเสียเงินเป็นสมาชิก X Premium เฉพาะบนเว็บและ iOS ก่อน โดยสรุปแต่ละเทรนด์ของ For You มาให้ ไม่ต้องไปไถไล่หาเอง อย่างไรก็ตาม Grok จะมีข้อความปิดท้ายส่วนสรุปเนื้อหาเพื่อป้องกันเหตุการณ์ไม่คาดคิดว่า เนื้อหานี้สรุปจากใน X ที่อาจมีการเปลี่ยนแปลงได้เมื่อเวลาผ่านไป และ Grok อาจสรุปผิดก็ได้ (ดูตัวอย่างจากรูปท้ายข่าว)

Tags:
Node Thumbnail

Anthropic บริษัทด้านปัญญาประดิษฐ์ผู้พัฒนา Claude เปิดตัวแอปบนระบบปฏิบัติ iOS สำหรับคนใช้ iPhone และ iPad นอกจากนี้ยังเปิดตัวแพ็คเกจจ่ายเงินสำหรับลูกค้าองค์กรด้วย

โดยแพ็คเกจสำหรับลูกค้าองค์กรมีชื่อว่า Team plan เพื่อเพิ่มการปกป้องข้อมูลและความปลอดภัยสำหรับองค์กรที่ต้องการใช้งาน Claude โดยปริมาณการใช้งานต่อบัญชีจะรองรับมากขึ้น, ได้ใช้โมเดลในกลุ่ม Claude 3 ได้แก่ Opus, Sonnet และ Haiku, รองรับการอ่านเอกสารขนาดยาว, ระบบแอดมินควบคุมค่าใช้จ่าย และฟีเจอร์อื่นที่เหมือนผู้ใช้งานแบบ Pro

แพ็คเกจ Team ราคา 30 ดอลลาร์ต่อบัญชีต่อเดือน ขั้นต่ำผู้ใช้งาน 5 คน

Tags:
Node Thumbnail

เว็บจัดอันดับแชตบอต LMSYS มีปัญญาประดิษฐ์ตัวใหม่เพิ่มเข้ามาคือ gpt2-chatbot โดยไม่มีคำอธิบายว่ามันคือโมเดลอะไร แต่เมื่อทดลองอักขระพิเศษก็พบว่ามันมีพฤติกรรมคล้าย GPT-4 อย่างมากเพราะมีปัญหากับอักระพิเศษเหมือนกัน

ผู้ใช้ที่ได้ลองใช้งานแล้วมีความเห็นต่างๆ กันไป บ้างก็ว่าไม่ต่างกันแชตบอตอื่นๆ แต่บางคนก็ระบุว่าดีกว่า GPT-4 ชัดเจน

การใช้งานสามารถเลือกได้ในเว็บ LMSYS ทั้งแบบ Direct และ Arena (side-by-side) แต่มีโควต้าการใช้งานชั่วโมงละ 1,000 แชตทำให้มักไม่ค่อยพอในช่วงนี้

OpenAI ไม่ได้เปิดตัวโมเดลใหม่มาระยะหนึ่งแล้ว โดยโมเดลสุดท้ายคือ GPT-4 Turbo ที่เปิดตัวมาแล้วครึ่งปี

Tags:
Node Thumbnail

OpenAI ประกาศว่าฟังก์ชัน Memory ใน ChatGPT ตอนนี้สามารถใช้งานได้แล้วสำหรับลูกค้าเสียเงิน ChatGPT Plus ทุกคน ยกเว้นในประเทศกลุ่มสหภาพยุโรป (EU) และเกาหลี ส่วนลูกค้าแบบ Team, Enterprise และ GPTs จะได้ใช้ Memory ในอนาคตเช่นกัน

Memory เป็นฟังก์ชันที่ OpenAI แบบจำกัดกลุ่มผู้ใช้งานก่อนหน้านี้ เป็นการสร้างข้อมูลพื้นฐานของผู้ใช้งานให้ ChatGPT จดจำไว้เลย ไม่ต้องอธิบายหรือทวนข้อมูลเหล่านี้ซ้ำในการสนทนาทุกครั้ง ซึ่ง ChatGPT จะเรียนรู้ทั้งจากการป้อนข้อมูลให้จดจำตรง ๆ หรือเรียนรู้ในระหว่างการสนทนา

Memory สามารถตรวจสอบและลบความจำบางหัวข้อ หรือตั้งค่าไม่ให้จดจำเลยก็ได้ โดยไปที่ Settings > Personalization > Memory

Tags:
Node Thumbnail

แอปเปิลเผยแพร่ OpenELM (Open-source Efficient Language Models) ชุดโมเดล AI ภาษาขนาดใหญ่ (LLM) แบบโอเพนซอร์ส ที่สามารถทำงานได้บนอุปกรณ์ ไม่ต้องเชื่อมต่อกับคลาวด์เซิร์ฟเวอร์ โดยสามารถดูรายละเอียดเพิ่มเติมได้ที่ Hugging Face

OpenELM มีทั้งหมด 8 โมเดล เป็น 4 โมเดลที่ยังไม่ถูกเทรน และอีก 4 โมเดลที่ผ่านการเทรนปรับแต่งมาแล้ว ขนาดพารามิเตอร์มีตั้งแต่ 270M ถึง 3B

Tags:
Node Thumbnail

Axon ผู้ผลิตอุปกรณ์สำหรับตำรวจ เช่น ปืนช็อตไฟฟ้า, กล้องติดตัวเจ้าหน้าที่, หรือระบบจัดเก็บหลักฐานคดี ออกซอฟต์แวร์ใหม่ Draft One ที่ใช้ generative AI ช่วยตำรวจเขียนเอกสารแจ้งความโดยอัตโนมัติ

Draft One ดึงเสียงจากกล้องติดตัวตำรวจ Axon Body มาแปลงเสียงเป็นข้อความ จากนั้นแปลงคำถามตอบของตำรวจกับผู้เสียหายกลายเป็นเอกสารแจ้งความ

ทาง Axon ระบุว่ามีแนวทางป้องกันความเสี่ยงที่เจ้าหน้าที่จะอาศัย AI มากเกินไป ได้แก่

Pages