OpenAI ได้ก้าวไปอีกขั้นในการบูรณาการ ปัญญาประดิษฐ์กับการใช้งานคอมพิวเตอร์ในชีวิตประจำวัน ด้วยการปรับปรุง Codex ซึ่งเป็นตัวช่วยเขียนโค้ดบนเดสก์ท็อปอย่างสมบูรณ์ เครื่องมือนี้ซึ่งก่อนหน้านี้เป็นที่รู้จักกันดีในด้านการช่วยเขียนโปรแกรม กำลังกลายเป็นผู้ช่วยที่สามารถจัดการแอปพลิเคชัน จดจำการตั้งค่า และจัดการโครงการได้อย่างราบรื่นยิ่งขึ้น
ด้วยการอัปเดตครั้งนี้ บริษัทที่นำโดยแซม อัลท์แมน ได้ก้าวเข้าใกล้แผนการสร้างมากขึ้น แอปพลิเคชันบนเดสก์ท็อปที่รวม ChatGPT, Codex และเบราว์เซอร์ Atlas ของคุณไว้ด้วยกันการเปลี่ยนแปลงครั้งนี้มีเป้าหมายเพื่อลดความซับซ้อนของประสบการณ์ผู้ใช้ รวบรวมทรัพยากรไว้ในพื้นที่ทำงานเดียว และแข่งขันกับคู่แข่งอย่าง Anthropic โดยเฉพาะอย่างยิ่งในด้านสภาพแวดล้อมการพัฒนาซอฟต์แวร์และระบบอัตโนมัติขั้นสูง
โคเด็กซ์เรียนรู้วิธีใช้คอมพิวเตอร์เหมือนผู้ใช้คนอื่นๆ
หนึ่งในความเปลี่ยนแปลงที่โดดเด่นที่สุดคือ ตอนนี้ Codex สามารถทำได้แล้ว ควบคุมคอมพิวเตอร์ในพื้นหลังเอージェนต์สามารถมองเห็นสิ่งที่อยู่บนหน้าจอ ขยับเคอร์เซอร์ คลิก พิมพ์ข้อความ และตอบสนองต่อสิ่งที่เกิดขึ้นในแอปพลิเคชันที่ติดตั้งไว้ โดยไม่รบกวนสิ่งที่ผู้ใช้กำลังทำอยู่ด้วยเมาส์หรือคีย์บอร์ด
ความสามารถนี้ช่วยให้เอเจนต์ Codex หลายตัวสามารถทำงานร่วมกันได้ ควบคู่กันไปในทีมเดียวกันสิ่งนี้เกี่ยวข้องกับการทำการทดสอบ การเปลี่ยนแปลงการตั้งค่า หรือการดำเนินการงานซ้ำๆ ในขณะที่บุคคลนั้นยังคงทำกิจกรรมตามปกติของตนต่อไป ซึ่งเปิดโอกาสให้สามารถทำการอัตโนมัติเวิร์กโฟลว์ที่ก่อนหน้านี้ต้องมีการดูแลอย่างต่อเนื่อง เช่น การทดสอบแอปพลิเคชันหลังจากการเปลี่ยนแปลงโค้ดทุกครั้ง หรือการทำซ้ำการกระทำของอินเทอร์เฟซ
OpenAI เสนอฟังก์ชันนี้เป็นวิธีการให้ผู้ช่วยสามารถทำงานร่วมกับ... เครื่องมือที่ไม่มี API หรือการผสานรวมโดยตรง ซึ่งเป็นเรื่องปกติในโปรแกรมบนเดสก์ท็อปหลายโปรแกรม Codex สามารถ "มองเห็น" หน้าจอและควบคุมเคอร์เซอร์ เพื่อโต้ตอบกับแอปพลิเคชันเหล่านี้ได้เหมือนกับผู้ใช้ที่เป็นมนุษย์ แม้ว่าในขณะนี้จะเป็นไปในลักษณะที่ควบคุมได้และให้ความสำคัญเป็นพิเศษกับความปลอดภัยก็ตาม
ตามข้อมูลของบริษัท การใช้งานคอมพิวเตอร์ในเบื้องต้นนั้นมีให้บริการใน macOS ผ่านแอปพลิเคชันเดสก์ท็อป Codexเชื่อมโยงกับบัญชี ChatGPT เวอร์ชัน Windows จะวางจำหน่ายในภายหลัง เมื่อได้ทดสอบประสิทธิภาพและปรับฟีเจอร์ให้เข้ากับสภาพแวดล้อมของ Microsoft แล้ว
ในกรณีของยุโรปและสหราชอาณาจักร OpenAI ได้ยืนยันแล้วว่า การควบคุมด้วยคอมพิวเตอร์ การปรับแต่งขั้นสูง คำแนะนำตามบริบท และหน่วยความจำ ฟีเจอร์เหล่านี้จะเปิดใช้งานในภายหลัง เหตุผลก็คือจำเป็นต้องปรับฟีเจอร์เหล่านี้ให้สอดคล้องกับกฎระเบียบด้านการคุ้มครองข้อมูล ซึ่งเป็นข้อกำหนดที่เข้มงวดเป็นพิเศษในสหภาพยุโรปและตลาดอังกฤษ

เบราว์เซอร์แบบผสานรวมและการทำงานโดยตรงบนหน้าเว็บ
การอัปเดตครั้งนี้ยังช่วยเสริมสร้างความสัมพันธ์ของ Codex กับเว็บไซต์ต่างๆ ให้แข็งแกร่งยิ่งขึ้นด้วย เบราว์เซอร์ที่รวมอยู่ในแอปพลิเคชันนั้นเองแทนที่จะรับเพียงคำแนะนำที่เป็นข้อความทั่วไป ตัวแทนสามารถรับคำสั่งโดยตรงบนองค์ประกอบเฉพาะของหน้าเว็บได้
ตัวอย่างเช่น ในการพัฒนาส่วนหน้า (frontend development) ผู้ใช้สามารถ เลือกส่วนประกอบเว็บหนึ่งรายการ แล้วอธิบายการเปลี่ยนแปลง เมื่อผู้ใช้ต้องการทำบางสิ่งบางอย่าง (เช่น เปลี่ยนสี ขนาดตัวอักษร หรือเค้าโครงของบล็อก) Codex จะเข้าใจคำสั่งนั้นภายในบริบทภาพเฉพาะนั้น ซึ่งจะช่วยหลีกเลี่ยงการเขียนข้อความอธิบายยาวๆ ว่าส่วนใดของเว็บไซต์ที่ต้องแก้ไข
เบราว์เซอร์แบบฝังตัวนี้ยังรองรับ Codex ด้วย วิเคราะห์เนื้อหา รวบรวมข้อมูล และนำมาใช้เป็นบริบท สำหรับงานอื่นๆ เช่น การจัดทำเอกสารโค้ด การตรวจสอบข้อกำหนดของผลิตภัณฑ์ หรือการเปรียบเทียบเอกสารทางเทคนิค ทุกอย่างจะดำเนินการภายในสภาพแวดล้อมเดียวกัน โดยไม่ต้องสลับไปมาระหว่างหน้าต่างระบบปฏิบัติการหลายหน้าต่าง
การสร้างและแก้ไขภาพด้วย gpt-image-1.5
อีกหนึ่งเสาหลักของ Codex เวอร์ชันใหม่คือการบูรณาการโมเดล gpt-image-1.5 สำหรับสร้างและแก้ไขรูปภาพ จากภายในแอปพลิเคชันบนเดสก์ท็อป ตัวแทนสามารถสร้างแผนภูมิ แผนภาพ ภาพจำลอง หรือภาพร่างจากข้อความ หรือโดยการผสมผสานคำแนะนำกับภาพหน้าจอและโค้ดตัวอย่างได้
ความสามารถนี้มุ่งเป้าไปที่ทีมงานที่ทำงานในโดยตรง การออกแบบผลิตภัณฑ์ อินเทอร์เฟซผู้ใช้ หรือต้นแบบวิดีโอเกมตัวอย่างเช่น นักพัฒนาสามารถจับภาพหน้าจอของอินเทอร์เฟซที่ยังทำไม่เสร็จครึ่งหนึ่ง แล้วขอให้ Codex แนะนำการออกแบบเมนูใหม่หรือโทนสีใหม่ จากนั้นก็จะได้ภาพที่สร้างขึ้นซึ่งเข้ากับบริบทนั้น โดยไม่ต้องเปลี่ยนเครื่องมือ
เมื่อทุกอย่างรวมศูนย์อยู่ที่ Codex ตัวแทนจึงสามารถ... เชื่อมโยงงานเขียนโค้ดและงานออกแบบเข้าด้วยกันเขียนตรรกะของฟังก์ชันการทำงาน อัปเดตส่วนหน้าเว็บที่เกี่ยวข้อง และสร้างภาพจำลองเพื่อนำเสนอต่อทีม โดยไม่ต้องออกจากขั้นตอนการทำงานหรือเปิดแอปพลิเคชันแก้ไขกราฟิกภายนอก
หน่วยความจำ บริบท และการทำงานอัตโนมัติในระยะยาว
นอกเหนือจากการควบคุมด้วยคอมพิวเตอร์และการสร้างภาพแล้ว การเดิมพันครั้งใหญ่ของ OpenAI ในเวอร์ชันนี้คือการติดตั้ง Codex ด้วย... หน่วยความจำถาวรและการจัดการบริบทที่กว้างขวางยิ่งขึ้นเครื่องมือนี้สามารถนำบทสนทนาก่อนหน้ากลับมาใช้ใหม่ เก็บรักษาข้อมูลสำคัญ และเรียกใช้ข้อมูลเหล่านั้นได้เมื่อจำเป็นเพื่อดำเนินการต่อในโครงการ
ฟีเจอร์หน่วยความจำ ซึ่งกำลังเปิดให้ทดลองใช้งานอยู่นั้น ช่วยให้ Codex สามารถใช้งานฟีเจอร์นี้ได้ จดจำความชอบส่วนบุคคล การแก้ไขบ่อยครั้ง หรือข้อมูลที่ยากต่อการรวบรวมซึ่งรวมถึงทุกอย่างตั้งแต่เทคโนโลยีที่ทีมใช้โดยทั่วไป ไปจนถึงวิธีการจัดระเบียบโฟลเดอร์ รูปแบบรายงานที่ใช้บ่อยที่สุด และแท็กที่ใช้กันทั่วไปบน GitHub สำหรับปัญหาประเภทต่างๆ
ด้วยบริบทที่สะสมมานั้น ตัวแทนจึงสามารถ เสนอภารกิจอย่างกระตือรือร้นฟังก์ชันนี้สามารถใช้เพื่อแนะนำให้ดำเนินการต่อในโครงการที่ยังไม่เสร็จสิ้น แนะนำการปรับปรุงโค้ดที่รอการดำเนินการ หรือแจ้งเตือนผู้ใช้เกี่ยวกับคำขอแก้ไขโค้ด (pull request) ที่ค้างอยู่นาน บริษัทบางแห่งกำลังใช้งานฟังก์ชันนี้เพื่อติดตามการสนทนาใน Slack, Gmail หรือ Notion และตอบสนองเมื่อเกิดเหตุการณ์บางอย่างขึ้น
Codex ยังสามารถ วางแผนงานสำหรับอนาคตและกลับมาทำงานอย่างอิสระอีกครั้ง เพื่อดำเนินการงานระยะยาวให้เสร็จสมบูรณ์ ตัวอย่างเช่น สามารถจัดการคิวการตรวจสอบโค้ดเป็นเวลาหลายวันหรือหลายสัปดาห์ จัดการกับความคิดเห็นและอัปเดตเอกสารโดยที่นักพัฒนาไม่ต้องคอยตรวจสอบอยู่ตลอดเวลา
มีส่วนเสริมมากกว่า 90 รายการ และการสนับสนุนนักพัฒนาที่ดีขึ้น
เพื่อให้การเปลี่ยนแปลงเสร็จสมบูรณ์ OpenAI ได้เพิ่มเกือบ ปลั๊กอิน Codex ใหม่ 90 รายการคุณสมบัติเหล่านี้รวมถึงการผสานรวมกับ Microsoft Suite, GitLab Issues, Neon โดย Databricks, Render และ Superpowers ตลอดจนการสนับสนุนเซิร์ฟเวอร์ MCP (Model Context Protocol) เป้าหมายคือเพื่อให้เอเจนต์มีแหล่งข้อมูลบริบทมากขึ้นและมีความสามารถในการปฏิบัติงานที่เหนือกว่า
ด้วยปลั๊กอินเหล่านี้ Codex จึงสามารถ รวบรวมข้อมูลจากบริการต่างๆ และดำเนินการตามข้อมูลเหล่านั้น จากพื้นที่ทำงานเดียว คุณสามารถตรวจสอบปัญหาใน GitLab สอบถามข้อมูลในสภาพแวดล้อม Databricks อัปเดตเอกสาร Office หรือโต้ตอบกับบริการการปรับใช้ได้ โดยไม่ต้องให้ผู้ใช้สลับไปมาระหว่างแพลตฟอร์มต่างๆ
ในแง่เทคนิคล้วนๆ การอัปเดตนี้ช่วยเสริมความแข็งแกร่งให้กับ ขั้นตอนการทำงานทั่วไปของนักพัฒนาตอนนี้ Codex ช่วยให้คุณตรวจสอบ pull request จัดการแท็บเทอร์มินัลหลายแท็บพร้อมกัน เชื่อมต่อกับสภาพแวดล้อมการพัฒนาจากระยะไกลผ่าน SSH และเปิดไฟล์พร้อมการแสดงตัวอย่างที่ครบถ้วน ไม่ว่าจะเป็นไฟล์ PDF สเปรดชีต งานนำเสนอ หรือเอกสารในรูปแบบอื่นๆ
ทั้งหมดนี้ถูกรวมไว้ในประสบการณ์ที่เป็นหนึ่งเดียว ซึ่งตามที่ OpenAI เองระบุไว้ จะช่วยให้การพัฒนาเป็นไปอย่างรวดเร็วยิ่งขึ้น ในทุกขั้นตอนของวงจรชีวิตซอฟต์แวร์ตั้งแต่การเขียนโค้ดเริ่มต้นไปจนถึงการทดสอบ การปรับใช้ การจัดทำเอกสาร และการบำรุงรักษา โดยมีเอเจนต์ AI ทำงานร่วมกันอย่างต่อเนื่องภายในสภาพแวดล้อมเดสก์ท็อปเดียวกัน
ความพร้อมใช้งาน การให้ความสำคัญกับนักพัฒนา และสถานการณ์ในยุโรป
Codex เวอร์ชันใหม่กำลังถูกนำไปใช้งานแล้วใน... แอปพลิเคชันเดสก์ท็อปสำหรับ macOS สำหรับผู้ที่เข้าสู่ระบบด้วยบัญชี ChatGPT ไม่ใช่ทุกฟีเจอร์ที่จะต้องใช้การสมัครสมาชิกประเภทเดียวกัน และฟีเจอร์ขั้นสูงบางอย่างอาจขึ้นอยู่กับแพ็กเกจที่ซื้อ เช่นเดียวกับเครื่องมืออื่นๆ ของ OpenAI
Thibault Sottiaux ผู้อำนวยการของ Codex อธิบายว่าการอัปเดตครั้งนี้ ออกแบบมาโดยเฉพาะสำหรับนักพัฒนาแม้ว่าในอนาคตจะตั้งใจขยายไปสู่กลุ่มเป้าหมายที่กว้างขึ้นก็ตาม แนวคิดก็คือ ทีมงานด้านเทคนิคจะเป็นกลุ่มแรกที่ได้ใช้ประโยชน์จากเอเจนต์ใหม่และเวิร์กโฟลว์อัตโนมัติ และเมื่อเวลาผ่านไป จะถ่ายทอดรูปแบบนั้นไปยังงานในสำนักงาน การจัดการเอกสาร หรือประสิทธิภาพการทำงานส่วนบุคคล
OpenAI เน้นย้ำว่าการใช้พลังการประมวลผลและหน่วยความจำนั้นดำเนินการด้วย แนวทางการรักษาความปลอดภัยและการปฏิบัติตามกฎระเบียบเรื่องนี้มีความสำคัญอย่างยิ่งในสหภาพยุโรปและสหราชอาณาจักร ด้วยเหตุนี้ ฟีเจอร์การปรับแต่งขั้นสูง คำแนะนำตามบริบท หน่วยความจำถาวร และการควบคุมระบบปฏิบัติการโดยตรง จึงอาจต้องใช้เวลานานกว่าจะพร้อมใช้งานในตลาดเหล่านี้
อย่างไรก็ตาม บริษัทฯ ยืนยันว่าการพัฒนาของ Codex ในครั้งนี้เปิดประตูสู่... แอปพลิเคชันเดสก์ท็อปขั้นสูงที่เน้นการทำงานอัตโนมัติอัจฉริยะโดยที่เอージェนต์ AI ไม่เพียงแต่ช่วยเขียนโค้ดเท่านั้น แต่ยังช่วยประสานงาน ปรับตัวให้เข้ากับสไตล์การทำงานของผู้ใช้ และทำให้โครงการที่ซับซ้อนดำเนินต่อไปได้เป็นระยะเวลานาน สำหรับนักพัฒนาซอฟต์แวร์ในยุโรป ข้อความนั้นชัดเจน: ความสามารถใหม่ ๆ กำลังจะมาถึง แต่ต้องมีการปรับเปลี่ยนที่จำเป็นเพื่อให้สอดคล้องกับกรอบกฎระเบียบที่มีอยู่