ประเภทของ AI Agent และ 3 Steps เริ่มโครงการ Agentic AI

Think Plan Remember and Take Action คือ คำที่ Google นำเสนอใน Gemini 2.0 โมเดล Ai ที่พัฒนาความสามารถรองรับการเข้าสู่ยุค Agentic ERA ซึ่งสอดคล้องกับ 4 องค์ประกอบหลัก ของ Agentic AI Function ความสามารถในการจดจำ การวางแพลนการทำงาน กับเครื่องมือที่ถูกจัดเตรียมไว้ให้ แล้วทำงานให้ถึงเป้าหมาย Goal อ่านรายละเอียด องค์ประกอบความสามารถในการทำงานของ Agentic AI ในบทความก่อนหน้า

เวลาที่มีการพูดถึง Agentic AI ถ้าเข้าใจนิยามของมันจริง ๆ เราจะไม่เทียบ Agenctic AI กับ Generative AI เท่าไหร่ เพราะ Purpose ของ AI สองตัวค่อนข้างแตกต่างกัน Generative AI การใช้งานหลักที่ถูกออกแบบมา Key Capability ด้าน Focus on content creation แต่ AgenticAI Key Capability เพื่อมาลงมือกระทำ Action ในโลกของความเป็นจริง เป็นการบวรการ อัตโนมัติ ซึ่งที่อ่านวิจัย และเชิงลึกด้านการพัฒนา มักจะเปรียบเทียบ AgenticAI กับ Traditional AI เนื่องจาก AI ที่เป็นการทำงานแบบอัตโนมัติ Automate และเน้นไปที่ การทำ Tasks สุดท้ายทั้งคู่ไป กระทำบางอย่างในโลกแห่งความเป็นจริง และให้ผลลัพธ์งานนั้นออกมา

The Evolution to Agentic AI

Traditional AI เช่นระบบ AI Automation, RPA (Robotic process automation) ถูกสร้างขึ้นบนการระบุ Task งานที่ชัดเจนและเขียนเงื่อนไขในการกำหนดการทำงานอย่างชัดเจนโดยอาศัยกฎหรือเงื่อนไขที่กำหนดไว้ล่วงหน้า (rule-based) ไม่มีความสามารถในการจำหรือทำความเข้าใจบริบทที่กว้างขึ้น

อย่างที่พูดไปตอนต้นของ Think Plan Remember and Take Action AgenticAI มีความสามารถที่มากว่า Traditional AI ที่สามารถคิด จำ แล้วพัฒนาตัวเองในการทำงานต่อไปได้ เพราะได้ ช้โมเดลภาษา (Language Models), ระบบจัดการบทสนทนา (Dialogue Management) และฐานข้อมูลความรู้ (Knowledge Bases) เพื่อความเข้าใจบริบทเพิ่มเข้ามา Contextual Understanding

แต่ขั้นสุดของ AgenticAI ที่เปลี่ยนโลกการทำงานกับมนุษย์ ยกระดับประสิทธิภาพของการทำงานอย่างมากคือ การเข้าใจ บริบท Contextual Understanding แบบ Realtime พร้อมเข้าใจข้อมูลความรู้ขนาดใหญ่ LLMs จนคิดได้ “คิดและตัดสินใจเอง” แบบ Realtime ได้ เหมาะสำหรับการใช้งานที่ซับซ้อนและสนับสนุนธุรกิจในหลายมิติ

ตัวอย่าง Agentic AI Google Deepmind Project Mariner

Video ตัวอย่าง AgenticAI ที่ เข้าใจ บริบท Contextual Understanding แบบ Realtime ช่วยในการงานใน Task ที่ซับซ้อนได้

ในตัวอย่าง Video Google Deepmind Project Mariner ก็จะเห็นความสามารถของ AgenticAI ที่สามารถทำผลลัพธ์ตามสั่งได้อย่างดี ซึ่งถ้าเราแตกองค์ประกอบของความสามารถของ Agent ภาพด้านบนทำให้เห็น 3 ส่วน ของงานที่ Agent ทำคือ Planning, Tools, Memory ผมขอไม่ลงรายละเอียดด้านเทคนิคในหัวข้อย่อย ๆ นะครับเพราะจะยาวไป คือ Agent วางแผนก่อนว่าจะทำงานอย่างไรให้ไปถึง Goal จากเครื่องมือที่มี และมีส่วนของความจำที่ทำให้การทำงานในแต่ละขั้นตอนสามารถใช้ประโยชน์จากข้อมูลที่ได้ในแต่ละเครื่องมือ แต่ละขั้นการทำงานจนเสร็จเป้าหมายลุล่วง ซึ่ง 3 ส่วนนี้ ประกอบมาเป็นส่วนที่ 4 ที่ผมพูดตอนแรก คือ Action ไปทำจริงจนเสร็จ

Types of AI Agent

ในภาพด้านบน เราจะเห็น Agent ตัวเดียวจากภาพ แต่ในความเป็นจริง Agent ที่ผู้ใช้งานเจอ ก็จะมี agent ย่อย ๆ ทำหน้าที่ความสามาถที่แตกต่างกันไป ตามที่ศึกษามาจะแบ่งออกเป็น 5 กลุ่ม ๆ หลัก ในการแบ่ง Group Types ดังนี้

Simple Reflex Agents (เอเจนต์แบบสะท้อนง่าย) เอเจนต์ประเภทนี้จะเพิกเฉยต่อประวัติของสิ่งที่รับรู้ (percept history) และจะตัดสินใจเฉพาะบนพื้นฐานของ “สถานะของสิ่งแวดล้อม” ในขณะนั้นเท่านั้น โดยไม่คำนึงถึงผลระยะยาวหรือการวางแผนใดๆ

ดังนั้น เอเจนต์ลักษณะนี้จะมี “ความฉลาด” ในระดับค่อนข้างจำกัด และไม่สามารถปรับตัวต่อการเปลี่ยนแปลงในสิ่งแวดล้อมได้ดีนัก จริง ๆ แล้ว Agent มีความฉลาดได้มากนะครับ แต่ที่เราต้องมี Agent ที่ทำหน้าที่ในการรักษากฏและพยายามไม่เปลี่ยนแปลงมากนัก คือต้อง ควบคุม “กฎเงื่อนไข–การกระทำ” (condition–action rules) เช่น “ถ้าเห็นไฟแดง ก็หยุด” โดยไม่ได้เก็บข้อมูลความเปลี่ยนแปลงก่อนหน้าไว้ คือบางครั้ง Agent เข้าใจ Context มากอาจจะทำให้เปลี่ยนแปลงเงื่อนไข และส่งผลต่อการเปลี่ยนแปลง การกระทำ ในบางครั้งก็เหมือนตำรวจยอมผ่อนปรนให้คนผิดทั้งที่ต้องรักษาความถูกต้อง Agent นี้จะเป็นตำรวจตรงฉิน
Model-Based Reflex Agents (เอเจนต์แบบสะท้อนที่มีโมเดล) เอเจนต์เหล่านี้จะมี “โมเดลภายใน” ของสภาพแวดล้อม ซึ่ง “โมเดล” ในที่นี้หมายถึง “ความรู้เกี่ยวกับโลกภายนอก” ทำให้เอเจนต์สามารถติดตามสิ่งที่เกิดขึ้นได้ (tracking events) และสามารถทำงานในสภาพแวดล้อมที่มองเห็นไม่สมบูรณ์ (partially visible) ซึ่งขึ้นอยู่กับขนาดหรือรายละเอียดของโมเดลที่เอเจนต์มี

เมื่อมีโมเดล (Model) เอเจนต์สามารถเดาหรือคาดการณ์สภาพของสิ่งแวดล้อมที่ไม่ได้เห็นโดยตรงได้ เช่น รู้ว่าถ้ามีประตูอยู่ด้านหลัง แปลว่าอาจจะมีห้องอีกห้องหนึ่ง หรือมีวัตถุบางอย่างอยู่ด้านใน Agent คนนี้ปรับพฤติกรรมได้ดีกว่า Simple Reflex Agents เพราะมีข้อมูลสะสมและการคาดคะเนบางรูปแบบ เพิ่มความยืดหยุ่นในการทำงานเพราะปรับตัวได้ดีกว่ารวมไปถึง คาดคะเนสภาพแวดล้อมที่ไม่สมบูรณ์ ก็จะตัดสินใจได้ดีขึ้นตาม.
Goal-Based Agents (เอเจนต์ที่ขับเคลื่อนด้วยเป้าหมาย) เอเจนต์เหล่านี้จะต่อยอดจากเอเจนต์แบบ “Model-Based Reflex” โดยมี “เป้าหมาย (Goal)” เพิ่มเข้ามา ทำให้เอเจนต์สามารถตัดสินใจเลือกวิธีการที่ดีที่สุดจากหลายๆ วิธี เพื่อไปสู่เป้าหมายเฉพาะ การมีเป้าหมายช่วยกระตุ้นให้เอเจนต์วางแผน (simulate the planning process) และทำให้เอเจนต์มีความเป็นเชิงรุก (proactive) มากขึ้น

Goal-Based Agents จะมีฟังก์ชันหรือระบบสำหรับ “เปรียบเทียบ” สถานะปัจจุบันกับ “สถานะที่ต้องการ” แล้วหาทางปรับการกระทำเพื่อมุ่งสู่เป้าหมาย นอกจากจำลองและอัปเดตโมเดลภายในแล้ว ยังต้อง “คิดล่วงหน้า” เช่น หากต้องการไปจุด A ต้องทำขั้นตอนอะไรบ้าง หรือควรหลีกเลี่ยงสถานการณ์ใด
Utility-Based Agents (เอเจนต์ที่ขับเคลื่อนด้วยฟังก์ชันประโยชน์) เอเจนต์เหล่านี้ต่อยอดเพิ่มจาก Goal-Based Agents อีกระดับ ด้วยการเพิ่ม “ฟังก์ชันยูทิลิตี้ (Utility)” ซึ่งเป็นค่าที่ใช้วัด “ระดับความสำเร็จ” ในการบรรลุเป้าหมาย เมื่อมีหลายทางเลือกที่อาจทำให้ไปถึงเป้าหมาย เอเจนต์สามารถใช้ “ยูทิลิตี้” เพื่อเปรียบเทียบและเลือกการกระทำที่คาดว่าจะดีที่สุด

ตัวอย่างเช่น “Goal” คือการไปให้ถึงสนามบิน แต่ “Utility” อาจวัดค่าได้หลายแบบ เช่น ใช้เวลาน้อยที่สุด หรือประหยัดค่าใช้จ่ายที่สุด Utility-Based Agents จะประมวลผลภายใต้หลายเกณฑ์ (เช่น เวลา ความเสี่ยง ทรัพยากร) แล้วเลือกการตัดสินใจที่ให้ “คะแนนยูทิลิตี้” สูงสุด
Learning Agents (เอเจนต์ที่เรียนรู้ได้) เอเจนต์เหล่านี้ถูกออกแบบมาให้ “เรียนรู้” และ “ปรับปรุง” ประสิทธิภาพของตัวเองตามกาลเวลา โดยอาศัยข้อมูลย้อนกลับ (feedback) และประสบการณ์ใหม่ๆ การเรียนรู้นี้ทำให้อัลกอริทึมสามารถพัฒนาความแม่นยำหรือปรับพฤติกรรมให้เหมาะสมขึ้นเรื่อยๆ

Learning Agents มีองค์ประกอบสำคัญ เช่น “Learning Element” (องค์ประกอบที่เรียนรู้) และ “Performance Element” (องค์ประกอบที่ใช้ความรู้ในการตัดสินใจ) แยกกันอย่างชัดเจน ข้อมูลใหม่ที่ได้จะถูกนำไปอัปเดตโมเดลความรู้ เป้าหมาย หรือยูทิลิตี้ ทำให้เอเจนต์ก้าวหน้าไปเรื่อยๆ ได้

ภาพรวมทั้ง 5 ประเภท

จากเอเจนต์ที่มีความสามารถเพียงสะท้อนเหตุการณ์ (reflex) โดยไม่จำข้อมูลเก่า → สู่เอเจนต์ที่มีโมเดลของโลก → เพิ่มเป้าหมาย (Goal) → เพิ่มฟังก์ชันประโยชน์ (Utility) → และสุดท้ายคือเอเจนต์ที่เรียนรู้ได้ (Learning Agents)แสดงถึงการเพิ่มความซับซ้อนในการรับรู้ (Perception) การตัดสินใจ (Decision) และการเรียนรู้ (Learning) ซึ่งเป็นหัวใจสำคัญของการออกแบบ AI Agent ในปัจจุบัน

3 Steps เริ่มโครงการ Agentic AI

เราเข้าใจ การทำงานของ AgenticAI มี Agent หลายตัวทำงานร่วมกันด้วยหน้าที่ และความสามารถที่ต่างกันทั้งจำกัดความสามารถและให้สามารถเรียนรู้ได้ ด้วยกัน ในการพัฒนาโครงการ ด้าน Agentic AI ก็จะมีการออกแบบ การทำงานร่วมกันแบบอัตโนมัตินี่แหละ เช่นเดียวกันกับการทำ Big Data Management เลยที่ต้องมีการ Orchestration ชุดเครื่องมือในการควบคุมการทำงานของ Agent เป็นการสร้าง Workflow หรือ การสร้าง “Agentic Workflow”

Agentic Workflow” ซึ่งประกอบด้วยหลายเอเจนต์ (Agentic AI) ที่ทำงานร่วมกันเป็นระบบอัตโนมัติ (Automation) เพื่อให้ได้ผลลัพธ์ที่ดีขึ้นกว่าการใช้เอเจนต์ตัวเดียว และชี้ให้เห็นว่า แม้ใช้ LLMs (Language Models) ที่ไม่ได้ล้ำยุคมากนัก แต่หากผสานเข้ากับโครงสร้าง (Workflow) อย่างถูกต้อง ก็สามารถได้ผลงานที่ “น่าทึ่ง” ได้

ตัวอย่างความ ซับซ้อนในการจัดงาน หลังบ้านของระบบ Agent การทำงานกับโมเดล การเข้าถึงข้อมูลภายใน การทำงานกับระบบภายนอก กว่าได้ได้ผลลัพธ์ส่งออกไป

ขั้นตอนที่เราเริ่มออกแบบ Agentic AI Workflow ก็เริ่มจากระบุโครงสร้างงาน และบทบาทของ agent กันก่อน

Step 1: ระบุโครงสร้างงาน (Workflow) และบทบาทของเอเจนต์

ระบุตัวงานและปัญหาที่ต้องการแก้ไข
- ตั้งคำถามว่า “Workflow นี้จะรับมือกับปัญหาหรืองานอะไร?”
- หรืองานใหญ่แบบไหนที่ควรแตกออกเป็นงานย่อย (Subtasks)
ประเมินจำนวนเอเจนต์ AI ที่ต้องการ
- งานซับซ้อนมากน้อยเพียงใด?
- ต้องแยกเป็นกี่บทบาท (Roles) เพื่อให้ง่ายต่อการจัดการ?
ระบุเป้าหมายหรือหน้าที่ของเอเจนต์แต่ละตัว
- เอเจนต์ A ทำงานอะไร? เอเจนต์ B ทำอะไร?
- แต่ละเอเจนต์มีอินพุต (Input) และเอาต์พุต (Output) เป็นแบบใด?
ศึกษาอินพุตและเอาต์พุตของแต่ละเอเจนต์
- เอเจนต์ตัวแรกใช้ข้อมูลอะไรในการประมวลผล แล้วส่งผลลัพธ์แบบใดต่อให้เอเจนต์ตัวต่อไป?
เข้าใจการเชื่อมโยงระหว่างเอเจนต์ใน Workflow
- เอเจนต์เหล่านี้ต้องส่งต่อผลลัพธ์กันอย่างไร?
- ใช้รูปแบบใดในการเชื่อมต่อ (Passing Output → Input)?

เมื่อได้คำตอบชัดเจนในแต่ละข้อ ก็จะเห็นโครงสร้างหรือภาพรวมของ Workflow ทั้งหมด และพร้อมเข้าสู่ขั้นตอนต่อไป

Step 2: กำหนดและสร้าง “Agentic Assistants” (เอเจนต์แต่ละตัว)

หลังจากทราบจำนวนเอเจนต์และหน้าที่ของแต่ละตัวแล้ว จึงเริ่มสร้างเอเจนต์ AI ให้สอดคล้องกับบทบาทที่กำหนดไว้ โดยทั่วไปมี 4 องค์ประกอบหลักที่ต้องพิจารณา:

Planning and Action (การวางแผนและการกระทำ)
- กำหนดให้ชัดเจนว่า อินพุตของเอเจนต์คืออะไร และเอาต์พุตควรเป็นแบบใด
- พิจารณาว่าเอเจนต์ต้องมี “ขั้นตอนกลาง” (Intermediate Steps) หรือไม่ เช่น การเรียกใช้เครื่องมืออื่น (Tool) หรือขั้นตอนการวางแผน (Planning Process)
- สิ่งเหล่านี้มีผลต่อการตั้งค่า “Prompt” ให้เอเจนต์
Memory (หน่วยความจำ)
- ระบุว่าเอเจนต์ตัวนี้ต้องดึง “ข้อความในอดีต” (Past Messages) มากี่ข้อความ?
- ต้องใช้ “หน่วยความจำระยะยาว” หรือไม่? ขึ้นอยู่กับโมเดลหรือเฟรมเวิร์กที่เลือกใช้
- บางเฟรมเวิร์กอาจมีระบบเมมโมรีในตัว แต่บางเฟรมเวิร์กอาจต้องสร้างเอง
Tool (เครื่องมือ/ส่วนขยายเพิ่มเติม)
- ตามบทบาทที่กำหนด เอเจนต์อาจต้องใช้ “Power-ups” หรือ “Extension” ใดบ้าง?
- ยกตัวอย่าง: ถ้าเอเจนต์เป็น “นักวิจัยรายชื่อลูกค้า (Sales Lead)”, อาจต้องการเครื่องมือ “Web Search” และ “Web Scraper” เพื่อค้นหาข้อมูลจากเว็บไซต์หรือลิงก์อิน (LinkedIn) ของลูกค้า
LLM Model (โมเดลภาษาที่จะใช้)
- หลังจากกำหนดความต้องการในแต่ละส่วนแล้ว ก็เลือกโมเดล LLM ที่เหมาะสมมาทำหน้าที่เอเจนต์
- หากต้องการเปรียบเทียบคุณสมบัติของ LLM หลายๆ ตัว อาจต้องดูตารางเปรียบเทียบในบทความหรือแหล่งข้อมูลที่แนะนำ

เมื่อระบุทุกความต้องการได้แล้ว การตั้งค่าเอเจนต์แต่ละตัวก็จะเป็นไปอย่างราบรื่นและตรงวัตถุประสงค์

Step 3: ใช้ประโยชน์จาก Agentic Workflow เพื่อระบบอัตโนมัติ (Automation)

เชื่อมโยงเอเจนต์แต่ละตัวเข้าด้วยกัน
- นำอินพุต/เอาต์พุตของเอเจนต์หนึ่ง ไปเป็นอินพุตของเอเจนต์ถัดไป ตามโครงสร้างที่วางไว้ใน Step 1
- ตรวจสอบว่าเอาต์พุตของเอเจนต์ต้นทางจำเป็นต้องปรับรูปแบบ (Reformat) เพื่อให้เอเจนต์ปลายทางเข้าใจหรือไม่
ปรับแต่ง (Refine) Prompt ของเอเจนต์หรือแก้โครงสร้างขั้นตอน
- ระหว่างการเชื่อมต่อ หากพบจุดติดขัด เช่น รูปแบบข้อมูลไม่ตรงกัน หรือข้อความยาวเกิน จึงอาจต้องแก้ไขการตั้งค่า Prompt หรือเพิ่มขั้นตอนกลาง
- กระบวนการนี้อาจมีการทดลองหลายครั้ง จนได้ผลลัพธ์ที่พอใจ
มอนิเตอร์และปรับปรุงระบบ
- หลังจากสร้าง Workflow และให้เอเจนต์ทั้งหมดทำงานร่วมกันแล้ว ต้องคอยติดตามประสิทธิภาพ (Performance)
- หากพบว่าเอเจนต์ใช้เวลามากไป, ได้ผลลัพธ์ไม่แม่นยำ หรือไม่สร้างสรรค์พอ ก็อาจปรับแก้โครงสร้างของ Workflow หรือ Prompt ให้ดีขึ้น

กระบวนการทั้งหมดมุ่งหวังให้ระบบทำงาน “อัตโนมัติ” (Automation) อย่างมีประสิทธิภาพ แม่นยำ และพร้อมต่อยอดความคิดสร้างสรรค์ สิ่งสำคัญของ Agentic AI มีองค์ประกอบ สำคัญคือ Model ที่มีความเป็น Multi-Modal ที่ต้องสามารถทำงานได้อย่าง Realtime ได้เป็นอย่างดี องค์ประกอบถัดมาคือเครื่องมือที่ให้ AI สามารถเข้าถึงได้ในกระบวนการทำงานนั้น และสุดท้าย การจัดการการกำหนด Agent และการนำเป็นออกแบบให้เป็นส่วนหนึ่งของการทำงาน เพราะ Agentic Ai สามารถทำงานร่วมกันกับทีมงานในองค์กรได้ และแน่นอนเมื่อเสมือนเป็น พนักงานคนหนึ่งเราจำเป็นต้องมีการจัดการ AI Agent ด้วยช่วยกัน เป็นสกิลใหม่ของโลก ที่ต้องเรียนรู้ ลองไปอ่านบทความนี้ต่อครับ เป็นCEO ผู้บริหารยุค Intelligence Age ต้องมีสกิลจัดการ AI Employees

News

Company:

ประเภทของ AI Agent และ 3 Steps เริ่มโครงการ Agentic AI

The Evolution to Agentic AI

ตัวอย่าง Agentic AI Google Deepmind Project Mariner

Types of AI Agent

ภาพรวมทั้ง 5 ประเภท

3 Steps เริ่มโครงการ Agentic AI

Step 1: ระบุโครงสร้างงาน (Workflow) และบทบาทของเอเจนต์

Step 2: กำหนดและสร้าง “Agentic Assistants” (เอเจนต์แต่ละตัว)

Step 3: ใช้ประโยชน์จาก Agentic Workflow เพื่อระบบอัตโนมัติ (Automation)

Table of contents [hide]

คุณน่าจะชอบบทความนี้

บทความแนะนำ

Discover More About DigithunAI

Digithun Worldwide AI & DATA Solutions