back to top
Saturday, June 7, 2025
0

ความเห็นของ Andrew Ng กับการมาของ DeepSeek R1

Share

อาทิตย์ที่ผ่านมาไม่มีอะไรที่เขย่าโลกเทคโนโลยีไปมากกว่า DeepSeek GenAI จากประเทศจีน ที่มีข่าวสำนักข่าวรายงาน อย่างมาก ผลกระทบจากบริษัทจีนบริษัทเดียวทำเอาหุ้นเทค ฝั่งสหรัฐ ร่าง ๆ ตามๆ กัน ความเชื่อเกียวกับตลาดผูกขาด AI จะเป็นของ Big Tech เท่านั้น ถูกลบล้างไปด้วย AI จากจีน

ตอนมีข่าวผมดูว่าจะเล่าเรื่องนี้ในมุมไหนดีเพื่อไม่เหมือนกันกับที่เพื่อน ๆ รับรู้ไว้แล้ว ตั้งใจว่าจะรวบรวมทรรศนะความเห็นจากบุคคลชั้นนนำในวงการ AI ซึ่งรวบรวมอยู่ และคนสำคัญของโลก AI อย่าง Andrew Ng1 ก็ Post Facebook ขึ้นมานี่คือคนที่วิจารณ์เรื่องนี้ได้อย่างมีนำหนักและน่าเชื่อถือ คนหนึ่งเลยหยิบความเห็นจาก Andrew Ng มาสรุปให้อ่านกันครับ

Post ต้นทางของ Andrew Ng

ผมขอสรุป Hilight สำคัญ ๆ จากโพสต์นี้ดังนี้นะครับ

“China is catching up to the U.S. in generative AI. When ChatGPT was launched in November 2022, the U.S. was significantly ahead of China in generative AI. … But in reality, this gap has rapidly eroded over the past two years.”

“จีนกำลังไล่ตามสหรัฐฯ ในด้าน Generative AI อย่างรวดเร็ว ตอนที่ ChatGPT เปิดตัวในเดือนพฤศจิกายน 2022 สหรัฐฯ ยังนำหน้าจีนอย่างเห็นได้ชัดในเรื่อง Generative AI … แต่ความจริงก็คือ ช่องว่างนี้ลดลงอย่างรวดเร็วในช่วงสองปีที่ผ่านมา” ความน่ากลัวของความเร็วในการพัฒนาเทคโนโลยี AI ของจีน ช่องว่างไม่ห่างกันแล้ว ในเวลาผ่านมาแค่เพียง 2 ปี


“DeepSeek-R1 … a remarkable model whose performance on benchmarks is comparable to OpenAI’s o1. Further, it was released as an open weight model with a permissive MIT license.”

DeepSeek-R1 … เป็นโมเดลที่น่าทึ่ง ซึ่งผลการทดสอบบนเบนช์มาร์กต่าง ๆ ใกล้เคียงกับ o1 ของ OpenAI นอกจากนี้ ยังปล่อยออกมาเป็นโมเดลเปิด (Open Weight) ภายใต้สัญญาอนุญาตแบบ MIT ที่ให้อิสระกว้างขวางอีกด้วย”2 ในข้อความนี้ แสดงให้เห็นว่า ด้วยความเก่งที่เทียบเท่ากับ โมเดล o1 ของ OpenAI และเปิดให้ Open Weight Models ที่ DeepSeek ปล่อยออกมา กำลังทำให้ “โมเดลพื้นฐาน (foundation model)”กลายเป็นวิ่งที่เข้าถึงได้ง่าย และมีโอกาสกลายเป็น commoditize คือของพื้นฐาน นั่นหมายความว่า โลกอาจไม่ต้องพึ่งพา Model ของ Big Tech เสมอไป มีทางเลือกที่ราคาย่อมเยาว์ ที่อาจเพียงพอกับความต้องการแล้ว


OpenAI’s o1 costs $60 per million output tokens; DeepSeek R1 costs $2.19. This nearly 30x difference brought the trend of falling prices to the attention of many people.”

“OpenAI’s o1 มีค่าใช้จ่าย 60 ดอลลาร์ต่อการสร้าง 1 ล้านโทเคน แต่ DeepSeek R1 คิดแค่ 2.19 ดอลลาร์ ความแตกต่างเกือบ 30 เท่านี้ทำให้หลายคนเริ่มเห็นแนวโน้มของราคาที่กำลังลดลงอย่างฮวบฮาบ” สุดท้ายการที่แนวโน้มราคาที่ถูกลงสำหรับผมมี 2 Impacts อันแรกคือ ทุกคนสามารถเข้าถึงได้มากขึ้นจากราคาที่ถูกลง อันที่สองในกระบวนการแข่งขันของ ตลาด ที่ Big Tech ยังเจอปัญหาในการเพิ่มรายได้เพื่อทำกำไร ก็จะยิ่งยากขึ้น ในมุมคนนี้คนที่พัฒนา Foudation Model ที่ต้นทุนถูกจะมีโอกาสโตมากกว่า เพราะสร้างกำไรจากเทคโนโลยีได้ดีกว่า


“Scaling up isn’t the only path to AI progress. … Driven in part by the U.S. AI chip embargo, the DeepSeek team had to innovate on many optimizations … leading ultimately to a model trained … for under $6M of compute.”

การขยายขนาด (Scaling) ไม่ใช่วิธีเดียวที่จะขับเคลื่อนความก้าวหน้าของ AI … ส่วนหนึ่งเพราะถูกจำกัดด้วยการกีดกันด้านชิป AI จากสหรัฐฯ ทีม DeepSeek จึงต้องพัฒนาเทคนิคใหม่ ๆ ในการปรับแต่งการประมวลผล … และสุดท้ายสามารถฝึกโมเดลได้ด้วยงบค่า Compute ต่ำกว่า 6 ล้านดอลลาร์” อันนี้หลายนักวิเคราะห์พูดเป็นแนวทางเดียวกันว่า การกีดกันด้านชิป AI จากสหรัฐฯกลายเป็นพลังบีบให้จีน สามารถสร้างนวัตกรรมได้ ในการหาสร้างแนวทางเทคนิคใหม่ ๆ ในการฝึกโมเดล ซึ่งผลลัพธ์น่าทึ่ง และน่าหวาดหวั่นไปพร้อม ๆ กัน


สรุปและวิเคราะห์ประเด็นสำคัญจากโพสต์ของ Andrew Ng เกี่ยวกับ DeepSeek-R1

  • จีนกำลังไล่ตามสหรัฐฯ ด้าน Generative AI
    • Andrew Ng ชี้ให้เห็นว่าช่วงปลายปี 2022 ตอนที่ ChatGPT เปิดตัวใหม่ ๆ สหรัฐฯ ดูนำหน้าจีนอย่างเห็นได้ชัดในเรื่อง Generative AI แต่ในระยะเวลาเพียง 2 ปี จีนได้ปิดช่องว่างและบางด้านก็อาจนำหน้าไปแล้ว ด้วยผลงานอย่าง Qwen, Kimi, InternVL และ DeepSeek
    • DeepSeek-R1 ยิ่งทำให้คนเริ่มตระหนักว่า “จีนกำลังไล่ตามสหรัฐฯ ได้เร็ว” และอาจกลายเป็นผู้นำในบางส่วนของ AI
  • DeepSeek-R1: โมเดล Open Weight ที่เทียบชั้นกับ O1 ของ OpenAI
    • DeepSeek-R1 เป็นโมเดลที่เปิด Weight (Open Weight) ภายใต้ MIT License ซึ่งเปิดกว้างให้ทุกคนเข้าถึงและนำไปต่อยอดได้อย่างอิสระ
    • การเปิดโมเดลลักษณะนี้ต่างจากบางบริษัทในสหรัฐฯ ที่ผลักดันให้มีการจำกัดหรือควบคุม Open Source โดยอ้างถึงความเสี่ยงเชิง “ภัยคุกคามของ AI”
    • Andrew Ng มองว่า Open Weight (Open Source) จะเป็นหัวใจสำคัญในห่วงโซ่อุปทานของ AI (AI supply chain) เพราะเปิดโอกาสให้หลากหลายธุรกิจใช้งานได้ และถ้าสหรัฐฯ ยังคงจำกัดด้านนี้ ก็เสี่ยงที่จีนจะเป็นผู้นำ
  • Open Weight Models กำลังทำให้ “โมเดลพื้นฐาน (foundation model)” กลายเป็นสินค้าcommoditize
    • Andrew Ng พูดถึงการลดต้นทุนของ LLM เมื่อเกิดการแข่งขันสูง โมเดล Open Weight ยิ่งทำให้ค่าบริการตกลงอย่างรวดเร็ว
    • ยกตัวอย่างค่าใช้จ่าย/ล้าน token ของ DeepSeek-R1 เพียง 2.19 ดอลลาร์ เทียบกับ 60 ดอลลาร์ของโมเดล O1 จาก OpenAI
    • ช่องว่างราคาที่มากกว่า 30 เท่าย่อมดึงความสนใจ และมีนัยว่าการทำ AI อาจถูกลงมาก
  • การทำธุรกิจโดยฝึกโมเดลขนาดใหญ่เพียงอย่างเดียวอาจไม่ง่าย
    • Andrew Ng บอกว่า การขาย API หรือบริการบนโมเดลขนาดใหญ่เพียงอย่างเดียวไม่ใช่เรื่องง่าย บริษัทต่าง ๆ ที่ลงทุนมหาศาลยังต้องหาทางคืนทุน
    • แต่ในทางกลับกัน ธุรกิจที่นำโมเดลใหญ่เหล่านี้ไปต่อยอด—เช่น ทำแอปช่วยงานเอกสาร, แชตบอต, ผู้ช่วยแพทย์/กฎหมาย—กลับมีโอกาสมาก เพราะไม่ต้องลงทุนฝึกโมเดลเอง
  • “การขยายขนาดโมเดล” ไม่ใช่หนทางเดียวในการพัฒนา AI
    • แม้ Andrew Ng เองเคยส่งเสริมการขยายขนาด (Scaling) เพื่อทำให้โมเดลดียิ่งขึ้น แต่เขาพบว่าหลายบริษัททุ่มเงินมหาศาลเพียงเพื่อการ “ขยายสเกล” ซึ่งจีนพัฒนาให้เห็นว่า ไม่จำเป็นต้องใช้เงินจำนวนมากในการสเกลขนาดนั้น
    • DeepSeek-R1 ถือเป็นตัวอย่างที่พิสูจน์ว่า นอกจากขยายสเกลแล้ว ยังมี “นวัตกรรมทางเทคนิค” อื่น ๆ ที่ช่วยให้โมเดลมีประสิทธิภาพสูงได้บน GPU ที่ไม่แพงเท่า (เช่น H800 แทน H100)
    • งบประมาณฝึกโมเดล (ไม่รวมค่า R&D) ยังต่ำกว่า 6 ล้านดอลลาร์ ซึ่งนับว่าต่ำกว่าเม็ดเงินหลายพันล้านที่บริษัทใหญ่ ๆ เคยใช้
  • ผลกระทบด้านอุปสงค์ของ Compute
    • แม้เทคโนโลยีใหม่จะทำให้การฝึกโมเดลถูกลง แต่ Andrew Ng เชื่อว่า “ความต้องการด้าน Compute” และ “ความต้องการด้านปัญญาประดิษฐ์” ระยะยาวจะไม่ลดลง ตรงกันข้าม อาจสูงขึ้นเรื่อย ๆ
    • เหตุผลคือเมื่อราคาต่อหน่วยถูกลง คนอาจจะยิ่งใช้มากขึ้น และ AI ก็จะเข้าสู่ภาคส่วนต่าง ๆ มากขึ้นไม่สิ้นสุด
  • DeepSeek-R1 ในมุมภูมิรัฐศาสตร์
    • Andrew Ng มองว่า DeepSeek-R1 มีนัยยะด้านภูมิรัฐศาสตร์ (geopolitics) ที่ยังต้องรอดู เพราะมีเรื่องการแข่งขันระหว่างสหรัฐฯ-จีนเข้ามาเกี่ยวข้อง
    • อีกมุมหนึ่ง DeepSeek-R1 เป็นประโยชน์ต่อผู้สร้างแอปพลิเคชัน AI ทั่วโลก ที่ต้องการโมเดลขั้นสูงแบบเปิดเพื่อพัฒนานวัตกรรมใหม่ ๆ

DeepSeek-R1 ไม่ได้เป็นแค่โมเดล AI ที่มีประสิทธิภาพสูง แต่ราคาที่ถูกลงมาก สร้างแรงกระเพื่อมโลก AI เดิม และยังสะท้อนให้เห็นเทรนด์สำคัญหลายด้านต่อการพัฒนา AI

Andrew Ng สรุปว่า DeepSeek-R1 ไม่ได้เป็นแค่โมเดล AI ที่มีประสิทธิภาพสูงและราคาถูกลงมาก แต่ยังสะท้อนให้เห็นเทรนด์สำคัญหลายด้าน ทั้งการเบียดขึ้นมาของจีนในเวที AI, ความสำคัญของโมเดลแบบเปิด, ทิศทางของต้นทุน/ราคาในการใช้งาน LLMs, และแนวทางที่หลากหลายในการพัฒนา AI ให้ก้าวหน้าต่อไป โดยไม่จำเป็นต้องทุ่มเงินมหาศาลเพื่อ “ขยายขนาดโมเดล” อย่างเดียว.

จบบทความ : เจอภาพนี้จาก Community ฮาดี 🤣🤣🤣🤣🤣🤣🤣

  1. Andrew Ng เป็นผู้เชี่ยวชาญด้านปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่อง (Machine Learning) ที่มีชื่อเสียงระดับโลก เขาเกิดเมื่อวันที่ 18 เมษายน พ.ศ. 2519 ที่สหราชอาณาจักร และเติบโตในฮ่องกงและสิงคโปร์ Ng สำเร็จการศึกษาระดับปริญญาตรีสาขาวิทยาการคอมพิวเตอร์จากมหาวิทยาลัยคาร์เนกีเมลลอน และปริญญาโทและปริญญาเอกจากสถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) และมหาวิทยาลัยแคลิฟอร์เนีย เบิร์กลีย์ ตามลำดับ

    ในปี พ.ศ. 2554 Ng ได้ร่วมก่อตั้ง Coursera แพลตฟอร์มการเรียนออนไลน์ที่เปิดโอกาสให้ผู้เรียนทั่วโลกเข้าถึงการศึกษาในระดับมหาวิทยาลัย เขายังเป็นศาสตราจารย์ที่มหาวิทยาลัยสแตนฟอร์ด และเคยดำรงตำแหน่งหัวหน้าฝ่ายวิทยาศาสตร์ข้อมูลที่ Baidu ซึ่งเป็นบริษัทเทคโนโลยีชั้นนำของจีน

    Ng มีบทบาทสำคัญในการส่งเสริมการเรียนรู้ของเครื่องและ AI ให้เป็นที่รู้จักในวงกว้าง เขาได้พัฒนาหลักสูตรออนไลน์ที่ได้รับความนิยมอย่างมาก และเป็นผู้บรรยายที่มีความสามารถในการอธิบายแนวคิดที่ซับซ้อนให้เข้าใจง่าย นอกจากนี้ เขายังเป็นผู้ก่อตั้งและผู้นำของโครงการ AI for Everyone ซึ่งมุ่งเน้นให้ความรู้เกี่ยวกับ AI แก่บุคคลทั่วไป
    ด้วยความมุ่งมั่นในการเผยแพร่ความรู้และการพัฒนาเทคโนโลยี Andrew Ng ได้รับการยอมรับว่าเป็นหนึ่งในผู้มีอิทธิพลมากที่สุดในวงการ AI และการศึกษาออนไลน์ ↩︎
  2. MIT License เป็นหนึ่งในใบอนุญาตซอฟต์แวร์โอเพนซอร์สที่ได้รับความนิยมมากที่สุดในโลก พัฒนาโดย Massachusetts Institute of Technology (MIT) ใบอนุญาตนี้มีจุดเด่นในเรื่องความเรียบง่าย เปิดกว้าง และยืดหยุ่นต่อการใช้งานซอฟต์แวร์ที่ได้รับใบอนุญาตประเภทนี้

    เนื้อหาใบอนุญาตมีเพียงไม่กี่ข้อ ประกอบด้วย:
    1. สิทธิ์การใช้งาน (Permission)
    อนุญาตให้ทุกคนสามารถ ใช้งาน (use), คัดลอก (copy), ปรับเปลี่ยน (modify), รวม (merge), เผยแพร่ (publish), แจกจ่าย (distribute) และ ขาย (sell) ซอฟต์แวร์ที่ได้รับใบอนุญาตนี้ได้อย่างเสรี
    2. ข้อกำหนดเกี่ยวกับลิขสิทธิ์ (Copyright)
    ผู้ที่ใช้หรือแจกจ่ายซอฟต์แวร์ต้องแนบสำเนาใบอนุญาตนี้และข้อความลิขสิทธิ์ (Copyright Notice) ของเจ้าของซอฟต์แวร์ไว้เสมอ
    3. ไม่มีการรับประกันความเสียหาย (No Warranty)
    ซอฟต์แวร์ที่ได้รับใบอนุญาตนี้ไม่มีการรับประกันใด ๆ ทั้งสิ้น เจ้าของซอฟต์แวร์จะไม่รับผิดชอบต่อความเสียหายหรือความเสียหายที่อาจเกิดขึ้นจากการใช้ซอฟต์แวร์

    ผู้ใช้สามารถนำซอฟต์แวร์ไปใช้งานได้ในเชิงพาณิชย์ (Commercial Use), ในงานวิจัย หรือโครงการส่วนตัว โดยไม่มีข้อจำกัด เนื่องจาก MIT License ไม่มีข้อจำกัดเกี่ยวกับวิธีการใช้งานหรือเผยแพร่ ทำให้เป็นตัวเลือกยอดนิยมสำหรับนักพัฒนาโอเพนซอร์ส
    ↩︎
Niwat Chatawittayakul
Niwat Chatawittayakulhttp://www.digithun.com
คุณตั้น นิวัฒน์ ชาตะวิทยากูล ผู้ก่อตั้ง และ CEO บริษัท ดิจิทัน เวิลด์ไวด์ บริษัท Data & AI Tech Talant ในประเทศไทย เชี่ยวชาญด้าน การบริหารจัดการการทำ Data and AI Solutions รวมไปถึงการออกแบบประสบการณ์ผู้ใช้งาน มีประสบการณ์ดูแลโครงการ Data ขนาดใหญ่ระดับประเทศ และอยู่เบื้องหลังโครงการด้าน AI ให้กับหลายองค์กรชั้นนำ

Read more

คุณน่าจะชอบบทความนี้