“...ปัญหาหนึ่งที่นักพัฒนาปัญญาประดิษฐ์มักพบอยู่เสมอในเรื่องของการแปลภาษาคือ ปัญหาความคลุมเครือของภาษา (Problem of ambiguity) ซึ่งเป็นปัญหาจากภาษาของมนุษย์หลากหลายภาษาในโลกที่เต็มไปด้วยความคลุมเครือ เพราะแต่ละคำหรือแต่ละประโยคของภาษาอาจมีหลายความหมาย นอกจากนี้โครงสร้างทางไวยากรณ์ของภาษาก็มีความคลุมเครือด้วยเช่นกัน ความคลุมเครือทางภาษาของมนุษย์จึงเป็นอุปสรรคใหญ่ของอัลกอริทึมสำหรับแปลภาษาที่นักพัฒนาปัญญาประดิษฐ์ยังแก้ปัญหาไม่ตก ซึ่งต่างจากความสามารถในการรับรู้ด้านภาษาของมนุษย์ เพราะทันทีที่มนุษย์พบความสับสนหรือความคลุมเครือของภาษา มนุษย์สามารถที่จะหาทางออกจนสามารถแปลความคลุมเครือและความสับสนของภาษาให้ตรงกับความหมายจริงได้อย่างฉับไว ขณะที่เครื่องแปลภาษาอาจหาวิธีแก้ปัญหาไม่ได้เมื่อตกอยู่ในสถานการณ์เดียวกันและอาจแปลความหมายออกมาในทางตรงข้ามก็เป็นได้...”
“ในโลกนี้อาจมีผู้เชี่ยวชาญด้านปัญญาประดิษฐ์แถวหน้าราว 700 คน อาจมีผู้ที่เข้าใจและมีส่วนร่วมในธุรกิจปัญญาประดิษฐ์ราว 70,000 คน แต่คนอีก 7,000 ล้านคนคือผู้ที่ถูกลากเข้าไปติดร่างแหของปัญญาประดิษฐ์” (เอียน โฮการ์ท ผู้ร่วมก่อตั้งและประธานร่วมบริษัท Songkick)
เมื่อปลายเดือนกรกฎาคมที่ผ่านมามีรายงานข่าวเกี่ยวกับ Facebook สื่อสังคมออนไลน์ที่มีผู้ลงทะเบียนใช้งานมากกว่า 1 ใน 3 ของประชากรโลก ถึงความผิดพลาดกรณีปรากฏข้อความไม่เหมาะสมบนเพจ Facebook ของ ไทยพีบีเอส จากการแปลข้อความจากภาษาอังกฤษเป็นภาษาไทยที่ไม่ถูกต้อง เหตุการณ์เกิดขึ้นในการถ่ายทอดสดพิธีจุดเทียนถวายพระพรชัยมงคล เนื่องในโอกาสวันเฉลิมพระชนมพรรษา และมีข้อความที่ไม่เหมาะสมแสดงขึ้นมา
เมื่อข่าวปรากฏขึ้น Facebook ได้ปิดระบบการแปลภาษาอัตโนมัติบน Facebook และ Instagram ชั่วคราว พร้อมทั้งขออภัยอย่างสุดซึ้งสำหรับความผิดพลาดในครั้งนี้ โดยได้ชี้แจงว่าเป็นข้อผิดพลาดทางเทคนิคที่ส่งผลให้เกิดความคลาดเคลื่อนในการแปลภาษาไทย
Facebook เป็นบริษัทสื่อสังคมออนไลน์ที่ถือว่ามีอิทธิพลต่อชาวโลกมากที่สุดก็ว่าได้ นักเทคโนโลยีปัญญาประดิษฐ์คนดังๆของโลกหลายคน รวมทั้ง ยานน์ เลอคัน ( Yann LeCun) หนึ่งในผู้ทรงอิทธิพลที่สุดด้านปัญญาประดิษฐ์และเป็นหนึ่งในผู้ได้รับรางวัล Turing Award ซึ่งถือว่าเป็นรางวัลโนเบลด้านคอมพิวเตอร์ของปี 2018 ถูก Facebook ดึงตัวเข้าไปเป็นกำลังสำคัญในการพัฒนาศักยภาพของ Facebook เพื่อสร้างนวัตกรรมออกมาสู่สายตาชาวโลก
สิ่งหนึ่งที่ Facebook ได้มุ่งมั่นพัฒนาตลอดมาคือการใช้ความสามารถของปัญญาประดิษฐ์(Artificial Intelligence :AI) ในการให้บริการแก่ผู้ใช้ Facebook และฟังก์ชันที่ Facebook ตั้งใจพัฒนาเพื่อให้บรรลุพันธกิจ การเปิดโลกให้กว้างขึ้น มีการติดต่อกันมากขึ้นและทำให้ทุกคนสามารถที่จะใช้ข้อมูลจาก Facebookในภาษาที่ตัวเองต้องการ คือ การพัฒนาเครื่องมือแปลภาษา ซึ่ง Facebook ใช้เทคโนโลยีที่เรียกว่า Convolutional Neural Networks (CNNs) หรือ ConvNets ซึ่งเป็นเทคโนโลยีที่ถูกนำเสนอตั้งแต่ช่วงทศวรรษ 1980 โดย ยานน์ เลอคัน หนึ่งในผู้บริหารระดับสูงของ Facebook ในปัจจุบันนั่นเอง
เทคโนโลยี ConvNets เป็นเทคโนโลยีที่นิยมใช้ในการจดจำและแยกประเภทของภาพที่ปัญญาประดิษฐ์มองเห็น แต่ Facebook ได้พัฒนาโดยนำมาใช้เป็นเครื่องมือแปลภาษา ซึ่งเครื่องแปลภาษาที่ใช้เทคโนโลยี ConvNets มีข้อดีคือสามารถจะเลียนแบบการแปลประโยคของภาษาที่คล้ายกับการแปลของมนุษย์ได้และมีความเป็นไปได้ไม่มากก็น้อยว่า ผู้ที่มีส่วนผลักดันให้มีการนำเทคโนโลยี ConvNets มาใช้กับ Facebook น่าจะเป็น ยานน์ เลอคัน ผู้ที่พัฒนาเทคโนโลยี ConvNets มากับมือนั่นเอง
ไม่เฉพาะ Facebook เท่านั้นที่เห็นประโยชน์จากการใช้เครื่องแปลภาษาด้วยปัญญาประดิษฐ์ บริษัท Google ผู้นำด้านเครื่องมือสืบค้น(Search engine)ของโลก ก็ใช้เครื่องแปลภาษาที่เรียกว่า Google Translate ในการแปลภาษา แต่ใช้เทคโนโลยีที่เรียกว่า Recurrent Neuron Network (RNN) ซึ่งใช้วิธีแปลภาษาแบบ คำต่อคำ ตามคำสั่งโดยการแปลจาก ซ้ายไปขวา หรือ ขวาไปซ้าย
เครื่องแปลภาษาของทั้ง Facebook และ Google อยู่บนหลักการที่ทำให้คอมพิวเตอร์สามารถติดต่อกับมนุษย์ผ่านทางภาษาซึ่งเรียกหลักการนี้ว่า การประมวลผลภาษาธรรมชาติ (Natural Language Processing :NLP) หรือการประมวลผลภาษามนุษย์นั่นเอง การประมวลผลภาษามนุษย์แบบ NLP สามารถนำไปใช้ได้กับ การจดจำคำพูด(Speech recognition) การตอบคำถามด้วยระบบอัตโนมัติ(Automated question answering) รวมไปถึง การแปลภาษา(Machine translation) ที่กำลังเป็นปัญหาต่อ Facebook อยู่ในขณะนี้ จึงไม่แปลกที่ในระยะหลังจะเห็นบริษัทเทคโนโลยีด้านข้อมูลใช้การประมวลผลภาษา NLP สร้างสินค้าและบริการให้กับผู้คนในโลกได้ใช้กันอย่างแพร่หลายหลังจากได้พิสูจน์แล้ว NLP ว่าทำงานได้ผลจริง
การแปลภาษาด้วยการใช้ปัญญาประดิษฐ์เป็นที่นิยมของผู้คนทั่วทั้งโลกเพราะสามารถทำให้คนที่เกิดมาในโลกแต่ต่างชาติต่างภาษาสามารถสื่อสารกันได้ง่ายขึ้นและกลายเป็นเครื่องมือจำเป็นที่ขาดไม่ได้เหมือนดังเช่นการใช้แผนที่นำทางด้วยระบบ GPS อย่างไรก็ตามปัญญาประดิษฐ์ในปัจจุบันเป็นปัญญาประดิษฐ์ขั้นต้น (Narrow Artificial Intelligence) ซึ่งทำงานได้เฉพาะอย่างตามที่ถูกสั่งให้ทำจากการเรียนรู้ตามข้อมูลที่ป้อนเข้าไปล่วงหน้า ดังนั้นเครื่องแปลภาษาด้วยปัญญาประดิษฐ์จึงทำหน้าที่แปลภาษาตามที่ถูกกำหนดให้แปลเท่านั้น จะไม่สามารถรอบรู้ความเป็นไปของโลกได้ดังเช่นมนุษย์ ไม่สามารถเข้าใจในสิ่งที่อ่านหรือแปลได้ แต่สามารถแปลข้อความจากภาษาที่มองเห็นด้วยข้อมูลที่เรียนรู้มาแล้วได้อย่างรวดเร็วกว่ามนุษย์หลายเท่าตัว ที่สำคัญคือเครื่องแปลภาษาปัญญาประดิษฐ์ ยังไม่มีสามัญสำนึก ยังไม่รู้จักผิดชอบชั่วดีและยังไม่ได้มีความยับยั้งชั่งใจดังเช่นมนุษย์
ยานน์ เลอคัน เคยให้สัมภาษณ์ไว้ว่า “ มนุษย์สามารถเรียนขับรถได้ภายใน 15 ชั่วโมงโดยไม่มีการเฉี่ยวชน แต่ถ้าเราจะใช้วิธี Reinforcement learning (การเรียนรู้โดยการฝึกหัดหรือลองผิดลองถูกของปัญญาประดิษฐ์) เพื่อสอนให้รถไร้คนขับทำงาน เราจะต้องให้รถคันนั้นฝึกแล่นไปยังหน้าผานับเป็นหมื่นๆครั้งเพื่อให้ปัญญาประดิษฐ์ของรถได้เรียนรู้ว่าจะไม่ขับรถลงหน้าผาไป” อย่างไรก็ตามมิได้หมายความว่ารถไร้คนขับจะขับรถลงหน้าผาด้วยความผิดพลาดไม่ได้ หากสภาพแวดล้อมในขณะนั้นเปลี่ยนแปลงไปจากประสบการณ์ที่ปัญญาประดิษฐ์ได้เรียนรู้มา การเรียนรู้ข้อมูลเพื่อการแปลภาษาก็ต้องการข้อมูลจำนวนมากของภาษาเพื่อการเรียนรู้ไม่ต่างจากการเรียนรู้ของรถไร้คนขับ เพื่อไม่ให้เครื่องแปลภาษาแสดงผลลัพธ์ในสิ่งที่ได้เรียนรู้มาแล้วว่าเป็นความหมายที่ไม่ถูกต้อง
ปัญหาหนึ่งที่นักพัฒนาปัญญาประดิษฐ์มักพบอยู่เสมอในเรื่องของการแปลภาษาคือ ปัญหาความคลุมเครือของภาษา (Problem of ambiguity) ซึ่งเป็นปัญหาจากภาษาของมนุษย์หลากหลายภาษาในโลกที่เต็มไปด้วยความคลุมเครือ เพราะแต่ละคำหรือแต่ละประโยคของภาษาอาจมีหลายความหมาย นอกจากนี้โครงสร้างทางไวยากรณ์ของภาษาก็มีความคลุมเครือด้วยเช่นกัน ความคลุมเครือทางภาษาของมนุษย์จึงเป็นอุปสรรคใหญ่ของอัลกอริทึมสำหรับแปลภาษาที่นักพัฒนาปัญญาประดิษฐ์ยังแก้ปัญหาไม่ตก ซึ่งต่างจากความสามารถในการรับรู้ด้านภาษาของมนุษย์ เพราะทันทีที่มนุษย์พบความสับสนหรือความคลุมเครือของภาษา มนุษย์สามารถที่จะหาทางออกจนสามารถแปลความคลุมเครือและความสับสนของภาษาให้ตรงกับความหมายจริงได้อย่างฉับไว ขณะที่เครื่องแปลภาษาอาจหาวิธีแก้ปัญหาไม่ได้เมื่อตกอยู่ในสถานการณ์เดียวกันและอาจแปลความหมายออกมาในทางตรงข้ามก็เป็นได้
แม้ว่าเมื่อปี 2018 Facebook เคยให้ข่าวว่าได้มีการพัฒนาระบบประมวลผลภาษาที่สามารถแปลภาษาได้อย่างมีประสิทธิภาพมากกว่าเดิม โดยมีความเร็วกว่าระบบประมวลผลภาษาแบบ NLP ดั้งเดิมถึง 20-30 เท่าและมีความแม่นยำถึง 95 เปอร์เซ็นต์ แต่การแปลภาษาด้วยอัลกอริทึมที่มนุษย์เป็นผู้สร้างขึ้นมานั้นแม้ว่าจะได้ผลเที่ยงตรงมากตามที่อ้าง แต่มิได้หมายความว่าจะเกิดความผิดพลาดไม่ได้ โดยเฉพาะการแปลภาษาที่มีโครงสร้างที่มีความซับซ้อน มีการใช้คำที่มีความหมายเดียวกันหลายคำรวมทั้งมีคำราชาศัพท์ด้วย ดังเช่นในภาษาไทยนั้น มีความเป็นไปได้ที่จะเกิดปัญหาความคลุมเครือของภาษาและมีความเสี่ยงที่จะเกิดความผิดพลาดจากการแปลความหมายจากภาษาอังกฤษไปเป็นภาษาที่มีความยากและซับซ้อนดังเช่นภาษาไทยหรือภาษาอื่นๆที่มีความซับซ้อนใกล้เคียงกันได้เช่นกันดังที่เกิดขึ้นจากกรณีของ Facebook
ปัญญาประดิษฐ์มักถูกสร้างกระแสให้มีความสามารถเกินความเป็นจริงอยู่เสมอจึงทำให้เกิดความคาดหวังของผู้คนและถูกนำไปใช้โดยการขาดความระมัดระวังจนเกิดปัญหาตามมา สิ่งหนึ่งที่มักแฝงมากับข่าวของปัญญาประดิษฐ์คือผลประโยชน์ที่มักเกิดขึ้นควบคู่กับนวัตกรรมและส่งผลให้ชื่อเสียงของบริษัทเป็นที่รับรู้ของคนส่วนใหญ่ รวมถึงราคาหุ้นที่มักพุ่งสูงขึ้นเมื่อบริษัทสามารถคิดค้นนวัตกรรม สินค้า หรือบริการออกสู่ตลาด ทั้งๆที่นวัตกรรมเหล่านั้นอาจไม่สามารถใช้งานได้จริงสมกับราคาคุยก็ตาม (ราคาหุ้นของบริษัท IBM พุ่งขึ้นไม่หยุดเมื่อมีการถ่ายทอดทีวีการแข่งขันเกม Jeopardy ระหว่างมนุษย์กับปัญญาประดิษฐ์ชื่อ Watson และปัญญาประดิษฐ์ Watson สามารถเอาชนะมนุษย์ได้)
ดังนั้นในบางแง่มุม แนวคิดบางอย่างในการสร้างปัญญาประดิษฐ์และความสำเร็จของปัญญาประดิษฐ์คือแนวคิดและความสำเร็จที่ไม่ค่อยมีเหตุผลเท่าใดนักสำหรับคนทั่วๆไปหรือแม้แต่ตัวนักปัญญาประดิษฐ์เองก็ตาม
ความผิดพลาดจากการแปลภาษาด้วยอัลกอริทึมของปัญญาประดิษฐ์ที่เกิดขึ้นอยู่บ่อยครั้งและหลายครั้งกลายเป็นคำแปลที่ตลกขบขันเป็นเรื่องที่คนทั่วไปพอเข้าใจได้ว่าเป็นความผิดพลาดของเครื่องแปลภาษา แต่ความผิดพลาดที่เกิดขึ้นจากระบบแปลภาษาอัตโนมัติในการถ่ายทอดสดงานพิธีจุดเทียนถวายพระพรชัยมงคลนั้น เป็นความผิดพลาดที่แม้จะเกิดขึ้นจากการแปลความของปัญญาประดิษฐ์โดยมิได้เกิดจากเจตนาของมนุษย์ แต่เป็นความผิดพลาดที่ถือว่าร้ายแรงและเป็นการพิสูจน์ให้เห็นได้อย่างชัดเจนถึงจุดอ่อนของปัญญาประดิษฐ์ซึ่งแม้ฮาร์ดแวร์ของคอมพิวเตอร์จะมีศักยภาพในการประมวลผลการแปลภาษาได้ด้วยความรวดเร็วมากเพียงใดก็ตาม หากซอฟแวร์ซึ่งเป็นอัลกอริทึมแปลภาษาถูกออกแบบมาได้ไม่ดีพอ ก็จะได้ผลลัพธ์ที่เกิดความผิดพลาดได้ รวมทั้งยังแสดงให้เห็นว่ามนุษย์ยังไม่สามารถขัดเกลาความหยาบกระด้างของเทคโนโลยีให้กลมกลืนกับสภาพแวดล้อมทางภาษา วัฒนธรรม ประเพณีและกาลเทศะของมนุษย์ได้อย่างลงตัว จนกลายเป็นการบั่นทอนความน่าเชื่อถือของปัญญาประดิษฐ์เองและพิสูจน์ให้เห็นว่าปัญญาประดิษฐ์บางประเภทยังไม่อาจนำไปใช้งานได้ในทุกสถานการณ์อย่างอิสระโดยไม่มีมนุษย์เป็นผู้ควบคุม
อ้างอิง
1. A Human Algorithm โดย Flynn Coleman
2. https://www.isranews.org/article/isranews-news/90783-tpbs-facebook-DES.html
3. https://mgronline.com/cyberbiz/detail/9630000077889
4. https://www.vengaglobal.com/blog/google-vs-facebook-nmt-difference/
5. Artificial Intelligence: A Guide for Thinking Humans โดย Melanie Mitchell
6. AI Rebooting โดย Gary Marcus และ Ernest Davis
7. Human Compatible โดย Stuart Russell
หมายเหตุ : ภาพประกอบจาก https://oursocialtimes.com/10-facebook-marketing-mistakes-youre-probably-making/