เรียนท่านผู้มีอุปการะคุณ ที่เข้ามาเยี่ยมชม สมองสองซีก ตอนนี้ทางทีมงานได้ย้ายไป link ใหม่ตาม นี้ขอรับ http://g-sciences.blogspot.com ขอขอบพระคุณทุกท่านที่ติดตามขอรับ

วันอาทิตย์ที่ 2 สิงหาคม พ.ศ. 2552

A-STAR พูดไทยใส่ล่ามอิเล็กทรอนิกส์กลายเป็น 8 ภาษาเอเชีย


"อันนยองฮาเซโย?" เสียงทักทายภาษาเกาหลีผ่านเครือข่ายอินเทอร์เน็ตถึง "ลี มิน กิ" ที่กรุงโซล ทั้งๆ ที่เพื่อนหญิงของเขากล่าวคำ "สวัสดีค่ะ" อย่างชัดถ้อยชัดคำจากใจกลางกรุงเทพฯ คือภาพฝันที่ไม่น่าไกลจากความเป็นจริงนักสำหรับ "ล่ามอิเล็กทรอนิกส์" ซึ่งเริ่มเห็นเป็นรูปเป็นร่างภายใต้ความร่วมมือ A-STAR ที่จะช่วยให้เราสื่อสารกับเพื่อนต่างชาติได้แม้ไม่ทราบภาษาของชาตินั้นๆ

ความร่วมมือเพื่อการวิจัยภาษาเอเชียนขั้นสูงหรือที่เรียกสั้นๆ ว่า A-STAR (Asian Speech Translation Advanced Consortium) เป็น โครงการความร่วมมือของ 8 ประเทศในเอเชีย คือ ไทย ญี่ปุ่น เกาหลี อินโดนีเซีย สาธารณรัฐประชาชนจีน อินเดีย เวียดนามและสิงคโปร์ โดยมีเป้าหมายเพื่อวิจัยและพัฒนา "ล่ามอิเล็กทรอนิกส์" ที่สามารถแปลเสียงพูดของแต่ละประเทศพร้อมด้วยภาษาอังกฤษอีก 1 ภาษา ให้เป็นข้อความและเสียงของประเทศอื่นๆ ในกลุ่ม ส่งผ่านเครือข่ายอินเทอร์เน็ต
หน้า จอแสดงผลการสนทนาผ่านล่ามอิเล็กทรอนิกส์ 8 ภาษาเอเชีย ของ A-STAR ซึ่งแสดงภาพผู้พูดและภาษาที่พูด ก่อนตามด้วยภาษาที่แปลและเสียงสังเคราะห์

สำหรับประเทศไทย หน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) คือหน่วยงานที่รับผิดชอบในการพัฒนาระบบเพื่อสร้างล่ามอิเล็กทรอนิกส์ที่จะ ช่วยในการสื่อสารของประเทศสมาชิกทั้ง 8 ภายในเอเชีย ซึ่ง ดร.ชัย วุฒิวิวัฒน์วิชัย ผู้อำนวยการหน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษาของเนคเทค กล่าวถึง A-STAR ว่า ได้เกิดความร่วมมือเพื่อสร้างโครงสร้างพื้นฐานที่จำเป็นเพื่อสื่อสารใน รูปแบบนี้มาตั้งแต่ปี 2550 โดยความร่วมมือของ 6 ประเทศในเอเชียที่กล่าวถึงข้างต้น ขณะที่เวียดนามและสิงคโปร์เพิ่งเข้าร่วมเมื่อปี 2551

ในระบบสื่อสารผ่านล่าม อิเล็กทรอนิกส์ ผู้พูดสามารถพูดภาษาประจำชาติผ่านระบบซึ่งเชื่อมต่อเครือข่ายอินเทอร์เน็ต โดยที่การแสดงผลที่ปลายทางจะอยู่ในรูปภาษาของผู้พูด และภาษาของผู้ร่วมสนทนาทั้งในแบบตัวอักษรและเสียงสังเคราะห์ ซึ่งจะเกิดการสื่อสารเช่นนี้ได้ จำเป็นต้องมีระบบจำเสียงพูด ระบบแปลข้อความ และระบบสังเคราะห์เสียง ซึ่งทั้งหมดต้องให้บริหารผ่านเครือข่ายอินเทอร์เน็ต

ทั้งนี้ เมื่อผู้พูดกล่าวภาษาประจำชาติของตัวเองกับระบบล่ามอิเล็กทรอนิกส์แล้ว ระบบรู้จำเสียง (Automatic speech recognition) หรือ ASR จะแปลงเป็นข้อความภาษาไทยแล้วส่งไปยังเซิร์ฟเวอร์ที่ญี่ปุ่น ที่นั่นมีระบบแปลข้อความ (Machine translation) หรือ MT ถึง 9 ภาษาครอบคลุมประเทศในกลุ่ม A-STAR และภาษาอังกฤษ ซึ่งจับคู่แปลภาษาทั้งหมดได้ 72 คู่

จาก นั้นระบบแปลข้อความจะแปลภาษาของผู้พูดให้เป็นภาษาของคู่สนทนา หากภายในห้องสนทนามีสมาชิกจาก 4 ประเทศ ระบบจะแปลงเป็น 4 ภาษาของประเทศในกลุ่มสนทนา และระบบสังเคราะห์ของแต่ละประเทศจะแปลงภาษาที่แปลมานั้นเป็นภาษาพูด ซึ่งตั้งแต่พูดจนถึงกระบวนการแปลภาษานั้นใช้เวลาประมาณ 4-5 วินาที

หากถามถึงความแม่นยำแล้ว ทีมข่าววิทยาศาสตร์ ASTV-ผู้จัดการออนไลน์ ซึ่งได้ร่วมสังเกตการเชื่อมต่อแบบออนไลน์ของ 8 ประเทศ ในการทดลองสื่อสารระหว่างกันผ่านล่ามอิเล็กทรอนิกส์ เห็นว่ายังมีความผิดพลาดและการสื่อสารยังไม่ลื่นไหลนัก ซึ่งจุดนี้ ดร.ชัยกล่าวว่า ญี่ปุ่นให้ความสำคัญกับเรื่องนี้อย่างยิ่ง จึงตั้งเป้าพัฒนาระบบแปลภาษาให้มีความแม่นยำก่อนเปิดให้ใช้งานได้ในระบบ สาธารณะในอีก 3 ปีข้างหน้า แม้ว่าระบบโครงสร้างพื้นฐานขณะนี้สามารถเปิดให้ใช้บริการในระดับสาธารณะได้ แล้วก็ตาม

ขณะที่ระบบแปลภาษาของไทยที่แปลจากไทยเป็นอังกฤษและอังกฤษเป็นไทยนั้น ดร.ชัยกล่าวว่า มีความแม่นยำ 40 ตามสเกลการวัดความถูกต้องของการแปลแบบ "บลูสกอร์" (bleu score) เทียบกับความสามารถของ "กูเกิลทรานสเลต" (Google translate) ที่แปลไทย-อังกฤษในสเกลการวัดความถูกต้องเดียวกันอยู่ที่ 25 ซึ่งสเกลการวัดนี้ยิ่งมีตัวเลขสูงยิ่งแสดงถึงความแม่นยำ ส่วนคู่ภาษาที่กูเกิลทรานสเลเตอร์แปลได้แม่นยำที่สุดคือ อังกฤษ-จีน และ อังกฤษ-สเปน ซึ่งมีสเกลอยู่ที่ 50

สำหรับระบบแปลภาษาของไทยนั้น มีคำศัพท์ไทย 14,000 คำ และคำศัพท์อังกฤษ 21,000 คำ ซึ่งเนคเทคพร้อมจะเปิดให้สาธารณะได้ใช้งานแปลคู่ภาษาไทย-อังกฤษได้ในช่วง เดือน เม.ย.53 โดยอุปกรณ์สำหรับใช้งานระบบนี้ได้คือ คอมพิวเตอร์ทั่วๆ ไป รวมทั้งอุปกรณ์เคลื่อนที่ ซึ่งเชื่อมต่ออินเทอร์เน็ตได้

อย่างไรก็ดี ในส่วนของล่ามอิเล็กทรอนิกส์สำหรับแปล 8 ภาษาของ A-STAR นั้น ยังเป็นความร่วมในระดับวิจัย ขณะที่ความร่วมมือที่จะเปิดให้ใช้งานได้ในระดับสาธารณะนั้น ยังต้องหารือกันระหว่างสมาชิกอีกครั้ง โดยเบื้องต้นระบบนี้ทดลองใช้กับภาษาเพื่อการท่องเที่ยว ซึ่งมีคำศัพท์พื้นฐานที่สามารถใช้สนทนาทั่วๆ ไปและการท่องเที่ยว แต่ยังมีอุปสรรคในเรื่องคำเฉพาะ เช่น ชื่อคน ชื่อสถานที่ ชื่อถนน เป็นต้น
ดร.ชัย วุฒิวิวัฒน์วิชัย กับตัวอย่างอุปกรณ์เคลื่อนที่ซึ่งเชื่อมต่ออินเทอร์เน็ตได้ พร้อมจอแสดงผลการแปลภาษา

นอกจากล่ามอิเล็กทรอนิกส์แล้ว ดร.ชัยเผยด้วยว่า ทางหน่วย ปฏิบัติการวิจัยวิทยาการมนุษยภาษาของเนคเทค ยังได้เริ่มระบบแปลภาษาไทย-มลายู เพื่อให้ตำรวจตระเวนชายแดนนำไปใช้สื่อสารกับคนไทยใน 3 จังหวัดชายแดนใต้ อันจะก่อให้เกิดความเข้าใจต่อกันและสร้างความคุ้นเคยกับคนในพื้นที่ได้มาก ขึ้น


ขอบคุณ astv

ไม่มีความคิดเห็น:

แสดงความคิดเห็น