ช่วงนี้ผมกำลังนั่งทำนามานุกรมเฉพาะอย่างอยู่ครับ เพื่อใช้ในการเขียนข่าวจีนแปลไทยใน Taimix เพราะคนแปลข่าวในนั้นไม่ได้มีแค่ผมคนเดียว แต่มีคนอื่นอีกหลายคนด้วย
ตอนแรกเลยคิดว่าจะแปลข่าวจากต้นฉบับภาษาจีน แต่พอเอาเข้าจริงกลับพบว่า ข่าวซึ่งสำนักข่าวได้แปลเป็นภาษาอังกฤษแล้วนั้น มันกลับมีเนื้อหาที่ตรงกับต้นฉบับภาษาจีนเลย ก็เลยคิดว่าอ้างอิงจากข่าวจีนที่แปลเป็นภาษาอังกฤษดีกว่า เพราะถึงอ้างไปที่ต้นฉบับภาษาจีน คนอ่านที่อยากอ่านต้นฉบับก็อาจจะอ่านไม่รู้เรื่องอยู่ดี!
แย่หน่อยที่คนไทยที่รู้ภาษาจีน ยังมีสัดส่วนที่น้อยมาก ๆ เมื่อเทียบกับคนไทยที่รู้ภาษาอังกฤษ!!!
ทีนี้ประเด็นที่พบก็คือ ถึงแม้ว่าคนที่แปลข่าวจีน (จากข่าวที่แปลเป็นภาษาอังกฤษแล้ว) จะเก่งกาจภาษาอังกฤษเยี่ยงไรก็ตาม แต่ก็กลับกลายเป็นว่าพวกเขากลับตกม้าตายตอนจบ เพราะว่าไม่สามารถสะกดเสียงสถานที่ในเมืองจีนหรือบุคคลสำคัญของเมืองจีนได้อย่างถูกต้อง เข้าทำนองเขียนมาอย่างนึงสะกดเสียงเป็นภาษาไทยอีกอย่างนึง
จริง ๆ แล้วเราสามารถใช้รูปของภาษาไทย เพื่อการออกเสียงภาษาจีนกลางได้นะ เพราะภาษาไทยมีพยัญชนะ, สระ และ วรรณยุกต์ เป็น super-set ของภาษาจีนกลาง จึงสามารถที่จะใช้เป็นเครื่องมือในการออกเสียงภาษาจีนกลางได้ ซึ่งผมคิดว่าน่าจะออกเสียงได้คล้ายมากกว่า 90%
แต่เนื่องจากการใช้ภาษาอังกฤษเพื่อสะกดเสียงจีนกลางนั้น มันทำได้แต่ในระดับพยัญชนะและสระ แต่มันไม่สามารถทำในระดับวรรณยุกต์ได้ จึงทำให้เกิดปัญหา ยกตัวอย่างเช่นคำว่า “Beijing” ถ้าเราออกเสียงตามภาษาอังกฤษที่เขียนก็คือ “เบยจิง” ซึ่งมันไม่ถูกต้อง เพราะที่ถูกต้อง ๆ ออกเสียงเป็น “เป่ยจิง” ถึงจะถูก
ไอ้ครั้นจะมานั่งสอนการออกเสียงภาษาจีนกลางด้วย พินยิน ให้คนอื่นอีกหลายคนที่ร่วมแปลข่าวก็กระไรอยู่ เพราะขนาดผมเองยังต้องเรียน จู้ยิน กับ พินยิน และ ภาษาจีน อยู่ตั้งเป็นปีกว่าจะรู้เรื่องได้ แล้วจะสอนให้คนอื่นที่มีพื้นฐานภาษาอังกฤษแน่นปึ้ก แต่กลับไม่มีพื้นฐานภาษาจีนให้รู้เรื่องได้ไง?
หลังจากคิดอยู่แปดตลบในที่สุดผมก็คิดออกว่า แทนที่ผมจะมานั่งสอนภาษาจีนให้ใคร ๆ ผมก็ให้คอมพิวเตอร์เป็นตัวช่วยดีกว่า ว่าแล้วผมก็คิดจะทำ “นามานุกรมภาษาจีนกลางซึ่งสะกดด้วยพินยิน แต่แทนเสียงด้วยภาษาไทย” ทันที โดยแบ่งคำศัพท์ออกเป็น 4 ส่วนใหญ่ ๆ คือ
- ชื่อของหน่วยการปกครอง เช่น มณฑล, เขตปกครองตนเอง, เทศบาลนคร, เขตปกครองพิเศษ, เมือง และ เขต เป็นต้น
- ชื่อของหน่วยงานราชการ เช่น สมัชชาประชาชน, พรรคคอมมิวนิสต์, กระทรวง, สถาบันการศึกษา, สถาบันวิจัย เป็นต้น
- ชื่อของสถานที่สำคัญ เช่น ป่า, น้ำตก, ภูเขา, แม่น้ำ, คลอง, บึง, ทะเลสาบ เป็นต้น
- ชื่อของบุคคลสำคัญ เช่น นักการเมือง, นายทหาร, นักกีฬา, นักวิทยาศาสตร์, คนบันเทิง เป็นต้น
จะเห็นว่าจุดสำคัญของนามานุกรมดังกล่าว ไม่ได้อยู่ที่กลไกในการแสดงผลทีล่ะคำเหมือนกับของ Lexitron หรือแสดงผลทั้งหน้าเว็บเหมือนกับ Longdo หรอกครับ เพราะการโค้ดน่ะมันไม่เท่าไหร่หรอก แต่ที่สาหัสก็คืองานแทนเสียงซะมากกว่า!!!
ตอนนี้ผมทำนามานุกรมฯในส่วนของ “ชื่อของหน่วยการปกครอง” ไปได้ 2,500 คำแล้ว ทำให้รู้ซึ้งว่านวัตกรรมใหม่ ๆ ต่อไปคงไม่ได้ยากตรงการโค้ดอ่ะครับ หากแต่มันจะไปยากตอนเตรียมข้อมูลให้ครบซะมากกว่า
แต่ถึงจะลำบากยังไงนะ ผมก็ยังคิดว่าหากทำสำเร็จก็ถือว่าคุ้มค่า เพราะต่อไปถึงผมจะมีผู้ร่วมเขียนข่าวเพิ่มขึ้น หรือผู้เขียนข่าวคนเก่าออกไปคนใหม่เข้ามาแทน ก็ไม่จำเป็นต้องมากังวลเรื่องที่ผู้เขียนข่าวจะออกเสียงภาษาจีนไม่ถูกต้องแล้วล่ะ เนื่องจากมีนามานุกรมฯให้ทุกคนได้ใช้กันอย่างสะดวกโยธินซะที
[tags]ภาษาจีน, พินยิน, จู้ยิน, แทนเสียง, ภาษาไทย, จีนกลาง, Longdo, Lexitron[/tags]
Wo deng kan kan ni de gongzuo.
โห พี่ไท้ เยี่ยมเลยครับ
แล้วชื่อของหน่วยการปกครองตั้ง 2,500 คำนี่พี่ใช้เวลาในการทำนานเท่าไหร่ครับ
เอ่อ “Wo deng kan kan ni de gongzuo.” หมายความว่าอะไรเหรอครับ
Project นี้น่าสนใจครับ น่าเอามาใช้ร่วมกับ พวก text editor ต่างๆได้
ใช้ช่วยแปลงคำทับศัพท์ eng->thai ที่ส่วนใหญ่จะเขียนตามใจฉัน หรือเขียนผิดๆก็ได้
อย่างเช่น blognone ที่มักจะเขียนผิด และทักท้วงแก้คำกันประจำ ถ้าเอามาใช้ได้ก็ดี
จริงๆ ใช้ได้กับ ภาษาอื่นๆมากมายเลย project ลักษณะนี้นะ
(Project->โปรเจค หรือ โปรเจก หรือ โปเจก) *มันช่วยแก้ให้เลยใช่เปล่า
ก็จะพยายามทำให้สำเร็จครับคุณอภิศิลป์ แต่ต้องค่อยทำไปวันล่ะเล็กวันล่ะน้อย ไม่งั้นจะท้อใจซะก่อน เพราะศัพท์มันเยอะจริง ๆ
ผมทำมา 20 กว่าวันได้แล้วครับคุณเน็ต พยายามทำทุกวัน ๆ ล่ะมณฑล ส่วนประโยคที่คุณอภิศิลป์เขียนอ่านได้ว่า “หวอ-เติ่ง-คั่น-คั่น-หนี่-เตอ-กง-จว้อ” ครับ ซึ่งแปลเป็นไทยได้ว่า “ผมจะเฝ้ารอผลงานของคุณ” นั่นเอง 😛
ผมเห็นเรื่องการทักท้วงแก้คำมานานแล้วครับคุณ 7 … แล้วผมก็เห็นว่ามันเป็นการแก้ที่คน ซึ่งมันยาก อีกอย่างการทักท้วงแบบนี้จะทำให้เสียอารมณ์กันเปล่า ๆ ดังนั้นการใช้ซอฟต์แวร์มาช่วยแก้ให้จึงเป็นการดีกว่า … ว่าแต่ … ที่ผมจะทำมันเป็นแค่ตัวช่วยออกเสียงอ่ะครับ มันไม่เหมือนกับ Jingjo ที่ผมสร้างอ่ะ!! เพราะงั้นมันเลยเป็นคนล่ะแบบกัน…
pinyin ออกเสียงว่า พินอิน หรือเปล่าครับ
ออกเสียงแบบนั้นก็ได้ครับคุณ tee
ผ่านมาครับ
น่าสนใจดีครับ ขอให้สู้ๆ ครับ
ส่วนตัวผมมองว่า ความยากของงานนี้อีกประการหนึ่งคือ
การทำให้คนอื่นในสังคมยอมรับ
จริงอยู่ว่า โปรเจกต์นี้เป็นช่องว่างทางการตลาด
ภาษาจีนกลางกำลังมีบทบาทมากขึ้นเรื่อยๆ ในประเทศไทย
แต่ยังไม่มีระบบการถอดเสียงเป็นตัวอักษรไทยที่ชัดเจน เป็นที่ยอมรับร่วมกัน
(เอาเข้าจริง ว่ากันว่าตำราเรียนมาตรฐานที่ยอมรับร่วมกันก็มีน้อยมากครับ
– ประโยคนี้อ้างจากบทความในมติชนสุดสัปดาห์)
ดังนั้นอย่างไรเสีย ความตั้งใจถือว่าดีครับ
ผมเกรงว่า หากโปรเจกต์ดำเนินไป
โดยไม่ได้มีการกำหนดหลักเกณฑ์ทางภาษาศาสตร์ จากนักวิชาการทางด้านนี้
คำอธิบายที่มีเหตุผลว่าเพราะอะไรเสียงใด ควรปริวรรตเป็นเสียงใด
การจะทำให้ยอมรับร่วมกันก็น่าจะลำบากครับ
เพราะอย่างที่คุณ PeeTai กล่าว เรื่องตัวเลข 90%
แต่เชื่อมั๊ยครับว่า นักวิชาการด้านนี้มักจะเถียงกันเรื่อง 10% ที่เหลือนี่แหละครับ
หากเป็นเช่นนั้นจริง ผมเกรงว่าความตั้งใจและเวลาที่คุณ PeeTai เสียไปจะเหนื่อยฟรี
ถ้ามีมาตรการรองรับกับปัญหานี้แล้ว ผมก็ยินดีด้วยนะครับ และก็สนับสนุนมากๆ
สุดท้าย มีกรณีศึกษาน่าสนใจ อย่างค่ายมติชนก็ออกพจนานุกรมของตนเอง
จนเป็นที่ยอมรับได้ ถึงแม้ว่า ราชบัญฑิตยสภาจะไม่ค่อยอยากจะยอมรับเลย
น่าขบคิดครับว่า ทำไมมติชนถึงมีพลังขนาดนั้น พลังที่ทำให้สังคมยอมรับกับ
มาตรฐานใหม่ที่เขานำเสนอ
ผมไม่เคยทราบมาก่อนเลยครับคุณเจิ้งลี่ตง ว่าของแบบนี้ต้องให้นักภาษาศาสตร์มากำหนดด้วย T-T เรื่องใหญ่ซะแล้ว