ตามปรกติแล้วเมื่อนักวิทยาศาสตร์ทำการทดลองใด ๆ ก็จำเป็นที่จะต้องสรุปผล พร้อมทั้งประเมินวิธีในการแก้ปัญหาที่จะเกิดขึ้นให้ครบสมบูรณ์
ผมเองก็พบ bug ตัวใหญ่ 3 ตัวใน Jingjo รุ่น 0.5.0 เช่นกัน โดยจะอธิบายให้ทราบดังนี้
1. อ่านไม่ได้จบศัพท์ จับไปกระเดียด
ลักษณะของ bug คือ คำ ๆ นั้นจริง ๆ ถูกอยู่แล้วถ้าอ่านให้มันจบซะก่อน แต่เป็นเพราะอ่านยังไม่ทันจบ ก็เลยคิดไปเองว่ามันผิด ยกตัวอย่างเช่น คำว่า สร้างสรรค์ เป็นต้น
2. คำผสมไม่ผิด แต่คำโดดดันบอกว่าผิด
เพราะภาษาไทยมีทั้งคำโดดและคำผสม ดังนั้นถ้าคำโดดสะกดอย่างโดดเดี่ยว ก็เป็นไปได้ที่คำนั้นอาจจะผิด แต่หากว่าคำโดดดังกล่าวสะกดผสมกับคำโดดอื่นด้วย ก็จะกลายเป็นว่าคำโดดดังกล่าวถูกต้องไป ยกตัวอย่างเช่น คำว่า อนุญาต เป็นต้น
3. เอาลูกเขามาเลี้ยง เอาเมี่ยงเขามาอม
อันนี้เป็น bug ที่ผมโดนแซวกระจุยเลยครับ 😛 จริง ๆ แล้วผมก็เห็นตั้งแต่ตอนบันทึกแล้วล่ะ อิ อิ โดย bug ตัวนี้เกิดขึ้นเพราะภาษาไทยเขียนติดกันเป็นพรืด ก็เลยทำให้เกิดการเปรียบเทียบคำที่ผิด ดันเอาพยัญชนะของคนล่ะคำมารวมกันให้เป็นคำใหม่ แล้วชี้ลงไปว่าคำนั้นผิด ยกตัวอย่างเช่น ดัชนีตลาดหลักทรัพย์ เป็นต้น
ผมคิดว่าผมจะเริ่มแก้ bug ตัวที่ 1 ก่อน ซึ่งก็ไม่รู้ว่าจะเสร็จเมื่อไหร่ จากนั้นจึงค่อยแก้ bug ตัวที่ 2 ซึ่งงานนี้คงต้องบรรจุพจนานุกรมไทยฉบับราชบัณฑิตยสถาน พ.ศ. 2540 เข้าไว้ในโค้ดแหง ๆ เลย และสำหรับ bug ตัวสุดท้ายคงต้องแก้ด้วยการหาอัลกอริธึมในการตัดคำที่สมบูรณ์แบบนั่นเอง ซึ่งผมคิดว่า…มัน…ยากกกกกกกกกมากกกกกกกกกกกก
โดยสรุปแล้ว bug ทั้ง 3 ตัวนั้น ไม่ใช่แก้กันได้โดยง่าย คงต้องใช้เวลาพักใหญ่เลยทีเดียว กว่า Jingjo จะหลุดจากสถานะ alpha เข้าสู่สถานะ beta ได้
การประมวลผลภาษาไทย ช่างยากอะไรเช่นนี้หนอ T-T
[tags]ประเมินผล, jingjo, wordpress, plugin, ภาษาไทย, ซอฟต์แวร์, คอมพิวเตอร์[/tags]
lexitron มีฐานข้อมูลให้ใช้นะครับ แต่ถ้ามี API ให้ จะเทห์มาก
เอาใจช่วยครับพี่
ปล. ผมยังไม่ได้แก้บั๊กที่ว่าเลยครับ
ลองหา Open Source ของ Firefox ดูสิครับเผื่อเป็นแนวทางได้เพราะมันมีฟังชั่นการทำงานคล้ายกับ Jingjo สังเกตได้เวลาเรากำลัง Comment
ถ้าสำเร็จแล้ว เปิดเป็น Open Source ให้ด้วยนะงับจะเอาไปต่อยอด อิอิ
ถึงขนาดเป็น API เลยเหรอคุณ audy โหย ยากอ่ะ T-T
หาแล้วครับ แต่หาไม่เจอ สงสัยผมจะไม่เชี่ยวเรื่อง firefox เท่าไหร่ครับคุณ DukeSoNiC
มันเป็น wordpress plugin นี่ครับคุณ DominixZ แจกให้ไปใช้ยังไงก็เปลือย source code อยู่แล้ว อิ อิ ^-^