ช่วงนี้ผมกำลังศึกษาทฤษฎีการสกัดคุณลักษณะเด่นของวัตถุในรูปภาพอยู่ครับ เพราะผมมีจุดประสงค์ในการพัฒนาระบบซอฟต์แวร์เพื่อการจำแนกอัญมณีจากรูปภาพ
พออ่านเปเปอร์ด้านนี้ไปหลาย ๆ ฉบับ ก็สามารถสรุปได้ในระดับหนึ่งว่า สิ่งที่ควรเป็นคุณลักษณะเด่นของวัตถุในรูปภาพก็คือ “ขอบ” และ “มุม” ของวัตถุในรูปภาพ!!!
คือตรงไหนที่ดูเป็น “มุม” หรือเป็น “ขอบ” ก็ตรงนั้นแหล่ะครับที่เป็นคุณลักษณะเด่น หลาย ๆ เปเปอร์เค้าว่างั้น ดังนั้น หลาย ๆ เปเปอร์ก็เลยมุ่งเน้นนำเสนอทฤษฎีในการหา “มุม” และ “ขอบ” ของวัตถุในรูปภาพ ให้แม่น ๆ เก่ง ๆ และเร็ว ๆ
ซึ่งวิธีการหามุมและขอบก็จะคล้าย ๆ กันครับ คือ การแปลงภาพสีให้เป็นภาพเทา การย่อขยายภาพเป็นหลาย ๆ ขนาด การเบลอภาพเพื่อขจัดจุดสีรบกวน การนำภาพที่เบลอแล้วมาหักล้างกัน การแบ่งภาพออกเป็นส่วน ๆ เพื่อหาทิศทางของความเข้มแสง และการตรวจสอบน้ำหนักความเข้มแสงที่คำนวณได้ เพื่อตัดสินใจว่าวัตถุในรูปภาพ มีมุมหรือขอบตรงไหนบ้าง และกินบริเวณขอบเขตแค่ไหน
ด้วยวิธีการของทฤษฎีต่าง ๆ ที่อธิบายเนื้อหาคล้าย ๆ กันตามย่อหน้าข้างบน ทำให้เครื่องจักรสามารถที่จะสกัดคุณลักษณะเด่น (มุมและขอบ) ของวัตถุในรูปภาพได้ ไม่ว่าวัตถุในรูปภาพนั้นจะใหญ่เล็กแค่ไหน จะหมุนเปลี่ยนทิศไปยังไง จะบิดเปลี่ยนทางไปทางใด และจะมืดไปสว่างไปหรือเปล่า
แล้วในเมื่อทฤษฎีที่ถูกคิดค้นขึ้นมาหลาย ๆ เปเปอร์มันดีอย่างนี้ ทำไมผมถึงยังมีปัญหาในการสกัดคุณลักษณะเด่นจากรูปภาพอัญมณีอีกล่ะ ทำไมไม่เอาทฤษฎีมาสร้างซอฟต์แวร์เลย?
คำตอบก็คือ อัญมณีมันมีประกายครับ และประกายก็ถือได้ว่าเป็น “มุม” และ “ขอบ” แบบนึง ดังนั้น เมื่อประกายเปลี่ยนเพราะทิศทางของแสง คุณลักษณะเด่นก็จะเปลี่ยนแปลงไป ถึงแม้จะเป็นอัญมณีเม็ดเดียวกันก็ตาม!!!
ผมยังคงต้องหาเปเปอร์อ่านต่อไปครับ ลำพังไอคิวตัวเองยังไม่ถึงขั้นคิดค้นทฤษฎีเองได้ และบางครั้งถ้าโชคดีหาทฤษฎีที่ใช่พบ แถมมีคนพัฒนา Opensource พวก Library, Framework, SDK, API หรือ Platform ที่ตรงกับทฤษฎีที่ใช่ อันนี้ก็จะยิ่งเฮงขึ้นไปใหญครับ เพราะบอกตามตรงว่าหลายครั้งที่ต้องเขียนโปรแกรมให้สอดคล้องกับทฤษฎี มันไม่ได้ง่ายเลยที่จะปรับประสิทธิภาพของโปรแกรมได้
โพสต์นี้เลยเหมือนเป็นการบ่นปัญหาให้อ่านครับ ไม่ได้นำเสนอวิธีแก้ปัญหาอะไรเป็นรูปธรรม
และถ้าเราจำกัดสภาพแวดล้อมละครับ ในเคสนี้ ยกตัวอย่างว่า แสงมีผลส่งให้เกิดมุม