Universal Image Recognition

ปัจจุบัน Search Engine ชื่อดังล้วนเปิดให้เราค้นหารูปภาพได้ โดยการใส่คำค้นที่เราต้องการลงไป แล้วมันก็จะจัดแจงแสดงภาพที่เกี่ยวข้องกับคำค้นออกมา!!!

แต่ถ้ารูปภาพที่เราต้องการค้นนั้น มันไม่มีคำให้ค้นล่ะ อือม หมายถึง … ยกตัวอย่างเช่น มีใครซักคนนึงวาดรูปโลโก้ของผลิตภัณฑ์ชนิดหนึ่งมาให้เรา แถมวาดออกมาก็ไม่เหมือนของจริงซะทีเดียว แค่คล้าย ๆ อ่ะ แล้วก็มาถามเราว่าจะค้นจากคอมพิวเตอร์ได้มั้ย? ว่ารูปโลโก้ดังกล่าวมันเป็นของสินค้ายี่ห้ออะไร?

เอ่อ … งั้นก็คงต้องตอบว่า ไม่ได้อ่ะ ไอ้เจ้า Google กับ Yahoo มันทำไม่ได้ T-T

สาเหตุที่ต้องตอบว่าไม่ได้ก็เพราะว่า การค้นของ Search Engine มันไม่ได้ใช้เทคนิค Pattern Recognition อ่ะดิ แต่ถ้าจะให้มนุษย์ค้นให้ล่ะก็ซำบายมาก เพราะสมองของมนุษย์เรานั้นได้บรรจุกลไกของ Pattern Recognition เอาไว้อย่างเต็มเปี่ยม ต่อให้รูปภาพต้นแบบมันจะบิดเบี้ยว บู้บี้ โย้เย้ ผิดรูป หรือ ผิดสี เพียงไร มนุษย์ก็จะสามารถเดาได้ลาง ๆ อยู่ดีว่ามันน่าจะเป็นรูปภาพอะไร!!!

อือม แต่จากประสบการณ์ที่เคยทำ Pattern Recognition มาต้องขอบอกว่า ไอ้การทำ Pattern Recognition นั้น มันค่อนข้างจะกินทรัพยากรของคอมพิวเตอร์น่าดู เพราะมันไม่เหมือนกับการค้นหาคำ ที่เราสามารถใช้รหัส UTF-8 (สามไบต์) หรือ UTF-16 (สองไบต์) ในการเป็นสิ่งบ่งจำเพาะสำหรับค้นหาได้โดยตรง เนื่องจากการทำ Pattern Recognition นั้น เราจำเป็นที่จะต้องหา “ชุดตัวเลข” ของสิ่งบ่งจำเพาะ เพื่อใช้สำหรับเป็นเอกลักษณ์ของ Pattern นั้น ๆ และหนำซ้ำ “ชุดตัวเลข” ที่คำนวณออกมาได้ ยังอาจจะเป็นชุดตัวเลขสองมิติอีกต่างหาก ซึ่งถึงแม้มันจะช่วยให้ Pattern มีเอกลักษณ์โดดเด่นขึ้น แต่นั่นก็หมายถึงความสาหัสของการประมวลผลที่มากขึ้นเป็นทวีคูณ!

ประเด็นถัดมาก็คือเทคโนโลยีที่จะต้องใช้ เนื่องจากรูปภาพที่จะใช้ในการค้นนั้น มันเป็นได้หลายอย่าง ไม่ว่าจะเป็นรูปภาพของโลโก้, วิวทิวทัศน์, ลายมือ, ลายเซ็น หรือ หน้าคน เป็นต้น ซึ่ง Pattern เหล่านี้ล้วนใช้เทคโนโลยีที่แตกต่างกัน ยกตัวอย่างเช่น ถ้าจะค้นรูปภาพธรรมดา เราก็สามารถจะใช้เทคโนโลยี Pattern Recognition ได้ แต่ถ้าหากเราจะตรวจรู้ลายเซ็น เราก็จำเป็นต้องใช้เทคโนโลยี Optical Character Recognition หรือหากเราต้องค้นรูปหน้าของคน เราก็ต้องเปลี่ยนไปใช้เทคโนโลยี Facial Recognition เป็นต้น

จากตัวอย่างข้างต้นจะเห็นว่า การจะทำ Universal Image Search Engine นั้นเป็นเรื่องหินชาติพอสมควร เพราะเราต้องใช้เทคโนโลยีหลาย ๆ อย่างเข้ามาช่วย ไม่ว่าจะเป็น …

1. แขนงทาง Pattern Recognition เช่น Optical Character Recognition, Digital Image Processing หรือ Optical Mark Recognition เป็นต้น

2. แขนงทาง Biometrics เช่น Facial Recognition, Iris Recognition หรือ Fingerprint Recognition เป็นต้น

โดยส่วนตัวแล้วมองว่า ถ้าทุกครั้งที่เราต้องการหาคำตอบว่ารูปภาพที่เราอยากค้น มันคือรูปภาพของอะไร? แล้วเราต้องให้คอมพิวเตอร์ใช้ทุกเทคโนโลยีข้างต้น เข้ามารุมตรวจสอบรูปภาพดังกล่าว มันคงจะสาหัสน่าดู ดังนั้นก็เลยคิดว่า มันน่าจะเป็นไปได้ ที่จะสามารถนำเอาเทคโนโลยีทั้งหมดมารวมกัน ให้กลายเป็น Universal Pattern Recognition ได้!!!

ขนาดในทางฟิสิกส์อนุภาค นักวิทยาศาสตร์ยังคิดกันหัวหกก้นขวิด ว่าจะรวมแรงทั้ง 4 อันได้แก่ แรงนิวเคลียร์อย่างอ่อน, แรงนิวเคลียร์อย่างเข้ม, แรงแม่เหล็กไฟฟ้า และ แรงโน้มถ่วง เข้าไว้ด้วยกันได้ยังไง งั้น … ในทางวิทยาศาสตร์คอมพิวเตอร์ ก็น่าจะสามารถคิดค้นวิธีการรวมเทคโนโลยีการประมวลผลภาพทั้งหลาย เพื่อให้กลายเป็น Universal Image Recognition ได้เหมือนกันอ่ะดิ อิ อิ เอาแบบว่าสมการชุดเดียว ใช้กับรูปภาพได้ทุกรูปแบบไปเลย 😛 (สงสัยงานนี้ต้องรอกันอีกนาน)

[tags]Universal, Image, Recognition, Pattern Recognition, Biometrics[/tags]

จำนวนการอ่าน : 145

5 thoughts on “Universal Image Recognition”

Google ใช้วิธี Collective Intelligent ครับ ให้ผู้ใช้เว็บมาช่วยกันนิยามรูปภาพซะเลย

http://images.google.com/imagelabeler/

MacroArt – Google พ่อเว็บ 2.0 ทุกสถาบัน

เว็บนี้น่าจะค้นได้อย่างที่พี่ไท้ต้องการนะคับ
อัพรูปขึ้นไป เด๋วมันหารูปใกล้เคียงให้
ซึ่งก็น่าจะใช้ได้ระดับนึงแล้วล่ะครับ
http://tineye.com/

ป.ล. ตอนนี้ google เริ่มใส่ function สำหรับ search image มากขึ้นแล้วนะครับ ล่าสุดเห็นมีค้นรูปตามสีด้วย

แวะมานิดนึง
พอดีเห็น entry นึงจาก google research blog พูดถึงเรื่อง image recognizing เลยเอามาแปะ เผื่อมีใครสนใจ

http://googleresearch.blogspot.com/2009/06/new-landmark-in-computer-vision.html

โอ้ ผมเพิ่งรู้แฮะคุณ MacroArt ถ้าแบบนี้มันเรียกว่า Human-based Computation เลยนะนั่น

555 ขำคุณ crucifier

เข้าไปดูแล้ว แต่ยังไม่ได้ลองเลยอ่ะคุณ AMp

Cookie	Duration	Description
cookielawinfo-checbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Universal Image Recognition

Related Posts

ปัญหาการสกัดคุณลักษณะเด่นจากรูปภาพอัญมณี

อัลกอริทึมสำหรับจำแนกพลอยสี

5 thoughts on “Universal Image Recognition”

ใส่ความเห็น