เอาใจความหลักๆก่อนแล้วกัน
- Machine Learning คือ การให้คอมพิวเตอร์ทำนายผลลัพธ์ โดยใช้ข้อมูลพื้นฐานจาก attribute ที่รู้จักมาก่อนจากขั้นตอนการ train
- Data Mining คือ การค้นพบความรู้จากข้อมูล โดยข้อมูลที่ใช้เพื่อการค้นพบนั้นเป็น attribute ที่ไม่เคยรู้จักมาก่อน
ดังนั้น ความแตกต่างของทั้งสองอย่างอยู่ที่กริยาของพวกมัน เพราะอย่างนึงคิดค้นขึ้นเพื่อการ “ทำนาย” ส่วนอีกตัวนึงคิดค้นขึ้นเพื่อการ “ค้นพบ” ส่วนสิ่งที่เหมือนกันของทั้งสองอย่างคือ “ข้อมูล” เพราะในแง่ของ Machine Learning นั้น การมีข้อมูลนำเข้าที่มาก จะทำให้การทำนายมีความแม่นยำมากยิ่งขึ้น ส่วนแง่ของ Data Mining นั้น การมีข้อมูลยิ่งมากเท่าไหร่ ก็ยิ่งจะทำให้สามารถค้นพบ Pattern เพื่อจะประเมินเป็นความรู้ได้มากเท่านั้น
สรุปแล้ว ข้อมูลคือสิ่งสำคัญที่สุดสำหรับ Machine Learning กับ Data Mining ครับ ดังนั้น เราต้องเริ่มจากข้อมูลก่อน แล้วค่อยเอาทฤษฎีการคำนวณ และทฤษฎีการประมวลผลสารสนเทศมาดำเนินการต่อไป
ไม่เห็นด้วยกับ blog นี้ครับ มีการแปรความหมายที่ผิดเพี้ยน