วันพุธที่ 28 ตุลาคม พ.ศ. 2558

Machine Learning with R part VII (The quality of a regression)

การหาคุณภาพของการทำ Regression เราจะมาดูว่า Model ที่ได้มาใน ตอนที่2 มีคุณภาพแค่ไหน โดยใช้สูตร Root Mean Square Error (RMSE) 


โดย yi คือค่าที่ถูกต้อง และ y^i (y ใส่หมวกในสูตร) คือค่าผลลัพธ์ที่ได้จาก Model



ใช้ Data Set ชื่อ Wage จาก package ชื่อ ISLR 
ปล. ถ้ารูปเล็กเกินไปก็คลิ๊กที่รูปเพื่อขยายได้ครับ



สร้างความสัมพันธ์เชิงเส้นระหว่างอายุกับรายได้ โดยใช้คำสั่ง lm() สำหรับสร้าง linear regression model  และเก็บค่าไว้ในตัวแปล lm_wage

และใช้ model ที่ได้มาใส่ฟังก์ชัน predict() เพื่อหาค่ารายได้ทุกค่าที่ได้จาก  model เก็บในตัวแปร pred



คิดค่า RMSE โดยใช้ค่า pred เป็น y ใส่หมวก เปรียบเทียบกับ Wage$wage



ค่า RMSE จะสามารถใช้เทียบประสิทธิภาพระหว่าง model ซึ่ง model ไหนมีค่าน้อยกว่าแสดงว่าดีกว่า

ไม่มีความคิดเห็น:

แสดงความคิดเห็น