การหาคุณภาพของการทำ Regression เราจะมาดูว่า Model ที่ได้มาใน ตอนที่2 มีคุณภาพแค่ไหน โดยใช้สูตร Root Mean Square Error (RMSE)
โดย yi คือค่าที่ถูกต้อง และ y^i (y ใส่หมวกในสูตร) คือค่าผลลัพธ์ที่ได้จาก Model
ใช้ Data Set ชื่อ Wage จาก package ชื่อ ISLR
ปล. ถ้ารูปเล็กเกินไปก็คลิ๊กที่รูปเพื่อขยายได้ครับ
สร้างความสัมพันธ์เชิงเส้นระหว่างอายุกับรายได้ โดยใช้คำสั่ง lm() สำหรับสร้าง linear regression model และเก็บค่าไว้ในตัวแปล lm_wage
และใช้ model ที่ได้มาใส่ฟังก์ชัน predict() เพื่อหาค่ารายได้ทุกค่าที่ได้จาก model เก็บในตัวแปร pred
คิดค่า RMSE โดยใช้ค่า pred เป็น y ใส่หมวก เปรียบเทียบกับ Wage$wage
ค่า RMSE จะสามารถใช้เทียบประสิทธิภาพระหว่าง model ซึ่ง model ไหนมีค่าน้อยกว่าแสดงว่าดีกว่า




ไม่มีความคิดเห็น:
แสดงความคิดเห็น