https://towardsdatascience.com/accuracy-precision-recall-or-f1-331fb37c5cb9 https://blog.naver.com/PostView.nhn?blogId=wideeyed&logNo=221531940245
์ผ๋ฐ์ ์ผ๋ก ๋ฌธ์ ๊ฐ ๋๋ ๊ฒฝ์ฐ๋ฅผ positive๋ก ์ค์ ํจ
- ์ฐ์ฒด(positive) ์ํ(negative)
- ๊ฐ์ผ(positive) ๋ฏธ๊ฐ์ผ(negative)
- true case / total case
- positive, negative ๋ฌด์์ด ๋ ์ค์ํ๋์ ๋ฌด๊ดํ๊ฒ, ์ ์ฒด ์ ์ค ๋ง์ถ ์๋ฅผ ๊ตฌํ๋ ๊ฒ์ผ๋ก
- true positive / (true positive + false positive)
- (์์ฑ์ผ๋ก ์์ธกํ๊ฒ) ์ ํํ์ง. ์ ํ๋๋ฅผ ๊ตฌํ๋ ๊ฒ.
- 0~1์ ๊ฐ. 1์ด๋ ์๋ฏธ๋ false positive๊ฐ 0. ๋์ ์๋ก ์ข์
- false postive๊ฐ false negative๋ณด๋ค ๋ ํฌ๊ฒ ๋ฌธ์ ๋๋ ๊ฒฝ์ฐ, ๋ค๋ฅด๊ฒ ๋งํด์, ์์ฑ ์์ธก์ ์ ํํด์ผ ํ๋ ๊ฒฝ์ฐ
- ์: ์ํ(์ํ1, ์ฐ์ฒด0)์ผ๋ก ์์ธกํ ๋์ถ์ด ์ ํํ๊ฒ ์ค์ํจ(์๋ฅผ ๋ค๊ธฐ์ํด ์ํ์ postive๋ก ๋์์ง๋ง, negative๋ก ์ค์ ํ๋๊ฒ ๋ ์ข์)
- true positive / (true positive + false negative)
- TPR(true positive rate), Sensitivity ๋ผ๊ณ ๋ ํจ
- (์ค์ ์์ฑ์) ์ฌํ ํ๋๊ฒ. ์ค์ ์์ฑ์ธ ์ผ์ด์ค๋ค์ ์์ฑ์ผ๋ก ์ฌํํ ํ์จ
- 0~1์ ๊ฐ. 1์ด๋ ์๋ฏธ๋ false negative๊ฐ 0. ๋์ ์๋ก ์ข์
- false negative๊ฐ false positive๋ณด๋ค ๋ ํฌ๊ฒ ๋ฌธ์ ๋๋ ๊ฒฝ์ฐ. ๋ค๋ฅด๊ฒ ๋งํด์, ์ค์ ์์ฑ๋ค์ ๋ชจ๋ ๋ง์ถฐ์ผ ํ๋๋ฐ, ์ค์ ์์ฑ ์ค ์ผ๋ง๋ ๋ง์ถ๋์ง๋ฅผ ๋ณด๋ ๊ฒ
- ์: ํธ๋์ ์ ์ฌ๋ถ๋ฅผ ์๋ชป ํ์งํ์ฌ, false negativeํ ๊ฒฝ์ฐ๊ฐ ๋ง์ผ๋ฉด ๋ ํฌ๋ฆฌํฐ์ปฌ ํ ๊ฒฝ์ฐ์ recall๊ฐ์ ๋ด์ผ ํจ
- ์: ์ค์ ์ฐ์ฒด(์ฐ์ฒด 1, ์ํ 0)ํ ๋์ถ์ ๋ค ๋ง์ถ๋๊ฒ ์ค์.
- ์: ์ค์ ์ฝ๋ก๋ ์์ฑ์ ๋ค ๋ง์ถ๋๊ฒ ์ค์.
- ์ค์ positiveํ ์๋ค์ ์ ๋ฐ๋๋ฅผ ๊ตฌํ๋ ๊ฒ
- ์ด๋ค ๊ฒฝ์ฐ๋ฅผ ์์ฑ์ผ๋ก ๋๋๋์ ๋ฐ๋ผ, Precision์ด๋ Recall์ด ๋ ์ค์ํ์ง ๋ค๋ฆ
- Precision์ ์์ฑ ์์ธกํ ๊ฐ์ด ๋ชจ๋ ์ ํํ๊ฒ ๋ ์ค์ํ ๊ฒฝ์ฐ ํ์ธ
- Recall์ ์ค์ ์์ฑ์ ๋ชจ๋ ์ฌํํ๋๊ฒ ๋ ์ค์ํ ๊ฒฝ์ฐ ํ์ธ
- ์กฐํ ํ๊ท ์ ์ฐ๋์ด์ ๋? https://wikidocs.net/23088
- ์ด๋ค ํ๊ท ์ ์ธ์ง๋ ํด๋น ๊ฐ์ด ๋ฌด์์ธ๊ฐ์ ๋ฐ๋ผ ๋ค๋ฅด๋ค
- ์ฐ์ ํ๊ท : ํฉ์ ํ๊ท
- ๊ธฐํ ํ๊ท : ๊ณฑ์ ํ๊ท
- (์ฌ์ฉ ์: ์ฐ ํ๊ท ์ฆ๊ฐ์จ. ์ฆ๊ฐ ๋น์จ์ ํฉ์ ํ๊ท ์ผ๋ก ๊ตฌํ ์ ์๋ค.)
- ์กฐํ ํ๊ท : 2ab/(a+b)
- ๊ฐ ๋ 10m/s, ์ฌ๋ 20m/s ๋ก ์ฃผํํ์๋ค. ํ๊ท ์๋ ฅ
- ๊ฐ ๋์ ์ฌ๋ ๊ฑธ๋ฆฐ ์๊ฐ์ด ๋ค๋ฅด๋ฏ๋ก, ์๊ฐ์ ๊ฐ์ํ์ฌ ํ๊ท ์๋ ฅ์ ๊ตฌํด์ผ ํจ.
- ์๋ ฅ์ฒ๋ผ, ๋ถ๋ชจ์ ๊ฐ์ด ๋ค๋ฅธ ๊ฒฝ์ฐ์, ์กฐํ ํ๊ท ์ ์ฌ์ฉํ๋ ๋ฏ.
- precision์ ๋ถ๋ชจ๊ฐ ์์ฑ ์์ธก ์, recall์ ๋ถ๋ชจ๊ฐ ์ค์ ์์ฑ ์๋ก ๋ถ๋ชจ๊ฐ ๋ค๋ฆ
- True negative๋ ์ผ๋ฐ์ ์ผ๋ก ๋ณ๋ก ์ ๊ฒฝ ์ ์ฐ๊ณ , positive๊ฐ ๋ง์ ๋ ๋ฌธ์ ๊ฐ ๋จ.
- ์: ์ฝ๋ก๋ ํ์ง์ ์๊ฐ ๋ง๋ค
- ์: ์ฐ์ฒด ์๊ฐ ๋ง๋ค.
- ๊ทธ๋์, true negative๋ฅผ ์ ์ธํ score๊ฐ F1 score
- True Positive Rate = TP / (TP + FN) (recall) ์ค ์์ฑ ์ค ์ง ์์ฑ์ ๋น์จ
- False Negative Rate = FN / (TP + FN) : ์ค์ ์์ฑ ์ค ์์์ฑ์ ๋น์จ. 1 - TPR = FNR
- True Negative Rate = TN / (TN + FP) : ์ค ์์ฑ ์ค ์ง์์ฑ ๋น์จ
- False Positive Rate = FP / (TN + FP) : ์ค ์์ฑ ์ค ์์์ฑ์ ๋น์จ
- Receiver Operator Characteristic
- threshold 0~1 ์ฌ์ด ๋ณํ์ ๋ฐ๋ฅธ, TPR, FPR์ฌ์ด์ ๊ทธ๋ํ
- threshold๊ฐ 0์ด๋ฉด, ์ ๋ถ ์์ฑ ์์ธกํ์ฌ, TPR์ ์ข์์ง๊ณ , FPR์ ๋๋น ์ง
- threshold๊ฐ 1์ด๋ฉด, ์ ๋ถ ์์ฑ ์์ธกํ์ฌ, TPR์ ๋๋น ์ง๊ณ , FPR์ ์ข์์ง
- AUC๊ณก์ ์ ๋ฐ์ ๋์ด
- ๋ฌด์์์ผ ๊ฒฝ์ฐ, 0.5. 0.7 ๋ฏธ๋ง์ ๊ฒฝ์ฐ ์ฐจ์ (Sub-optimal)์ผ๋ก ๊ณ ๋ คํ ์ ์๋ ์ ๋์ด๋ฉฐ, 0.7~0.8์ ์ข์(Good) ์ ๋, 0.8 ์ด์์ ํ๋ฅญํ(Excellent) ์ ๋๋ก ๋ด ๋๋ค
- ๋์ถ์ ์๊ฐ์ด ํ๋ฆ์ ๋ฐ๋ผ, ๋ฐ์ดํฐ์ ํธํฅ์ด ์ง์์ ์ผ๋ก ๋ฐ์ํ๊ฒ ๋จ(์ฐ์ฒด๋ก ์์ธก๋ ๊ฒฝ์ฐ ๋์ถ์ ์์ฃผ๊ธฐ ๋๋ฌธ์, TN, FN ์ ๋ฐ์ดํฐ๋ง ์ง์์ ์ผ๋ก ์์ด๊ณ , ์ ์ฐจ ๋ฒ์๊ฐ TN์ผ๋ก ์ข์์ง)
- ๋ฐ๋ผ์, recall์ด๋ precision์ ์ ๋ต์ ์ ์ ์๊ธฐ๋๋ฌธ์, ์๋ฏธ๊ฐ ์๋ ์์น
- ์ฐ์ฒด์จ = ์ฐ์ฒด ์ / ์ ์ฒด ๋์ถ ์ = false negative / (true negative + false negative)
- ์น์ธ์จ = ์ํ ์์ธก ์ / ์ ์ฒด ์ ์ฒญ ์ = (TN + FN) / (TN + FN + TP + FP)
- TP, FP์ ๋ํ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ๋ฐ, ์น์ธ์จ์ ์ฌ๋ฆฌ๋ ๊ฒ์ FP์ค์ negative๊ฐ ์์ ๊ฐ๋ฅ์ฑ์ ๊ณ ๋ คํ์ฌ, ์ํ์ ๊ฐ์ํ๊ณ , ๋งค์ถ์ ์ฌ๋ฆฌ๊ธฐ ์ํ ์๋
- threshold๋ฅผ ๋ฎ์ถฐ์ ์น์ธ์จ์ ์ฌ๋ ธ์ ๋, ํ์ ๋์ง ์์ ์ฑํฅ์ ๋์ถ์ด ๋๊ฐ๊ฒ ๋๊ณ , ์ฌ๊ธฐ์ ๋ํด์๋, ์ค์ ํผํด๋ฅผ ๊ฒช์ด๋ณด๋ฉด์, ์ง์์ ์ผ๋ก ํ์ตํด์ ๋ณด์ํ ์ ๋ฐ์ ์์
- cutoff ์ ๋ฐ๋ผ 10๊ฐ์ decile๋ก ๋๋๋ค.
- 100๋ช ์ค 80๋ช ์ด ์ํ์ ํ๋ค๋ฉด,
- random์ผ๋ก ๋์ถ ์น์ธ์ 50% ํ๋ฅ ์ด๋ผ๋ฉด,, 10% cutoff๋ 8๋ช ์น์ธ ๋๊ณ ,
- model์ ๋ฐ๋ผ ์น์ธ์, 10% cutoff์ ๋ ๋ง์ ์ฌ๋์ด ์น์ธ ๋ฐ์ ์ ์์์ ๋ณด์ฌ์ค.
- ๊ทธ๋์, cutoff์ ๋ฐ๋ฅธ ์ํ์จ์ ๊ทธ๋ํ๋ก ์ฝ๊ฒ ๋ณด์ฌ ์ค.
- y์ถ์ ๋์ ์ํ์, x์ถ์ 0~1 ์ฌ์ด์ ๊ฐ cut off.
- (x, y)๋ ํน์ cutoff ์ ๋ํ ์ํ ์๋ฅผ ๋ณด์ฌ์ค.
- x: decile, y: cumulative numer of positive observations upto declie
- gain: y/ total number of positive observations : 1 decile์์ 100% ๊ฐ ๋์ด