Skip to content

Latest commit

ย 

History

History
96 lines (75 loc) ยท 5.68 KB

File metadata and controls

96 lines (75 loc) ยท 5.68 KB

Metric

https://towardsdatascience.com/accuracy-precision-recall-or-f1-331fb37c5cb9 https://blog.naver.com/PostView.nhn?blogId=wideeyed&logNo=221531940245

์ผ๋ฐ˜์ ์œผ๋กœ ๋ฌธ์ œ๊ฐ€ ๋˜๋Š” ๊ฒฝ์šฐ๋ฅผ positive๋กœ ์„ค์ •ํ•จ

  • ์—ฐ์ฒด(positive) ์ƒํ™˜(negative)
  • ๊ฐ์—ผ(positive) ๋ฏธ๊ฐ์—ผ(negative)

Accuracy : ์ •ํ™•๋„.

  • true case / total case
  • positive, negative ๋ฌด์—‡์ด ๋” ์ค‘์š”ํ•˜๋ƒ์™€ ๋ฌด๊ด€ํ•˜๊ฒŒ, ์ „์ฒด ์ˆ˜ ์ค‘ ๋งž์ถ˜ ์ˆ˜๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์œผ๋กœ

Precision : ์ •๋ฐ€๋„. positive์˜ˆ์ธก์˜ ์ •ํ™•๋„

  • true positive / (true positive + false positive)
  • (์–‘์„ฑ์œผ๋กœ ์˜ˆ์ธกํ•œ๊ฒŒ) ์ •ํ™•ํ•œ์ง€. ์ •ํ™•๋„๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ.
  • 0~1์˜ ๊ฐ’. 1์ด๋ž€ ์˜๋ฏธ๋Š” false positive๊ฐ€ 0. ๋†’์„ ์ˆ˜๋ก ์ข‹์Œ
  • false postive๊ฐ€ false negative๋ณด๋‹ค ๋” ํฌ๊ฒŒ ๋ฌธ์ œ๋˜๋Š” ๊ฒฝ์šฐ, ๋‹ค๋ฅด๊ฒŒ ๋งํ•ด์„œ, ์–‘์„ฑ ์˜ˆ์ธก์€ ์ •ํ™•ํ•ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ
    • ์˜ˆ: ์ƒํ™˜(์ƒํ™˜1, ์—ฐ์ฒด0)์œผ๋กœ ์˜ˆ์ธกํ•œ ๋Œ€์ถœ์ด ์ •ํ™•ํ•œ๊ฒŒ ์ค‘์š”ํ•จ(์˜ˆ๋ฅผ ๋“ค๊ธฐ์œ„ํ•ด ์ƒํ™˜์„ postive๋กœ ๋†“์•˜์ง€๋งŒ, negative๋กœ ์„ค์ •ํ•˜๋Š”๊ฒŒ ๋” ์ข‹์Œ)

Recall : ์žฌํ˜„์œจ. ์‹ค์–‘์„ฑ ์ค‘ ์ง„์–‘์„ฑ์„ ์žฌํ˜„ํ•œ ๋น„์œจ

  • true positive / (true positive + false negative)
  • TPR(true positive rate), Sensitivity ๋ผ๊ณ ๋„ ํ•จ
  • (์‹ค์ œ ์–‘์„ฑ์„) ์žฌํ˜„ ํ•˜๋Š”๊ฒƒ. ์‹ค์ œ ์–‘์„ฑ์ธ ์ผ€์ด์Šค๋“ค์„ ์–‘์„ฑ์œผ๋กœ ์žฌํ˜„ํ•  ํ™•์œจ
  • 0~1์˜ ๊ฐ’. 1์ด๋ž€ ์˜๋ฏธ๋Š” false negative๊ฐ€ 0. ๋†’์„ ์ˆ˜๋ก ์ข‹์Œ
  • false negative๊ฐ€ false positive๋ณด๋‹ค ๋” ํฌ๊ฒŒ ๋ฌธ์ œ๋˜๋Š” ๊ฒฝ์šฐ. ๋‹ค๋ฅด๊ฒŒ ๋งํ•ด์„œ, ์‹ค์ œ ์–‘์„ฑ๋“ค์€ ๋ชจ๋‘ ๋งž์ถฐ์•ผ ํ•˜๋Š”๋ฐ, ์‹ค์ œ ์–‘์„ฑ ์ค‘ ์–ผ๋งˆ๋‚˜ ๋งž์ถ”๋Š”์ง€๋ฅผ ๋ณด๋Š” ๊ฒƒ
    • ์˜ˆ: ํŠธ๋žœ์ ์…˜ ์—ฌ๋ถ€๋ฅผ ์ž˜๋ชป ํƒ์ง€ํ•˜์—ฌ, false negativeํ•œ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์œผ๋ฉด ๋” ํฌ๋ฆฌํ‹ฐ์ปฌ ํ•œ ๊ฒฝ์šฐ์— recall๊ฐ’์„ ๋ด์•ผ ํ•จ
    • ์˜ˆ: ์‹ค์ œ ์—ฐ์ฒด(์—ฐ์ฒด 1, ์ƒํ™˜ 0)ํ•œ ๋Œ€์ถœ์„ ๋‹ค ๋งž์ถ”๋Š”๊ฒŒ ์ค‘์š”.
    • ์˜ˆ: ์‹ค์ œ ์ฝ”๋กœ๋‚˜ ์–‘์„ฑ์„ ๋‹ค ๋งž์ถ”๋Š”๊ฒŒ ์ค‘์š”.
  • ์‹ค์ œ positiveํ•œ ์–˜๋“ค์˜ ์ •๋ฐ€๋„๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ

Precision vs Recall

  • ์–ด๋–ค ๊ฒฝ์šฐ๋ฅผ ์–‘์„ฑ์œผ๋กœ ๋†“๋А๋ƒ์— ๋”ฐ๋ผ, Precision์ด๋‚˜ Recall์ด ๋” ์ค‘์š”ํ•œ์ง€ ๋‹ค๋ฆ„
  • Precision์€ ์–‘์„ฑ ์˜ˆ์ธกํ•œ ๊ฐ’์ด ๋ชจ๋‘ ์ •ํ™•ํ•œ๊ฒŒ ๋” ์ค‘์š”ํ•œ ๊ฒฝ์šฐ ํ™•์ธ
  • Recall์€ ์‹ค์ œ ์–‘์„ฑ์„ ๋ชจ๋‘ ์žฌํ˜„ํ•˜๋Š”๊ฒŒ ๋” ์ค‘์š”ํ•œ ๊ฒฝ์šฐ ํ™•์ธ

F1 score : Precision๊ณผ Recall์˜ ์กฐํ™” ํ‰๊ท 

  • ์กฐํ™” ํ‰๊ท ์„ ์“ฐ๋Š”์ด์œ ๋Š”? https://wikidocs.net/23088
    • ์–ด๋–ค ํ‰๊ท ์„ ์“ธ์ง€๋Š” ํ•ด๋‹น ๊ฐ’์ด ๋ฌด์—‡์ธ๊ฐ€์— ๋”ฐ๋ผ ๋‹ค๋ฅด๋‹ค
    • ์‚ฐ์ˆ  ํ‰๊ท  : ํ•ฉ์˜ ํ‰๊ท 
    • ๊ธฐํ•˜ ํ‰๊ท  : ๊ณฑ์˜ ํ‰๊ท 
      • (์‚ฌ์šฉ ์˜ˆ: ์—ฐ ํ‰๊ท  ์ฆ๊ฐ€์œจ. ์ฆ๊ฐ€ ๋น„์œจ์€ ํ•ฉ์˜ ํ‰๊ท ์œผ๋กœ ๊ตฌํ•  ์ˆ˜ ์—†๋‹ค.)
    • ์กฐํ™” ํ‰๊ท  : 2ab/(a+b)
      • ๊ฐˆ ๋•Œ 10m/s, ์˜ฌ๋•Œ 20m/s ๋กœ ์ฃผํ–‰ํ•˜์˜€๋‹ค. ํ‰๊ท  ์†๋ ฅ
      • ๊ฐˆ ๋•Œ์™€ ์˜ฌ๋•Œ ๊ฑธ๋ฆฐ ์‹œ๊ฐ„์ด ๋‹ค๋ฅด๋ฏ€๋กœ, ์‹œ๊ฐ„์„ ๊ฐ์•ˆํ•˜์—ฌ ํ‰๊ท  ์†๋ ฅ์„ ๊ตฌํ•ด์•ผ ํ•จ.
      • ์†๋ ฅ์ฒ˜๋Ÿผ, ๋ถ„๋ชจ์˜ ๊ฐ’์ด ๋‹ค๋ฅธ ๊ฒฝ์šฐ์—, ์กฐํ™” ํ‰๊ท ์„ ์‚ฌ์šฉํ•˜๋Š” ๋“ฏ.
      • precision์€ ๋ถ„๋ชจ๊ฐ€ ์–‘์„ฑ ์˜ˆ์ธก ์ˆ˜, recall์€ ๋ถ„๋ชจ๊ฐ€ ์‹ค์ œ ์–‘์„ฑ ์ˆ˜๋กœ ๋ถ„๋ชจ๊ฐ€ ๋‹ค๋ฆ„

Accuracy vs F1 score

  • True negative๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ๋ณ„๋กœ ์‹ ๊ฒฝ ์•ˆ ์“ฐ๊ณ , positive๊ฐ€ ๋งŽ์„ ๋•Œ ๋ฌธ์ œ๊ฐ€ ๋จ.
    • ์˜ˆ: ์ฝ”๋กœ๋‚˜ ํ™•์ง„์ž ์ˆ˜๊ฐ€ ๋งŽ๋‹ค
    • ์˜ˆ: ์—ฐ์ฒด ์ˆ˜๊ฐ€ ๋งŽ๋‹ค.
  • ๊ทธ๋ž˜์„œ, true negative๋ฅผ ์ œ์™ธํ•œ score๊ฐ€ F1 score

TPR, FPR

  • True Positive Rate = TP / (TP + FN) (recall) ์‹ค ์–‘์„ฑ ์ค‘ ์ง„ ์–‘์„ฑ์˜ ๋น„์œจ
  • False Negative Rate = FN / (TP + FN) : ์‹ค์ œ ์–‘์„ฑ ์ค‘ ์œ„์Œ์„ฑ์˜ ๋น„์œจ. 1 - TPR = FNR
  • True Negative Rate = TN / (TN + FP) : ์‹ค ์Œ์„ฑ ์ค‘ ์ง„์Œ์„ฑ ๋น„์œจ
  • False Positive Rate = FP / (TN + FP) : ์‹ค ์Œ์„ฑ ์ค‘ ์œ„์–‘์„ฑ์˜ ๋น„์œจ

ROC, AUC

  • Receiver Operator Characteristic
  • threshold 0~1 ์‚ฌ์ด ๋ณ€ํ™”์— ๋”ฐ๋ฅธ, TPR, FPR์‚ฌ์ด์˜ ๊ทธ๋ž˜ํ”„
  • threshold๊ฐ€ 0์ด๋ฉด, ์ „๋ถ€ ์–‘์„ฑ ์˜ˆ์ธกํ•˜์—ฌ, TPR์€ ์ข‹์•„์ง€๊ณ , FPR์€ ๋‚˜๋น ์ง
  • threshold๊ฐ€ 1์ด๋ฉด, ์ „๋ถ€ ์Œ์„ฑ ์˜ˆ์ธกํ•˜์—ฌ, TPR์€ ๋‚˜๋น ์ง€๊ณ , FPR์€ ์ข‹์•„์ง

AUROC

  • AUC๊ณก์„ ์˜ ๋ฐ‘์˜ ๋„“์ด
  • ๋ฌด์ž‘์œ„์ผ ๊ฒฝ์šฐ, 0.5. 0.7 ๋ฏธ๋งŒ์˜ ๊ฒฝ์šฐ ์ฐจ์„ (Sub-optimal)์œผ๋กœ ๊ณ ๋ คํ•  ์ˆ˜ ์žˆ๋Š” ์ •๋„์ด๋ฉฐ, 0.7~0.8์€ ์ข‹์€(Good) ์ •๋„, 0.8 ์ด์ƒ์€ ํ›Œ๋ฅญํ•œ(Excellent) ์ •๋„๋กœ ๋ด…๋‹ˆ๋‹ค

๋Œ€์ถœ ์„ฑ๋Šฅ ์ง€ํ‘œ

  • ๋Œ€์ถœ์€ ์‹œ๊ฐ„์ด ํ๋ฆ„์— ๋”ฐ๋ผ, ๋ฐ์ดํ„ฐ์˜ ํŽธํ–ฅ์ด ์ง€์†์ ์œผ๋กœ ๋ฐœ์ƒํ•˜๊ฒŒ ๋จ(์—ฐ์ฒด๋กœ ์˜ˆ์ธก๋œ ๊ฒฝ์šฐ ๋Œ€์ถœ์„ ์•ˆ์ฃผ๊ธฐ ๋•Œ๋ฌธ์—, TN, FN ์˜ ๋ฐ์ดํ„ฐ๋งŒ ์ง€์†์ ์œผ๋กœ ์Œ“์ด๊ณ , ์ ์ฐจ ๋ฒ”์œ„๊ฐ€ TN์œผ๋กœ ์ข์•„์ง)
    • ๋”ฐ๋ผ์„œ, recall์ด๋‚˜ precision์€ ์ •๋‹ต์„ ์•Œ ์ˆ˜ ์—†๊ธฐ๋•Œ๋ฌธ์—, ์˜๋ฏธ๊ฐ€ ์—†๋Š” ์ˆ˜์น˜
  • ์—ฐ์ฒด์œจ = ์—ฐ์ฒด ์ˆ˜ / ์ „์ฒด ๋Œ€์ถœ ์ˆ˜ = false negative / (true negative + false negative)
  • ์Šน์ธ์œจ = ์ƒํ™˜ ์˜ˆ์ธก ์ˆ˜ / ์ „์ฒด ์‹ ์ฒญ ์ˆ˜ = (TN + FN) / (TN + FN + TP + FP)
    • TP, FP์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ถ€์กฑํ•œ๋ฐ, ์Šน์ธ์œจ์„ ์˜ฌ๋ฆฌ๋Š” ๊ฒƒ์€ FP์ค‘์— negative๊ฐ€ ์žˆ์„ ๊ฐ€๋Šฅ์„ฑ์„ ๊ณ ๋ คํ•˜์—ฌ, ์œ„ํ—˜์„ ๊ฐ์ˆ˜ํ•˜๊ณ , ๋งค์ถœ์„ ์˜ฌ๋ฆฌ๊ธฐ ์œ„ํ•œ ์‹œ๋„
    • threshold๋ฅผ ๋‚ฎ์ถฐ์„œ ์Šน์ธ์œจ์„ ์˜ฌ๋ ธ์„ ๋•Œ, ํŒŒ์•…๋˜์ง€ ์•Š์€ ์„ฑํ–ฅ์˜ ๋Œ€์ถœ์ด ๋‚˜๊ฐ€๊ฒŒ ๋˜๊ณ , ์—ฌ๊ธฐ์— ๋Œ€ํ•ด์„œ๋Š”, ์‹ค์ œ ํ”ผํ•ด๋ฅผ ๊ฒช์–ด๋ณด๋ฉด์„œ, ์ง€์†์ ์œผ๋กœ ํ•™์Šตํ•ด์„œ ๋ณด์™„ํ•  ์ˆ˜ ๋ฐ–์— ์—†์Œ

Gain Chart

  • cutoff ์— ๋”ฐ๋ผ 10๊ฐœ์˜ decile๋กœ ๋‚˜๋ˆˆ๋‹ค.
  • 100๋ช… ์ค‘ 80๋ช…์ด ์ƒํ™˜์„ ํ–ˆ๋‹ค๋ฉด,
  • random์œผ๋กœ ๋Œ€์ถœ ์Šน์ธ์‹œ 50% ํ™•๋ฅ ์ด๋ผ๋ฉด,, 10% cutoff๋Š” 8๋ช… ์Šน์ธ ๋˜๊ณ ,
  • model์— ๋”ฐ๋ผ ์Šน์ธ์‹œ, 10% cutoff์— ๋” ๋งŽ์€ ์‚ฌ๋žŒ์ด ์Šน์ธ ๋ฐ›์„ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์คŒ.
  • ๊ทธ๋ž˜์„œ, cutoff์— ๋”ฐ๋ฅธ ์ƒํ™˜์œจ์„ ๊ทธ๋ž˜ํ”„๋กœ ์‰ฝ๊ฒŒ ๋ณด์—ฌ ์คŒ.
  • y์ถ•์€ ๋ˆ„์  ์ƒํ™˜์ˆ˜, x์ถ•์€ 0~1 ์‚ฌ์ด์˜ ๊ฐ cut off.
  • (x, y)๋Š” ํŠน์ • cutoff ์— ๋Œ€ํ•œ ์ƒํ™˜ ์ˆ˜๋ฅผ ๋ณด์—ฌ์คŒ.
  • x: decile, y: cumulative numer of positive observations upto declie
  • gain: y/ total number of positive observations : 1 decile์—์„œ 100% ๊ฐ€ ๋‚˜์˜ด