2020. 11. 1. 00:49ใComputer Science/Machine Learning๐ป
- p-value๋ ๋ฌด์์ธ๊ฐ?
๊ท๋ฌด๊ฐ์ค์ด ๋ง๋ค๋ ์ ์ ํ์ ํ๋ณธ์์ ์ค์ ๋ก ๊ด์ธก๋ ํต๊ณ์น์ ๊ฐ๊ฑฐ๋ ๋ ๊ทน๋จ์ ์ธ ํต๊ณ์น๊ฐ ๊ด์ธก๋ ํ๋ฅ .
P-value๋ ๋ด๊ฐ ๋ฝ์ ํ๋ณธํ๊ท ์ด ๊ท๋ฌด๊ฐ์ค์ ๋ฐ๋ผ ๋์ฌ ํ๋ฅ ์ด ๋ช %๊ฐ ๋์๋๊ฐ๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ด๋ค
์๋ฅผ ๋ค์ด ๋ ํ๋ณธ ํ๊ท ์ ์ฐจ์ด๋ฅผ ๊ฒ์ฆํ๋ค๊ณ ํ ๋, ๋ ํ๋ณธ ์ง๋จ์ ๋ชจ์ง๋จ์ด ๊ฐ๋ค๋ ๊ฐ์ ์ ์ ์ ํ์ฌ ํต๊ณ๋ฅผ ์งํํ๋ค.
- R-Square์ ์๋ฏธ๋ ๋ฌด์์ธ๊ฐ?
๊ฒฐ์ ๊ณ์๋ผ๊ณ ๋ถ๋ฆฌ๋ฉฐ, ํ๊ท๋ชจํ์ ์ค๋ช ๋ ฅ์ ํํํ ๊ฒ. 0์ ๊ฐ๊น์ธ์๋ก ์ค๋ช ๋ ฅ์ด ๋ฎ๊ณ , 1์ ๊ฐ๊น์ธ์๋ก ๋๋ค.
R-squred๋ 1-SSE/SST(SSR/SST)๋ก ๊ตฌํ ์ ์์ผ๋ฉฐ, SST๋ Sum of squre Total์ด๋ฉฐ, SSE๋ Sum of squre of error์ด๋ค. SST๋ ์ค์ ๊ฐ๊ณผ ์์ธก๊ฐ, ํ๊ท ๊ฐ ์ฌ์ด์ ๋ฐ์ํ ์ฐจ์ด์ด๋ฉฐ, SSE๋ ํ๊ท์๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด๋ฅผ ์๋ฏธํ๋ค.
SSR์ Sum of square Regression์ผ๋ก, ํ๊ท์๊ณผ ํ๊ท ๊ฐ์ ์ฐจ์ด์ด๋ค. ์ฆ, SSR์ด ๋์์ง์๋ก R-Squred๋ ๋์์ง๋ค.
- missing value๊ฐ ์์ ๊ฒฝ์ฐ ์ด๋ป๊ฒ ์ฒ๋ฆฌํด์ผํ๋๊ฐ?
๊ฐ์ฅ ํฌ๊ฒ๋ 2๊ฐ์ง๋ก ๋๋ ์ ์๋ค. 1) ์ ๊ฑฐํ๊ฑฐ๋, 2)์ฑ์ฐ๊ฑฐ๋.
์ ๊ฑฐ์ ๊ฒฝ์ฐ ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋ ์ ์ฒด ํ์ ์ญ์ ํ๊ฑฐ๋ ๋จ์ผ๊ฐ์ ์ญ์ ํ๋ ๋ฐฉ๋ฒ์ด ์๋ค.
๋ฐ๋ฉด ์ฑ์ฐ๊ณ ๋ณด๊ฐํ๋ ๊ฒฝ์ฐ ํ๊ท /์ค์๊ฐ/์์ธก๊ฐ๋ฑ์ ์ถ๊ฐํ๊ณค ํ๋ค.
- ์๊ด๊ด๊ณ์ ์ธ๊ณผ๊ด๊ณ์ ๋ํด ์ค๋ช ํ๋ผ
์ธ๊ณผ๊ด๊ณ๋ ํน์ ํ ์ฌ๊ฑด์ด ๋ค๋ฅธ ์ฌ๊ฑด์ ์ง์ ์ ์ผ๋ก ์ํฅ์ ์ฃผ๋ ๊ฒ์ ์๋ฏธํ๋ค. (ex/๋ฌผ์ ์ด์ ๊ฐํ๋ฉด, ๋๋๋ค.)
์๊ด๊ด๊ณ๋ ๋ ๊ฐ์ง ์ฌ๊ฑด์ ์ฐ๊ด์ฑ์ด ์กด์ฌํ๋ ์ํ์์ ์๋ฏธํ๋ค.
๊ทธ๋ฌ๋ ์ด๋ฌํ ์ฐ๊ด์ฑ์ ์์ด ์์ธ์ด ์กด์ฌํ๊ณ ๊ทธ์ ๋ฐ๋ฅธ ๊ฒฐ๊ณผ์ธ์ง๋ ์ ์ ์๋ค.
์ธ๊ณผ๊ด๊ณ๋ ์๊ด๊ด๊ณ์ ํฌํจ๋๋ ๊ด๊ณ์ด๋ค.
- Cost function์ด๋?
์ค์ ๊ฐ๊ณผ ์์ธก๊ฐ์ ๋ํ ์ค์ฐจ์ ๋ํ ์. ๋ํ ๋น์ฉ ํจ์๋ ์ค์ฐจ ํํ์์ ๋์๊ฐ ์์ธก๊ฐ์ ์ค์ฐจ๋ฅผ ์ค์ด๋ ์ผ์ ์ต์ ํ๋ ์์ด์ด์ผ ํ๋ค. ํ๊ท๋ฌธ์ ์ ๊ฒฝ์ฐ, MSE๊ฐ ์ฌ์ฉ๋๋ค. ์ด๋ฌํ ๋ฌธ์ ์ํฉ์์, ์ ํ ํ๊ท๋ฅผ ํฌํจํ ๋ค์ํ ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋์์์ ํ์ต์ ๋น์ฉํจ์๋ฅผ ์ต์ํํ๋ ๋งค๊ฐ๋ณ์์ธ W(๊ฐ์ค์น)์ b๋ฅผ ์ฐพ๋ ์์ ์ ์ํํด์ผํ๋ค.
์ด๋ ์ฌ์ฉ๋๋ ์๊ณ ๋ฆฌ์ฆ์ Optimizer, ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค. ๊ทธ์ค์์๋ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก
๊ฒฝ์ฌํ๊ฐ๋ฒ(Gradient Descent)๊ฐ ์๋ค.
๊ฐ์ค์น W๋ง์ ์ฌ์ฉํ y=Wx๋ผ๋ ๊ฐ์ค์ ๊ฐ์ง๊ณ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์ํํ์ ๋, W์ cost(W)์์ ๊ด๊ณ๋ ๋ค์๊ณผ ๊ฐ๋ค.
๊ธฐ์ธ๊ธฐ W๊ฐ ๋ฌดํ๋๋ก ์ปค์ง๋ฉด cost์ ๊ฐ ๋ํ ๋ฌดํ๋๋ก ์ปค์ง๊ณ , ๋ฐ๋ฉด W๊ฐ ๋ฌดํ๋๋ก ์์์ ธ๋ cost์ ๊ฐ์ ๋ฌดํ๋๋ก ์ปค์ง๋ค. ๋ชจ๋ธ์ด ํด์ผํ๋ ์ผ์ cost๊ฐ ๊ฐ์ฅ ์ต์์ ๊ฐ์ ๊ฐ์ง๊ฒ ํ๋ W๋ฅผ ์ฐพ๋ ์ผ์ด๋ค.
๊ธฐ๊ณ๋ ์์์ ๋๋ค๊ฐ W๊ฐ์ ์ ํ ํ ๊ฐ์ฅ ์ต์๊ฐ์ธ cost๋ฅผ ํฅํด W๊ฐ์ ์์ ํ๋ค. ๊ฐ์ฅ ์ต์๊ฐ์ ๊ฐ๊น์ธ ๊ฒฝ์ฐ ๊ธฐ์ธ๊ธฐ๋ 0์ด ๋๋ฉฐ, ๋น์ฉํจ์๋ ๋ค์๊ณผ ๊ฐ๋ค.
๊ทธ๋ฆฌ๊ณ ๋น์ฉ์ ์ต์ํํ๋ W๋ฅผ ๊ตฌํ๊ธฐ์ํด w๋ฅผ ์ ๋ฐ์ดํธํ๋ ๊ณต์์ ๋ค์๊ณผ ๊ฐ๋ค.
๊ทธ๋ฌ๋ classification์์๋ ๋น์ฉํจ์๋ก MSE๋ฅผ ์ฌ์ฉํ์ง ์๋๋ค. ๊ทธ ์ด์ ๋ ์๊ทธ๋ชจ์ด๋ ํจ์์ ๋น์ฉํจ์๋ฅผ ํ๊ท ์ ๊ณฑ์ค์ฐจ๋ก ํ์ฌ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆฌ๋ฉด ๋ค์๊ณผ ๊ฐ์ ํํ๊ฐ ๋๊ธฐ ๋๋ฌธ์ด๋ค. ๋ก์ง์คํฑ ํ๊ท์์ MSE๋ฅผ Cost function์ผ๋ก ์ฌ์ฉํ๋ฉด, GCD์ฌ์ฉ์ ์๋ชป๋ ์ต์๊ฐ์ ๋น ์ง ์ ์๋ค.
๊ฒฐ๋ก ์ ์ผ๋ก ๋ก์ง์คํฑ ํ๊ท์์ ์ฐพ์๋ธ ๋น์ฉํจ์๋ฅผ Cross entropy ํจ์๋ผ๊ณ ํ๋ฉฐ, ์ํํธ ๋งฅ์ค ํ๊ท์ ๋น์ฉํจ์์ด๊ธฐ๋ ํ๋ค.
- one-hot encoding์ด๋?
์-ํซ ์ธ์ฝ๋ฉ์ ๋จ์ด๋ฅผ ํํํ๋ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ํํ ๋ฐฉ๋ฒ์ด๋ค. ์-ํซ ์ธ์ฝ๋ฉ์ ๋จ์ด ์งํฉ์ ํฌ๊ธฐ๋ฅผ ๋ฒกํฐ์ ์ฐจ์์ผ๋ก ํ๊ณ , ํํํ๊ณ ์ ํ๋ ๋จ์ด์ ์ธ๋ฑ์ค์ 1์, ๋ค๋ฅธ ์ธ๋ฑ์ค์๋ 0์ ๋ถ์ฌํ๋ ๋จ์ด์ ๋ฒกํฐ ํํ ๋ฐฉ์์ด๋ค.
'Computer Science > Machine Learning๐ป' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[2] ์ถ์ ๊ณผ ๊ฐ์ค ๊ฒ์ (0) | 2020.11.08 |
---|---|
[1] ์ด์ฐํ/์ฐ์ํ ํ๋ฅ ๋ถํฌ (0) | 2020.11.05 |
๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ธํฐ๋ทฐ(2) (0) | 2020.11.01 |
easily image crawling with python and save in local drive (3) | 2020.03.06 |
๋จธ์ ๋ฌ๋์ด๋ ๋ฌด์์ธ๊ฐ? (0) | 2020.03.03 |