2020. 11. 8. 23:53ใComputer Science/Machine Learning๐ป
์ถ์ ์ด๋, ํ๋ณธ์ผ๋ก๋ถํฐ ๋ฏธ์ง์ ๋ชจ์๋ฅผ ์ถ์ธกํ๋ ๊ฒ์ด๋ค.
์ถ์ ์๋ 1) ์ ์ถ์ ๊ณผ, 2) ๊ตฌ๊ฐ์ถ์ ์ด ์๋ค.
์ ์ถ์ ์ ๊ฒฝ์ฐ, ๋ชจ์๊ฐ ํน์ ํ ๊ฐ์ผ ๊ฒ์ด๋ผ๊ณ ์ถ์ ํ๋ ๊ฒ์ด๋ฉฐ ํ๋ณธ์ ํ๊ท , ์ค์์, ์ต๋น๊ฐ์ ์ฌ์ฉํ๋ค.
๋ฐ๋ฉด ๊ตฌ๊ฐ ์ถ์ ์ ๊ฒฝ์ฐ, ์ ์ถ์ ์ ์ ํ์ฑ์ ๋ณด์ํ๊ธฐ ์ํด ํ๋ฅ ๋ก ํํ๋ ๋ฏฟ์์ ์ ๋ ํ์์ ๋ชจ์๊ฐ ํน์ ํ ๊ตฌ๊ฐ์ ์์ ๊ฒ์ด๋ผ๊ณ ์ ์ธํ๋ ๊ฒ์ด๋ค.
๊ตฌ๊ฐ ์ถ์ ์ ๊ฒฝ์ฐ ํญ์ ์ถ์ ๋์ ๋ถํฌ์ ๋ํ ์ ์ ๊ฐ ์ฃผ์ด์ ธ์ผ ํ๊ณ , ๊ตฌํด์ง ๊ตฌ๊ฐ ์์ ๋ชจ์๊ฐ ์์ ๊ฐ๋ฅ์ฑ์ ํฌ๊ธฐ(์ ๋ขฐ์์ค)์ด ์ฃผ์ด์ ธ์ผ ํ๋ค.
์ด๋ฅผํ
๋ฉด ๋ด๊ฐ ์ด๋ฒ ์ค๊ฐ๊ณ ์ฌ์์ ์ ํํ 90์ ์ ๋ง์ถ ๊ฒ์ด๋ค! ๋ผ๊ณ ์ถ์ ํ๋ ๊ฒ๋ณด๋ค๋ 80-90์ ์ฌ์ด์ ์ ์๊ฐ ๋์ฌ ๊ฒ์ด๋ค ๋ผ๊ณ ์ถ์ ํ๋ ํธ์ด ๋ ์ ๋ขฐ์ฑ์๋ ๊ฒ์ฒ๋ผ ๋ง์ด๋ค.
์ด๋ฌํ ์ ์ถ์ ๋์์๋ ๋ค์๊ณผ ๊ฐ์ ์กฐ๊ฑด์ด ์๋ค.
1. ๋ถํธ์ฑ(Unbiasedess)
: ๋ชจ๋ ๊ฐ๋ฅํ ํ๋ณธ์์ ์ป์ ์ถ์ ๋์ ๊ธฐ๋๊ฐ์ ๋ชจ์ง๋จ์ ๋ชจ์์ ์ฐจ์ด๊ฐ ์๋ค.
2. ํจ์จ์ฑ(effciency)
:์ถ์ ๋์ ๋ถ์ฐ์ด ์์์๋ก ์ข๋ค.
3. ์ผ์น์ฑ(consistency)
:ํ๋ณธ์ ํฌ๊ธฐ๊ฐ ์์ฃผ ์ปค์ง๋ฉด ์ถ์ ๋์ด ๋ชจ์์ ๊ฑฐ์ ๊ฐ์์ง๋ค.
4. ์ถฉ์กฑ์ฑ(sufficient)
: ์ถ์ ๋์ ๋ชจ์์ ๋ํ์ฌ ๋ชจ๋ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ค.
๋ฐ๋ฉด ๊ฐ์ค๊ฒ์ ์ ์ถ์ ์์ ๋ ๋์๊ฐ ๋ชจ์ง๋จ์ ๋ํ ๊ฐ์ค์ ์ธ์ฐ๊ณ , ํ๋ณธ ๊ด์ฐฐ์ ํตํด ๊ฐ์ค์ ๋ํ ์ฑํ ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๋ค. ๊ฐ์ค ๊ฒ์ ์ ๊ท๋ฌด๊ฐ์ค๊ณผ ๋๋ฆฝ๊ฐ์ค ์ค์์ ํ๋๋ฅผ ์ ํํ๋ ๊ณผ์ ์ด๋ฉฐ, ๊ท๋ฌด๊ฐ์ค์ด ์ณ๋ค๋ ์ ์ ํ์ ๊ฒ์ ํต๊ณ๋ ๊ฐ์ ๊ตฌํ ํ ์ด ๊ฐ์ด ๋ํ๋ ๊ฐ๋ฅ์ฑ์ ํฌ๊ธฐ์ ์ํด ๊ท๋ฌด๊ฐ์ค์ ์ฑํ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๋ค.
๊ท๋ฌด๊ฐ์ค์ ๋น๊ตํ๋ ๊ฐ๊ณผ ์ฐจ์ด๊ฐ ์๋ค, ๋์ผํ๋ค๋ฅผ ๊ธฐ๋ณธ ๊ฐ๋
์ผ๋ก ํ๋ ๊ฐ์ค์ด๋ค.
๋๋ฆฝ๊ฐ์ค์ ๋๋ ทํ ์ฆ๊ฑฐ๊ฐ ์์ ๋ ์ฃผ์ฅํ๋ ๊ฐ์ค์ด๋ค.
๊ฒ์ ํต๊ณ๋์ ๊ด์ฐฐ๋ ํ๋ณธ์ผ๋ก๋ถํฐ ๊ตฌํ๋ ํต๊ณ๋์ด๋ฉฐ, ์ ์์์ค(alpha)์ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ๊ฒ ๋๋ ํ๋ฅ ์ ํฌ๊ธฐ์ด๋ค.
์ ์์์ค์ ๊ท๋ฌด๊ฐ์ค์ด ์ณ์๋ฐ๋ ๋ถ๊ตฌํ๊ณ ์ด๋ฅผ ๊ธฐ๊ฐํ๋ ํ๋ฅ ์ ํฌ๊ธฐ๋ผ๊ณ ๋ณด๋ฉด ์ฝ๋ค(์ค์ฐจ๊ฐ ๋ฐ์ํ ํ๋ฅ )
'๊ท๋ฌด๊ฐ์ค์ด ์ณ์๋ฐ๋ ๋ถ๊ตฌํ๊ณ '๋ผ๋ ์ ์ ์กฐ๊ฑด์ด ๋ถ๋ ์ด์ ๋ ๋ค์๊ณผ ๊ฐ๋ค.
์ฃผ์ฅํ๊ณ ์ถ์ ๋๋ฆฝ๊ฐ์ค์ ๋ง์กฑ์ํค๊ธฐ ์ํด์๋ ๊ท๋ฌด๊ฐ์ค์ด ๊ธฐ๊ฐ๋์ด์ผ ํ๋๋ฐ, ๊ท๋ฌด๊ฐ์ค์ด ์ณ์๋ฐ๋ ์ค์๋ก ๊ธฐ๊ฐ๋ ํ๋ฅ ์ธ 1์ข
์ค๋ฅ๋ฅผ ๋ฒํ ํ๋ฅ ์ ์ต์ํ ํ๊ธฐ ์ํจ์ด๋ค.
๊ธฐ๊ฐ์ญ์ ๊ท๋ฌด๊ฐ์ค์ด ์ณ๋ค๋ ์ ์ ํ์์ ๊ตฌํ ๊ฒ์ ํต๊ณ๋์ ๋ถํฌ์์ ํ๋ฅ ์ด ์ ์์์ค alpha์ธ ๋ถ๋ถ์ด๋ค.
์๋ฅผ ๋ค์ด, "00๋ํ๊ต์ ์ฌํ์ค์ธ ๋จ์ฑ์ ํ๊ท ํค(180cm)๋ ๋ํ๋ฏผ๊ตญ ๋จ์ฑ ํ๊ท ํค(172cm)๋ณด๋ค ํฌ๋ค" ๋ผ๋ ๊ฐ์ค์ ๋ํด ๊ฒ์ฆํด๋ณด์. ๊ท๋ฌด๊ฐ์ค์ ๊ฒฝ์ฐ 00๋ํ์์ ํฌํจํ ๋ชจ๋ ๋จ์ฑ์ ํ๊ท ํค๋ 172cm์ด๋ค ๊ฐ ๋ ๊ฒ์ด๋ฉฐ, ๋๋ฆฝ๊ฐ์ค์ ๊ฒฝ์ฐ 00๋ํ๊ต์ ์ฌํ์ค์ธ ๋จ์ฑ์ ํ๊ท ํค๊ฐ 172cm๊ฐ ์๋ ๊ฒ์ด๋ค ๋ก ์ค์ ๋ ๊ฒ์ด๋ค.
๋ง์ฝ ๊ฒ์ ํต๊ณ๋์ ๊ตฌํ๊ณ , ์ ์์์ค์ด 0.05%(์ ๋ขฐ๋ 95%)๋ผ๋ฉด p๊ฐ์ด 0.05๋ณด๋ค ๋ ์์ ๊ฒฝ์ฐ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ ์ ์๋ค.
ํต๊ณ์ ๊ฒ์ ์์ ๋ชจ์ง๋จ์ ๋ชจ์์ ๋ํ ๊ฒ์ ์ ๋ชจ์์ ๊ฐ์ ๊ณผ ๋น๋ชจ์์ ๊ฐ์ ์ผ๋ก ๊ตฌ๋ถํ๋ค.
๋ชจ์์ ๋ฐฉ๋ฒ์ ๊ฒ์ ํ๊ณ ์ ํ๋ ๋ชจ์ง๋จ์ ๋ถํฌ์ ๋ํ ๊ฐ์ ์ ํ๊ณ , ๊ฐ์ ํ์์ ๊ฒ์ ํต๊ณ๋๊ณผ ๋ถํฌ๋ฅผ ์ ๋ํด ๊ฒ์ ์ ์ค์ํ๋ค.
๋น๋ชจ์์ ๋ฐฉ๋ฒ์ ์๋ฃ๊ฐ ์ถ์ถ๋ ๋ชจ์ง๋จ์ ๋ถํฌ์ ๋ํ ์๋ฌด ์ ์ฝ์ ๊ฐํ์ง ์๊ณ ๊ฒ์ ์ ์ค์ํ๋ ๋ฐฉ๋ฒ์ด๋ค.
๋น๋ชจ์์ ๋ฐฉ๋ฒ์ ๊ด์ธก๋ ์๋ฃ์ ํน์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๊ณ ๊ฐ์ ํ ์ ์๋ ๊ฒฝ์ฐ ์ฃผ๋ก ์ด์ฉํ๋ฉฐ, ์๋ฃ์ ์๊ฐ ๋ง์ง ์๊ฑฐ๋ ์์ด๊ด๊ณ๋ฅผ ๋ํ๋ด๋ ๊ฒฝ์ฐ์ ์ด์ฉํ๋ค.
๋ชจ์์ ๊ฒ์ ๊ณผ ๋น๋ชจ์ ๊ฒ์ ์ ์์ด์ ์ฐจ์ด์ ์ ๋ค์๊ณผ ๊ฐ๋ค.
๊ฐ์ค์ ์ค์ ํ ๊ฒฝ์ฐ
๋ชจ์์ ๊ฒ์ ์ ๊ฐ์ ๋ ๋ถํฌ์ ๋ชจ์์ ๋ํด ๊ฐ์ค์ ์ค์ ํ์ง๋ง,
๋น๋ชจ์์ ๊ฒ์ ์ ๊ฒฝ์ฐ ๊ฐ์ ๋ ๋ถํฌ๊ฐ ์์ผ๋ฏ๋ก ๊ฐ์ค์ '๋ถํฌ์ ํํ๊ฐ ๋์ผํ๋ค' ํน์ '๋ถํฌ์ ํํ๊ฐ ๋์ผํ์ง ์๋ค'์ ๊ฐ์ด ๋ถํฌ์ ํํ์ ๋ํด ์ค์ ํ ๋ฟ์ด๋ค.
๊ฒ์ ๋ฐฉ๋ฒ์ ๊ฒฝ์ฐ
๋ชจ์์ ๊ฒ์ ์ ๊ฒฝ์ฐ ๊ด์ธก๋ ์๋ฃ๋ฅผ ์ด์ฉํด ๊ตฌํ ํ๋ณธํ๊ท ๊ณผ ๋ถ์ฐ์ ์ด์ฉํด ๊ฒ์ ์ ์ค์ํ๋ ๋ฐ๋ฉด
๋น๋ชจ์ ๊ฒ์ ์ ๊ฒฝ์ฐ ๊ด์ธก๊ฐ์ ์ ๋์ ์ธ ํฌ๊ธฐ์ ์์กดํ์ง ์๋ ๊ด์ธก๊ฐ๋ค์ ์์๋ ๋ ๊ด์ธก๊ฐ ์ฐจ์ด์ ๋ถํธ๋ฑ์ ์ด์ฉํด ๊ฒ์ ํ๋ค.
'Computer Science > Machine Learning๐ป' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[1] ์ด์ฐํ/์ฐ์ํ ํ๋ฅ ๋ถํฌ (0) | 2020.11.05 |
---|---|
๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ธํฐ๋ทฐ(2) (0) | 2020.11.01 |
๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ์ธํฐ๋ทฐ(1) (0) | 2020.11.01 |
easily image crawling with python and save in local drive (3) | 2020.03.06 |
๋จธ์ ๋ฌ๋์ด๋ ๋ฌด์์ธ๊ฐ? (0) | 2020.03.03 |