Computer Science(64)
-
데이터 사이언스 인터뷰(2)
Bias와 Variance의 차이는 무엇인가?Bias란 데이터 내에 있는 모든 정보를 고려하지 않음으로 인해 지속적으로 잘못된 것들을 학습하는 경향을 의미한다.Variance란 데이터 내에 있는 에러까지 모두 고려함으로 인해 실제 현상과 관련없는 것까지 학습하는 경향을 의미한다. bias(편향)이 높다는 것은 실측치와 예측치간의 오차가 벌어진 것을 의미하며, Variance(분산)이 높다는 것은 예측의 범위가 높다는 것을 의미한다. 즉, bias가 높다는 것은 과소적합(underfitting, 꾸준히 틀리는 상황)이며 Variance가 높다는 것은 과대적합(Overfitting, 예측의 분포가 큰 상황)임을 의미한다. 모델에 있어 데이터를 충분히 학습시키지 않을 경우 실제 데이터를 예측하지 못해 Bias..
2020.11.01 -
데이터 사이언스 인터뷰(1)
p-value란 무엇인가?귀무가설이 맞다는 전제 하에 표본에서 실제로 관측된 통계치와 같거나 더 극단적인 통계치가 관측될 확률. P-value는 내가 뽑은 표본평균이 귀무가설에 따라 나올 확률이 몇 %가 되었는가를 찾는 방법이다예를 들어 두 표본 평균의 차이를 검증한다고 할 때, 두 표본 집단의 모집단이 같다는 가정을 전제하여 통계를 진행한다. R-Square의 의미는 무엇인가?결정계수라고 불리며, 회귀모형의 설명력을 표현한 것. 0에 가까울수록 설명력이 낮고, 1에 가까울수록 높다. R-squred는 1-SSE/SST(SSR/SST)로 구할 수 있으며, SST는 Sum of squre Total이며, SSE는 Sum of squre of error이다. SST는 실제값과 예측값, 평균값 사이에 발생한 ..
2020.11.01 -
상속과 인터페이스, 다형성에 대해 2020.09.11
-
넷플릭스로 보는 데이터 베이스
1. 넷플릭스의 문제점 전세계에 1억 4000만의 유료 회원을 보유한 영상 스트리밍 플랫폼 ‘넷플릭스’. 화려한 타이틀을 갖게 되기까지 넷플릭스는 수많은 착오와 어려움이 있었다. 그 중에서도 넷플릭스의 성장에 가장 큰 영향을 미친 기술적 사건이 있었다. 바로 데이터 센터에서 클라우드로의 전환이다. 넷플릭스가 고유의 데이터 센터(DC)를 사용하는 것이 아닌 클라우드를 사용하게 된 계기에는 다음과 같은 사건이 있었다. 때는 2008년, 넷플릭스는 단일의 DC를 운용하고 있었으나 SPOF로 인해 3일간 소비자에게 DVD배송이 지연되는 문제를 겪었다. 특히나 점점 더 많은 유저를 포용하게 되는 넷플릭스의 입장에서는 DC 유지를 위한 공간, 동력 그리고 데이터베이스를 유지하기 위한 쿨링 시스템 보완 등 모든 것이..
2020.05.14 -
캡슐화(Encapsulation)이란
캡슐화는 두 가지의 정의가 있습니다. 첫째로, 클래스(class)와 구조(structure)와 같이 객체의 속성(atrribute)과 행위(Method)에 따라 운영하여 편리성을 늘리는 것입니다(facilitates the bundling of data with the methods). 예를 들어, ‘영화‘라 이름 붙여진 클래스에 영화를 실행하는 행위와 영화의 평점, 그리고 영화의 장르, 제목이 들어가게 된다고 해봅시다. 만약 실행자(혹은 개발자)가 영화와 관련된 행위 혹은 속성(영화의 제목, 장르 등등)을 확인하고 싶을 때는 다른 클래스를 들여다 볼 필요 없이 영화 클래스를 확인하면 될 것입니다. 이처럼 속성과 행위에 따라 묶어 사용자로 하여금 편리성을 제공한다는 데서 장점을 가지고 있습니다. 두 번째..
2020.03.30 -
information hiding, modularity에 대하여
객체지향 프로그래밍의 경우 Information hiding, Modularity, Code re-use, plug-ability와 easy debugging 4가지의 장점을 가지고 있다. 첫 번째로, information hiding이다. information hiding은 간단히 말하면 정보 은닉, 즉 ‘객체 간에 서로를 모르게 하는 것’이라 말할 수 있다. 예를 들어 자동차의 설계도(Class)가 있다고 해보자. BMW와 모닝(object)은 이러한 자동차의 설계도를 기반으로 독립적인 회사만의 기능을 추가해 새로운 자동차를 만든다. 이렇게 생성된 BMW와 모닝(object)은 ‘자동차’(Class)라는 공통점은 가지고 있지만 각 객체의 기능에 따라 다르다는 특징을 가진다. 이처럼 객체간에 공통된 메..
2020.03.22