데이터 전처리와 모델 검증의 오류
좋은 성능의 모델이 실제 적용 데이터에는 좋은 성능을 내지 못하는 경우들을 볼 수 있습니다. 이유는 다양하게 존재 할 수 있습니다. 분석 데이터가 충분하지 못하든지, 적용 데이터가 분석때와는 다르다던지, 단순 프로세스 상의 에러 발생 등 예상하지...
Split Vs Cross Validation
Data Mining 에서 Validation, 즉 만든 모델에 대한 성능을 평가하는 작업은 굉장히 중요합니다. 만들어진 결과에 따라 모델을 사용 여부까지 판단할 수 있기 때문입니다. 이번 포스팅에서는 모델 검증 방법중 가장 일반적인 Split...