목록Titanic (1)
천선생의 삶
[Kaggle] 타이타닉 생존자 예측 1부 - EDA(1)
안녕하세요. 천선생입니다. Predicting Titanic Survivors 1부에서는 각 변수를 탐색하며 데이터에 대한 이해도를 쌓고, 전체적인 분석에 대한 계획을 짜기 위하여 진행하는 EDA 에 대한 설명을 하도록 하겠습니다. 이번 포스트에서 우리의 목표는 다음과 같습니다. 1. 각 데이터의 성질 파악하기 2. 데이터 내부에 존재하는 NA값(결측값) 확인과 올바른 대치방법 고안 3. 모델링 이전에 진행하게 될 Feature Engineering 계획수립 - NA값 처리 탐색하기 이전에, 데이터 내부에 존재하는 NA(결측값)은 없는지 확인하도록 하겠습니다. 만약 결측값이 존재한다면, 사용자 함수를 정의하여 각 열의 평균값으로 대치하도록 하겠습니다. # 각 변수들에 존재하는 NA value의 수와 해당..
Kaggle/Titanic
2019. 7. 21. 16:54