728x90 반응형 Column 상관관계1 [Titanic] Feature Engineering(2) - One hot encoding, correlation ※ 타이타닉에 승선한 사람들의 데이터로 승객들의 생존여부를 예측하는 모델 구축 / 개발 ※ Dataset Check, EDA 이후 Feature Engineering 과정을 통해 모델 학습도와 성능 향상 - 문자값을 수치로 변환(Initial, Embarked, Sex), One-hot encoding(Initial, Embarked), Feature간 상관관계(correlation) 확인 - Feature Engineering(1) - 결측값(null) 처리 과정에 이어서 학습 2. String 데이터 형태 → Interger 로 변환 - String 데이터를 모델 학습에 유용하게 학습시킬 수 있도록 수치로 변경하는 작업 - 일일이 하드코딩으로 바꾸는 것보다, mapping(=map() 함수)를 통해 .. Data Analyst/Kaggle & DACON 2022. 11. 29. 더보기 ›› 반응형 이전 1 다음