본문 바로가기
728x90
반응형

데이터 시각화2

[Titanic] EDA (Exploratory Data Analysis) - 타이타닉 데이터 분석(2) ※ 타이타닉에 승선한 사람들의 데이터로 승객들의 생존여부를 예측하는 모델 구축 / 개발 ※ Dataset Check(타이타닉 첫번째 chapter) 이후, EDA 과정을 통해 Feature 분석 단계 → 타이타닉 데이터분석(1) 에 이어서 4. Violinplot (Age, Sex, Pclass) - 3개의 dimension에서 Pclass, Sex, Age를 한 눈에 비교하며 분석할 수 있도록 시각화해보자 - Seaborn - violinplot 사용. 먼저 필사를 통해 결과물을 확인하고 익혀가는 방식으로 공부하자 f, ax = plt.subplots(1,2,figsize=(18,8)) # x축 : Pclass, y축 : Age, 색깔(Survived) sns.violinplot('Pclass', 'A.. Data Analyst/Kaggle & DACON 2022. 10. 7.
[Titanic] EDA (Exploratory Data Analysis) - 타이타닉 데이터 분석(1) ※ 타이타닉에 승선한 사람들의 데이터를 활용하여 승객들의 생존여부를 예측하는 모델 구축 / 개발 ※ Dataset Check(타이타닉 첫번째 chapter) 이후, EDA 과정을 통해 Feature 분석 단계 - Target Label인 'Survived'를 제외한 총 11개의 Feature 중 어떤 Feature를 고려하면 강력한 insight를 얻을 수 있을지 가설과 결과를 도출하기 위해 EDA(Exploratory Data Analysis) 단계는 매우 중요하다. → 여기서 insight란, 통계적인 insight. 즉, 본인이 원하는 수치나 그림(그래프)를 출력하고 특정 결과를 도출 하는 과정을 말한다. → 더불어 출력한 시각화된 데이터를 통해 말하고자/보고자 하는 것들을 해석할 수 있는 역량이 .. Data Analyst/Kaggle & DACON 2022. 10. 6.
반응형