본문 바로가기
728x90
반응형

feature importance2

(머신러닝) Feature Selection는 무엇이고 왜 꼭 알아야 하는 걸까? Feature Selection란 무엇이고 데이터 분석 프로세스에서 왜 필요한 걸까? 그리고 어떤 종류가 있는지 살펴보자. Feature Selection이란? 머신러닝 데이터 분석에 꼭 과정이다? 1. Feature Selection? Feature Selection이란, 패턴이 지니고 있는 다수의 특징 중에서 당면한 결정을 하는데 필요 충분하다고 생각되는 소수의 특징을 골라 내는 것을 의미한다. 데이터가 수집되었는데 엄청 많은 데이터들(ex, 2~3천개 등)이 있다면, 그냥 돌릴 수가 없다. 메모리 이슈도 있으며 성능도 당연히 제대로 안 나올 것이다. # 운영적 관점 1) 적재하는 데이터의 양이 적어지므로 시스템을 운영하는 비용 감소 2) 적은 변수를 사용할 경우, 그렇지 않은 경우보다 시스템의 속도.. Machine Learning/데이터 분석 이론과 기초 2024. 2. 26.
[Titanic] Model Development(ML) - Randomforest (지도학습) ※ 타이타닉에 승선한 사람들의 데이터로 승객들의 생존여부를 예측하는 모델 구축 / 개발 ※ Dataset Check, EDA, Feature Engineering 이후 머신러닝(ML) 모델을 만들고, 예측하기 → 지도학습, Sklearn 1. Model 생성 및 테스트 (ML, Randomforest) - RandomForestClassifier : 이진 분류 (Classifier 알고리즘) - Forest : Decision Tree를 랜덤하게 만들고, ensemble 시킨 형태 1.1. 필요한 라이브러리 선언 - 데이터분석과 머신러닝은 'Sklearn' 라이브러리를 반드시 숙지해야 한다. - 학습하지 않은 Test set을 입력해도 성능도 확인! from sklearn.ensemble import R.. Data Analyst/Kaggle & DACON 2022. 12. 4.
반응형