본문 바로가기
728x90
반응형

피어슨 상관관계2

(머신러닝) Feature Selection는 무엇이고 왜 꼭 알아야 하는 걸까? Feature Selection란 무엇이고 데이터 분석 프로세스에서 왜 필요한 걸까? 그리고 어떤 종류가 있는지 살펴보자. Feature Selection이란? 머신러닝 데이터 분석에 꼭 과정이다? 1. Feature Selection? Feature Selection이란, 패턴이 지니고 있는 다수의 특징 중에서 당면한 결정을 하는데 필요 충분하다고 생각되는 소수의 특징을 골라 내는 것을 의미한다. 데이터가 수집되었는데 엄청 많은 데이터들(ex, 2~3천개 등)이 있다면, 그냥 돌릴 수가 없다. 메모리 이슈도 있으며 성능도 당연히 제대로 안 나올 것이다. # 운영적 관점 1) 적재하는 데이터의 양이 적어지므로 시스템을 운영하는 비용 감소 2) 적은 변수를 사용할 경우, 그렇지 않은 경우보다 시스템의 속도.. Machine Learning/데이터 분석 이론과 기초 2024. 2. 26.
[파이썬 통계] 데이터를 논리적 수치로 해석하는 법! (대표값, 퍼진정도 등) 중심위치와 퍼진 정도의 측도 계산법에 대해 학습하고 이를 통해 상자그림을 그려보자. 더불어 2가지 변수의 관계를 파악하는 법 공부! 1. 중심위치의 측도 그래프나 도표에 의한 분석의 단점으로 인해 수치를 통해 연속형 자료를 요약해야할 경우가 있다. → 많은 양의 데이터를 유의미한 수치로 요약하여 대략적인 분포상태를 파악 가능하여 단점 보완! 수치를 통한 연속형 자료를 요약할 때는 아래와 같이 크게 4가지로 할 수 있다. (중심위치와 퍼진 정도의 측도, 도수분포표, 상자그림) 1) 중심위치의 측도 *** : 주어진 데이터들이 가지고 있는 가운데(중심) 위치를 찾는다. → 데이터의 대표값 이 대표값이 나머지 다른 데이터들을 대표한다. 2) 퍼진 정도의 측도 *** : 데이터들이 중심 위치로부터 얼마나 떨어져.. Data Analyst/Basic Python 2023. 11. 6.
반응형