728x90 반응형 전체 글418 왜 데이터 분석가도 Cloud를 알아야 할까? on-premise란? Cloud, 데이터 분석가도 꼭 알아야 하는걸까? 1. On-premise On-premise는 회사 내에 IDC에 존재하는 플랫폼을 의미한다. - Legacy system을 Cloud로 전환하는 것은 많은 비용과 Risk를 수반 - 여전히 많은 회사에서 On-premise에서 서비스를 운영중 → 그럼에도 불구하고 대부분의 회사에서 Cloud 도입을 검토하고 있거나 PoC 수행중 - Cloud 환경에서 분석이 가능한 분석가와 Local에서만 분석 가능한 분석가? → Cloud를 몰라도 분석은 할 수 있지만, Cloud를 아는 분석가는 더욱 경쟁력을 확보할 수 있다. 그래서 Cloud 환경에서의 분석도 해보는 것이 굉장히 중요하다. 2. MLOps 그럼 MLOps 관점에서 본다면? - 초기 ML 프로세스와.. Machine Learning/Data Load (Cloud AWS) 2024. 4. 2. 더보기 ›› 요즘 사람들은 다 쓴다는 Public Cloud란? 초간단 쉽게 이해하자 Data Loading from Cloud - Public Cloud - 1. Cloud - Cloud란? 데이터를 인터넷과 연결된 중앙컴퓨터에 저장하여 인터넷에 접속하기만 하면 언제든지 서비스를 이용할 수 있음을 의미하는 개념이다. - Cloud를 이용하면 작업한 컴퓨터에서만 데이터를 불러올 수 있는 것이 아니라 마치 여러 장소에서 동일한 구름을 관찰할 수 있듯이 어디서나 필요한 서비스를 활용할 수 있다. 2022년에는 대기업 신규 소프트웨어 투자의 20% 이상이 'Cloud First' → 'Cloud Only' 전략 → 많은 서비스를 클라우드로 관리한다 → CSP(Cloud Service Provider), AWS, 마이크로소프트, 구글 등이 보안, 전기 공급, 서버 냉각 문제 등의 모든 것을 관리.. Machine Learning/Data Load (Cloud AWS) 2024. 4. 2. 더보기 ›› (파이썬) 쉽게 이해하고 써먹는 matplotlib로 시각화하기 Github에서 데이터를 불러와서 다양한 상황에 대해 matplotlib를 어떻게 활용할 수 있는지 학습해보자 # 다룰 데이터 리스트 1) 인구에 대한 정보를 시각화 → 인구밀집도 분석(scatter, encircle) 2) 자동차 연비, 실린더 갯수, 배기량 등의 상관관계 → 배기량에 따른 고속도로 연비 변화량 (histogram) → 각 자동차 feature 간 상관관계 분석 (heatmap) → 자동차 모델별 차량 주행거리 분석 → 실린더 갯수에 따른 도심 연비 시각화 → 차급에 따른 도심 연비 비교 → 자동차의 종류별 비율 → 자동차 회사별 시장 점유율 파이썬에서 데이터 분석을 할 때 중요한 시각화 과정! matplotlib를 활용하여 직접 실습해보자 1. 인구 데이터 시각화 & 분석 1) Imp.. Machine Learning/Basic of Python (Colab) 2024. 4. 2. 더보기 ›› (파이썬) DataHandling 기초 & 실습(2) - 데이터 슬라이싱, 필터링 데이터 다루는 실습(1)에 이어서 데이터를 불러와서 슬라이싱과 필터링을 통해 실제로 어떻게 활용될 수 있는지 학습해보자 # Data handling 기초 & 실습(1) 첨부 2024.03.29 - [Machine Learning/Basic of Python (Colab)] - (sklearn) DataHandling 기초 & 실습 - 결측치 처리 (sklearn) DataHandling 기초 & 실습 - 결측치 처리 # 결측치 처리 - 일반적인 처리 방법 - sklearn을 이용한 처리 방법 - pandas를 이용한 처리 방법 파이썬 기본 함수와 특성을 이용해서 데이터를 다루는 실습을 해보자 1. Import & DataFrame 생성 결측치를 derrick.tistory.com # 실습 파일 첨부 # .. Machine Learning/Basic of Python (Colab) 2024. 4. 1. 더보기 ›› (sklearn) DataHandling 기초 & 실습 - 결측치 처리 # 결측치 처리 - 일반적인 처리 방법 - sklearn을 이용한 처리 방법 - pandas를 이용한 처리 방법 파이썬 기본 함수와 특성을 이용해서 데이터를 다루는 실습을 해보자 1. Import & DataFrame 생성 결측치를 처리하는 다양한 방법에 대해 공부해보자 # 필요한 패키지 import import numpy as np import pandas as pd from sklearn.impute import SimpleImputer, KNNImputer, MissingIndicator import warnings warnings.filterwarnings('ignore') import warnings warnings.filterwarnings('ignore') : warning을 'ignore'.. Machine Learning/Basic of Python (Colab) 2024. 3. 29. 더보기 ›› 충주호캠핑월드(4호) - 충주호 근처 글램핑하기 좋은 곳! 가족 방문 추천! 겨울 지나가기 전에 글램핑 한번 갈려고 알아본 곳들 중 눈에 들어온 '충주호'. 주변 지인들도 가보고 힐링되고 너무 좋다는 평이 많아서 알아보다가 '충주호캠핑월드'를 다녀오고 평균 이상으로 괜찮아서 공유드립니다😊 사진은 2/2일에 촬영한 것이고 바람이 많이 불진 않아서 그렇게 춥지는 않았어요 : ) 충주호 글램핑/캠핑하기 좋은 곳! '충주호캠핑월드' # 방문평 요약 - 잔잔한 호수뷰가 좋아서 힐링하기 좋음 - 화장실 따뜻함 (라디에이터 잘 돌아가서 따뜻 / 겨울에 방문하기도 좋음 / 따듯한 물도 잘 나옴) - 바베큐랑 불멍세트도 제공받을 수 있음 (2~3만원 정도 추가금 발생) - 실내도 따뜻함 (전기장판, 온돌, 전기난로 등 잘 구비되어있음) - 실내등이 많이 약한 편 (실내가 조금 어두울 수 있어서 .. (국내) 여행 & 맛집/충청남도 2024. 3. 29. 더보기 ›› 쉽게 이해하는 파이썬 numpy, pandas 정리 & 예제! 파이썬/데이터분석에서 꼭 알아야 하는 numpy, pandas 패키지에 대해 쉽게 이해해보자 1. Numpy - C로 구현된 숫자 관련된 자료형을 처리할 수 있는 함수의 집합 - python의 성능 문제를 대부분 상쇄해줄 수 있는 패키지 1) 배열 기초 - numpy.array(list.dtype)의 구조로 배열을 만들 수 있음 → 파이썬으로 list를 먼저 만들고, numpy.array를 통해서 변환해주는 개념 - 함수를 이용하여 배열 만들기 → 규모가 큰 배열의 경우에는 numpy에 내장된 함수를 사용하여 처음부터 배열을 생성하는 것이 효율적 - 대표적인 함수 → zeros, ones, full, arrange, linspace, rando.random, random.normal 등 2차원의 배열인 .. Machine Learning/Basic of Python (Colab) 2024. 3. 24. 더보기 ›› (파이썬 기초) if, for, while, try, except 쉽게 비교 정리 파이썬에서 자주 사용되는 if, for, while, try, except statement에 대해 쉽게 학습하자! 1. if (조건문) - 대부분의 프로그래밍 언어에서 지원하는 문법 - 직관적으로 특정 조건을 검사할 때 사용 if문에 조건을 넣지 않는 경우도 있다. 이 경우, 해당 값 자체가 True 혹은 False일때 실행문이 실행된다. if == 1 이런식으로 '=='으로 기입해야 된다. 하나만 적으면 잘못된 문법! # 실무에서 많이 쓰이는 표현 → 리스트에 데이터값들을 모두 담아두고 들어온 데이터의 길이(len)가 정상적인지 확인할 때 많이 사용한다. > 데이터를 입력받을 때, Feature들을 넣을 column의 숫자가 학습이랑 테스트가 같아야 한다. > 학습 전에 길이를 검토할 때 유용 2. .. Machine Learning/Basic of Python (Colab) 2024. 3. 13. 더보기 ›› 데이터 분석할 때 꼭 알아야 하는 Python 기본 함수 총정리! 데이터 분석할 때 꼭 알아야 하는 Python 기본 함수 정리! 1. 자료형 기본적으로 Python에는 자료형을 포함하여 연산을 할 수 있는 내장함수가 있다. 파이썬은 다른 언어와 다르게 자료형을 직접 지정하지 않는다. C와 C++의 경우, 특정 변수에 대한 자료형을 지정해줘야 하지만, 파이썬은 자료형을 추측해서 지정되므로, 변환할 때만 기입해주면 된다. → 따라서 자료형은 어떤 종류가 있는지만 알면 된다. # Number - 정수(int), 부동소수점(float), 복소수(complex)를 표현할 수 있는 자료형 # Sequence - 문자열(str), 리스트(list), 튜플(tuple) 등의 자료형으로 순서를 표현하는 자료형 → 리스트는 test 데이터와 train 데이터를 만들때 한줄씩 돌아가면서.. Machine Learning/Basic of Python (Colab) 2024. 3. 11. 더보기 ›› (공주카페) 로컬커피, 공주 교동 한옥카페 추천! 분위기맛집! 공주 한옥 카페 추천! '로컬커피' - 주소 - 충남 공주시 용당길 55-7 (교동 185) - 내방역 6번 출구 보도 100미터 이내 - - 영업시간 - 매주 월요일 휴무 화~토 (12:00 ~ 21:00) 일 (12:00 ~ 18:00) - 주차 - 전용 주차장(교동 193번지) 있음 자리 없을 경우, 로컬파스타 뒷편에 주차 가능! 연휴때는 주차 자리가 협소할 수 있어요~ - 메뉴 - 기본 커피메뉴 +공주알밤라떼 +타르트(초코슈, 옥수수, 밤) +모찌(딸기, 귤) +밤 크림브륄 들어가는 입구쪽에 'Local coffee'로 가는 안내 표지판이 있어서 따라 들어가면 돼요~ 차는 못 들어갑니다^^ 안쪽에 마당이 있고 한옥이 정말 예쁘더라고요.(●'◡'●) 하나하나가 감성있었고 웨이팅이 조금 있어서 5~1.. (국내) 여행 & 맛집/충청남도 2024. 3. 11. 더보기 ›› 반응형 이전 1 2 3 4 5 ··· 42 다음