본문 바로가기

왜 데이터 분석가도 Cloud를 알아야 할까? on-premise란?

Derrick 발행일 : 2024-04-02
728x90
반응형

 

Cloud, 데이터 분석가도 꼭 알아야 하는걸까?

 

 

 


1. On-premise

On-premise는 회사 내에 IDC에 존재하는 플랫폼을 의미한다.

- Legacy system을 Cloud로 전환하는 것은 많은 비용과 Risk를 수반
- 여전히 많은 회사에서 On-premise에서 서비스를 운영중
 → 그럼에도 불구하고 대부분의 회사에서 Cloud 도입을 검토하고 있거나 PoC 수행중
- Cloud 환경에서 분석이 가능한 분석가와 Local에서만 분석 가능한 분석가?
 → Cloud를 몰라도 분석은 할 수 있지만, Cloud를 아는 분석가는 더욱 경쟁력을 확보할 수 있다.

 

 

그래서 Cloud 환경에서의 분석도 해보는 것이 굉장히 중요하다.

 


2. MLOps

그럼 MLOps 관점에서 본다면?

- 초기 ML 프로세스와는 다르게 상당히 복잡한 형태의 모델 파이프라인이 운영중
- On-premise의 경우, 회사별 상이한 파이프라인에 대한 숙지가 필요
 → 매우 복잡하고 현재 쓰이지 않는 솔루션을 사용하기도 하
- Public Cloud도 사업자별로 상이한 형태의 파이프라인 제공
- 하나의 Public Cloud를 통해 MLOps에 대한 개념을 잡아두면 다른 파이프라인은 비교적 쉽게 이해할 수 있다.
- 모델 파이프라인에 대한 이해를 통해 데이터의 문제, 모델의 문제 등 문제 발생 원인을 특정할 수 있게 되어서, 엔지니어들과의 원활한 의사소통이 가능하다 (중요!)

 

 

# MLOps
: MLOps는 머신러닝 작업(Machine Learning Operations)으로, 프로세스를 간소화하고, 이어 이를 유지관리하고 모니터링하는데 주된 핵심 기능

→ AWS SageMaker, Azure Machine Learning 등 파이썬으로 코딩할 수 있는 에디터를 제공한다. 파이프라인 관리도 쉽고 구조가 비슷하기 때문에 해당 파이프라인을 다른 프로젝트로 내보내는 것도 가능하다.

 

 

 

 

학습 참고 : 50개 프로젝트로 완벽하게 끝내는 머신러닝 SIGNATURE

 

 

 

댓글