본문 바로가기

데이터 분석할 때 꼭 알아야 하는 Python 기본 함수 총정리!

Derrick 발행일 : 2024-03-11
728x90
반응형

 

데이터 분석할 때
꼭 알아야 하는 Python 기본 함수 정리!

 

 


1. 자료형

기본적으로 Python에는 자료형을 포함하여 연산을 할 수 있는 내장함수가 있다. 
파이썬은 다른 언어와 다르게 자료형을 직접 지정하지 않는다. C와 C++의 경우, 특정 변수에 대한 자료형을 지정해줘야 하지만, 파이썬은 자료형을 추측해서 지정되므로, 변환할 때만 기입해주면 된다.
→ 따라서 자료형은 어떤 종류가 있는지만 알면 된다. 
# Number
 - 정수(int), 부동소수점(float), 복소수(complex)를 표현할 수 있는 자료형

# Sequence
 - 문자열(str), 리스트(list), 튜플(tuple) 등의 자료형으로 순서를 표현하는 자료형
→ 리스트는 test 데이터와 train 데이터를 만들때 한줄씩 돌아가면서 테스트를 하는데, 그 데이터들을 리스트에 넣어서 순회를 진행한다.
→ 튜플은 보통 데이터가 짝이 있는 경우 (ex, 좌표)

# Mapping
 - Key, Value 쌍으로 구성된 자료형

# Bool
 - True, False를 표현할 수 있는 자료형

# Set
 - 중복 원소를 갖지 않는 '집합'으로서의 특징을 가진 자료형
→ unique값을 계산할 필요없이 set 자료형을 선언해서 넣어주기만 해도 중복값은 모두 없어진다.
→ 집합이 가지는 특징(교집합, 합집합 등)을 모두 가지고 있다.

 


2. Bulit-in Functions

python에 내장되어 있는 빌트인 함수의 대표적인 것만 알아보자
# abs
 - 정수, 부동소수점수, 복소수의 절대값을 반환하는 기본 함수 (복소수는 크기를 반환)

# bin/oct/hex
 - '0b', '0o', '0x'가 붙은 2진수, 8진수, 16진수 문자열을 반환하는 함수

# Input
 - 사용자 입력을 받는 함수

# int, float
 - 문자열이나 소수점이 있는 숫자를 정수 형태로 반환하는 함수

# len
 - 변수의 길이를 반환하는 함수. list나 tuple 등의 변수의 길이를 반환하는데 주로 사용

 

 

# min/max
 - 반복 가능한 숫자형 데이터 내에서 최소값, 최대값을 반환하는 함수
→ 반복 가능한(sequence) 자료형인 list, tuple 등에서

# open
 - open(filename, mode)은 파일이름과 모드를 입력받아서 파일의 객체를 반환하는 함수
 → PoC를 하거나 샘플데이터(.csv, xlsx)를 open하는 용도로 많이 사용됨
 → 'r' : read 모드로 파일을 읽어서 데이터를 적재시키는 용도
 → 'w' : write 모드로 파일에 특정값을 작성
 → 'a' : append 모드로 내용을 현재의 데이터 뒤에 덧붙혀쓰는 모드

# range
 - 입력 받은 숫자에 해당하는 범위값을 반복 가능한 객체로 반환하는 함수
→ 반복문에서 주로 사용. range(start,  end, step)

# sum
 - 반복 가능한 숫자형 데이터의 합계를 반환하는 함수

# zip
 - 동일한 개수의 데이터를 묶어서 반환하는 함수 

 

# 파이썬 기초 자료형 실습 게시물

2023.07.31 - [Data Analyst/Basic Python] - [Python] 기초 자료형 정리 및 실습 (Tuple, List, Dictionary 등)

 

[Python] 기초 자료형 정리 및 실습 (Tuple, List, Dictionary 등)

# 학습 목표 - 문자열과 리스트를 이해하고 활용할 수 있다 - Tuple(튜플)을 배우고, List(리스트)와의 차이점 이해 - Dictionary(딕셔너리)를 이해하고 활용할 수 있다. 1. 문자열과 리스트의 활용 (메소

derrick.tistory.com

 

반응형

 


3. 기타 특성

# Global Interpreter Lock

- Python interpreter(인터프리터)가 하나의 thread에서 하나의 bytecode를 실행할 수 있도록 Lock하는 것을 말한다.
 → 동시에 처리할 수 있는 작업을 thread로 나누어서 작업하면 더 빨리 될 것 같지만, 실제로는 그렇지 않다.
- 하나의 Thread에 모든 자원을 사용할 수 있도록 하고, 다른 thread에서는 실행할 수 없도록 Lock을 거는 특성

 

위의 사진과 같이 Thread #1번이 실행되면, 다른 thread는 실행될 수 없도록 Lock 된다.
→ 그래서 python에서는 multi-thread를 하지 않고, multi-processing을 한다.

 

 

 

 

학습 참고 : 50개 프로젝트로 완벽하게 끝내는 머신러닝 SIGNATURE

 

 

댓글