파이썬으로 회귀분석, 시계열 분석 등의 데이터 분석을 위해서는 아래 두가지 패키지를 살펴봐야 한다.
1. scikit-learn
https://scikit-learn.org/stable/
데이터 분석을 위해 가장 많이 사용하는 파이썬 패키지는 사이킷런(scikit-learn)일 것이다.
사이킷런은 범용 머신러닝 도구이자 통계관련 함수를 제공하는 패키지이다. 아카콘다(Anaconda)를 설치하면 기본적으로 설치된다.
사이킷런 하위모듈로는 분류(Classification), 회귀(Regression), 클러스터링(Clustering), 차원축소(Dimensionality Reduction), 모델선택(Model Selection), 데이터 전처리(Data Preprocessing)가 있으며, 전통적인 통계분석 패키지라기 보다는 머신러닝과 딥러닝를 위한 도구로 많이 사용된다.
2. statsmodels
https://www.statsmodels.org/stable/index.html
파이썬 통계분석 패키지이다. 시계열 분석을 위한 ARIMA, VAR 등을 쉽게 사용할 수 있다.
사이킷런과 비교하면 statsmodel은 보다 통계적 모형 개발이나 통계추론에 더 적합한 패키지라고 볼 수 있다.
개발하신 분들이 R을 주로 사용하신 분들이라 R과 비슷한 출력결과가 많다고 한다.
R을 사용하신 분이라면 더욱 친근할 수 있겠다.
'인공지능(AI) 개발 > Python' 카테고리의 다른 글
파이썬으로 정규분포 데이터와 챠트 만들기 (0) | 2020.04.28 |
---|---|
파이썬에서 텍스트 파일 읽고 쓰기 (0) | 2020.04.21 |
파이썬 문자열 포매팅(formatting) (0) | 2020.04.06 |
Jupyter Notebook 시작시 브라우저가 자동실행 되지 않을 때 (5) | 2020.04.05 |
윈도우 10에 파이썬 설치하기 (0) | 2018.10.03 |
댓글