본문 바로가기

분류 전체보기47

행복의 기원 - 서인국 행복에 관한 많은 책들은 행복하게 살기 위해서 어떻게 살아야 할까를 이야기한다. 하지만 이 책은 다르다. 다윈의 '종의 기원'을 언급하며 삶의 목적은 행복이 아니라, 생존과 번식이라고 이야기한다. 행복은 삶의 목적을 이루기 위한 수단이라고. 처음에는 의아했다. 전혀 생각해보지 못한 정의와 관점에 반론을 생각해보기도 했다. 과연 맞는 말일까? 그리고 행복의 요인은 유전적 요인이 강하며, 외향적 성향이 더 행복할 수 있다고 이야기한다. 그 또한 맞는 말일까? 내성적인 성향을 가진 나는 행복에 대해 불리한 유전자를 가진 것이고, 우리 모두는 부와 같은 외부요인과 상관없이 부모님이 행복하다면 우리 또한 행복하기 쉬운 것일까? 그렇게 행복이라는 것이 체형, 성격과 같은 유전적 요인이라고 할 수 있을까? 그동안 나.. 2020. 3. 22.
귀무가설과 대립가설 통계학에서 가설검정시 귀무가설이 기각되면 대립가설을 채택된다. 여기서 귀무가설은 뭐고 대립가설은 무엇일까? 그리고 왜 귀무가설을 기각하여 대립가설을 채택하는 방식으로 검정하는 것일까? 1. 통계학에서는 참이라고 생각하는 가설을 검증하지 않는다. 귀무가설(歸無假說, null hypothesis)은 미리 맞지않을 것을 예상하고 세우는 가설이다. 귀무(歸無)에서 歸의 한자 의미는 '돌아가다 돌려보내다'의 '귀'이며, '無'는 없을 '무'이다. 즉 다시 없던 것으로 돌려보낼 가설이라고 이해하면 되겠다. 예를 들어 '신약이 효과가 있는가'를 검증한다면, 귀무가설은 '신약이 효과가 없다'라는 가설이고, 대립가설은 '신약이 효과는 있다'는 가설이다. 신약이 효과가 있는가? 귀무가설 : 신약이 효과가 없다 대립가설 :.. 2020. 1. 2.
분산, 표준편차, 변동(CV)계수 분산, 표준편차는 데이터의 산포(흩어짐)를 확인하는 통계량이며, 변동계수(CV지수, 변이계수)는 평균이나 단위가 다른 두 개 이상 자료를 비교할 때 쓰입니다. 1. 분산, 표준편차 분산과 표준편차는 데이터가 얼마나 흩어져있는지 추정하는 통계량입니다. 분산과 표준편차를 구하기 위해서는 먼저 편차를 구해야합니다. 편차(d)는 관측값(Xi)에서 평균값(X)을 뺀 수입니다. $$편차(d_i) = 관측값(X_{i}) - 평균값(\overline{X})$$ 분산은 이 편차제곱의 평균값입니다. 편차를 제곱하면 통계량이 커지고 마이너스 값이 없어집니다. $$분산(S^2) = \frac{1}{n} \sum(d_i)^2$$ 표준편차는 분산에 루트를 씌워구합니다. 분산은 값이 상당히 커질 수 있으므로 표준편차를 많이 사용합.. 2020. 1. 1.
시계열 분석 - 안정(정상) 시계열로 변환 지난 포스팅에서 시계열에 대해서 알아보았습니다. 2019/12/26 - [데이터 분석] - 시계열 분석 - 시계열 데이터란? 시계열 분석 - 시계열 데이터란? 1. 시계열 데이터 시계열 데이터는 '시간에 따라 관측된 자료'로 기후 데이터, 주가지수 등이 시간에 따라 변하는 시계열 데이터입니다. 시계열은 안정(stationary) 시계열과 불안정(non-stationary) 시계열 두.. domini21.tistory.com 이번 포스팅에서는 불안정 시계열을 안정 시계열로 변환하는 방법에 대해 알아보겠습니다. 로그(log) 변환 차분(diff) 파이썬 Random 함수를 이용해 시계열 자료를 만들고 증가추세를 임의 생성하였습니다. import numpy as np import pandas as pd imp.. 2020. 1. 1.
시계열 분석 - 시계열 데이터란? 1. 시계열 데이터 시계열 데이터는 '시간에 따라 관측된 자료'로 기후 데이터, 주가지수 등이 시계열 데이터입니다. 시계열 데이터는 데이터의 중심값과 산포(흩어진 정도)를 확인합니다. 히스토그램, 확률밀도함수를 그려서 확인 할 수 있으며, 파이썬에서는 Pandas의 describe() 함수로도 확인이 가능합니다. 데이터의 산포는 중심으로부터 어느정도 흩어져있는지 파악하는 것으로 분산, 표준편차, 사분위수로 확인합니다. 분산 표준편차 사분위수 시계열의 중심척도를 알아볼 수 있는 요소로는 평균, 중앙값, 최빈값 등이 있습니다. 평균(average)은 데이터 합의 중심을, 중앙값(mean)은 크기 순으로 나열했을 때 중앙 위치의 값을 나타냅니다. 평균 중앙값 최빈값 시계열은 안정(stationary) 시계열과.. 2019. 12. 26.
텐서(Tensor)란? 텐서(Tensor)는 텐서플로우(Tensorflow)에서 사용하는 자료형(Data type)임. 다차원 배열로 Numpy 배열로 부터 시작함 Rank, Shape, Type 3가지 구성요소가 있음 Rank Array의 차원(Dimension)에 해당함 0 Rank : 스칼라 텐서, 0차원 텐서, ex. 3 1 Rank : 1차원 벡터, ex. [1, 2, 3] 2 Rank : 2차원 벡터, 행렬(Matrix)과 같음, ex. [[1, 2], [1, 2]] 3 Rank : 3차원 벡터, ex. [[[1, 2], [1, 2]], [[1, 2], [1, 2]]] Shape 몇 개의 행과 열을 갖는지를 의미함 3은 shape [] 으로 표현됨 [1, 2, 3]은 shape [3] 으로 표현됨 [[1, 2, 3].. 2019. 9. 21.
인공지능 시대의 비즈니스 전략 늘 새로운 변화가 많은 IT 직종에 근무하는 사람으로써 그동안 IT 환경의 변화는 당연한 것이었다. 그러나 최근 인공지능의 발전은 그 동안의 변화와 다름을 느낀다. 새로운 기술의 등장이 아닌 패러다임의 변화라고나 할까? (물론 인공지능이 최근에 만들어진 것이 아닌 오래된 기술이지만....) 이 책은 인공지능이 활성화되면서 준비해야할 것들을 이야기한다. 단지 기술이 아닌 기술을 활용하는 차원에서 말한다. 저자는 SK텔레콤 데이터 담당 상무이기 때문에 SK의 인공지능 활용사례를 포함하여 실제 인공지능 활용사례를 다양한 관점에서 소개한다. 인공지능을 어떻게 업무에 적용하는지 궁금하신 분들에게 좋은 서적이 될 것이다. 그리고 비지니스 전략 차원에서는 기술활용 뿐 아니라 사고방식, 조직체계, 프로세스 수립부터 바.. 2018. 10. 6.
윈도우 10에 텐서플로우 설치하기 (CPU 버전) 텐서플로우(Tensorflow)는 리눅스 환경에서 개발하는 것을 추천하지만 윈도우즈에서도 개발이 가능하다. 윈도우즈가 편하신 분들이나 리눅스 환경이 없으신 분들은 윈도우즈 환경에서 시작하는 것도 좋을 것이다. 텐서플로우는 GPU, CPU 버전을 선택해서 설치할 수 있는데 CPU버전은 설치가 쉽고 간단한 예제를 실행 수 있지만 복잡한 네트워크를 가진 딥러닝 개발을 위해서는 GPU버전이 필수적이다. 엔비디아 GPU가 장착되어 있는 시스템이면 GPU버전으로 설치하시길 바라며 GPU가 없다면 CPU 버전으로 설치하면 된다. 여기서는 CPU 버전 설치를 설명하고자 한다. 1. 아나콘다(Anaconda) 배포판 설치아나콘다(Anaconda)는 파이썬 배포판이며 수식 계산에 필요한 라이브러리(Matplitlib, N.. 2018. 10. 4.
윈도우 10에 파이썬 설치하기 윈도우 10에 파이썬 설치하기파이썬 다운로드 사이트에 접속하여 설치파일을 다운로드 받습니다. https://www.python.org/downloads/ 저는 텐서플로우를 사용하기 위해 파이썬을 설치하려고 합니다. 텐서플로의 경우 사이트 (https://www.tensorflow.org/install/pip?hl=ko)에서 확인한 결과 현재 파이썬 3.6까지만 지원되네요. 그래서 3.6을 설치하겠습니다. Python 3.6.0 버전을 클릭하시고 다음페이지에서 executable installer를 다운로드하여 설치하시면 됩니다. Install Now를 선택해도 되지만 저의 경우 설치경로 변경을 위해서 Customize installation을 선택하였습니다. 그리고 파이썬 Path 설정을 위해서 Add .. 2018. 10. 3.
사이킷런 (scikit-learn) 사이킷런(scikit-learn)?사이킷런(scikit-learn)은 파이썬 라이브러리이자 오픈소스 커뮤니티이며 프로젝트입니다. 데이터마이닝, 데이터분석, 머신러닝을 위한 도구를 제공하고 있으며 NumPy, SciPy, matplotlib을 포함하고 있습니다. http://scikit-learn.org/ 오픈소스이며 BSD license로 누구나 자유롭게 사용하고 배포할 수 있습니다. 2018. 10. 1.
윈도우 10에 텐서플로우 설치하기 (GPU 버전) 설치순서를 간략히 정리하면 아래와 같다. 1. 파이썬 또는 아나콘다 배포판 설치 2. CUDA Toolkit 설치 3. cuDNN SDK 설치 4. Tensorflow GPU 버전 설치 1. 파이썬 또는 아나콘다(Anaconda) 배포판 설치 텐서플로우 GPU 버전을 설치하기 위해서는 파이썬이 설치되어 있어야 하며, 보통 파이썬을 포함하고 있는 아나콘다라는 배포판을 설치한다. 관련 내용은 아래 사이트를 참고하시길 바란다. 윈도우 10에 텐서플로우 설치하기 (CPU 버전) 2018. 9. 30.