본문 바로가기
파이썬으로 정규분포 데이터와 챠트 만들기 파이썬으로 정규분포 데이터와 챠트를 만들어보자. 먼저 Numpy의 linspace 함수를 이용해 특정범위의 일정 간격의 랜덤 값을 생성한다. import numpy as np x = np.linspace(-3, 3, 200) print(x) [-3. -2.96984925 -2.93969849 -2.90954774 -2.87939698 -2.84924623 -2.81909548 -2.78894472 -2.75879397 -2.72864322 -2.69849246 -2.66834171 -2.63819095 -2.6080402 -2.57788945 -2.54773869 -2.51758794 -2.48743719 -2.45728643 -2.42713568 -2.39698492 -2.36683417 -2.3366.. 2020. 4. 28.
배움의 발견 - 타라 웨스트오버 세상 속에는 별별 사람들의 별별 이야기들이 많다. 이 책은 실화이지만 소설 같은 이야기라고 할 수 있겠다. 책을 읽기 전 이야기의 흐름은 뻔할 것으로 예측했다. 열 여섯살까지 학교에 가본 적이 없는 아이가 캠브리지 박사학위를 받을 때까지의 이야기로 배움에 대한 어려움을 극복하고 이뤄내는 이야기이라고 생각했으나... 내용은 전혀 달랐다. 주인공에게 교육이란 흔히 말하는 공교육을 의미하진 않았다. 부모에게 받은 교육, 환경으로 부터 습득한 교육, 공교육, 자아를 찾는 교육 등 교육의 이면이 많다. 그렇다고 해도 주인공에게 교육이 불러온 파장은 너무 컸다. 이 책의 마지막 구절이다.그날 밤 나는 그 소녀를 불렀지만 그녀는 대답하지 않았다. 나를 떠난 것이다. 그 소녀는 거울 속에 머물렀다. 그 이후에 내가 내.. 2020. 4. 23.
상관관계, 상관계수 1. 상관관계 분석(Correlation Analysis)이란? 상관계수(Correlation)는 두 변수간 연관성을 알아보는 지표이다. 상관계수로 키와 몸무게, 공부한 시간과 성적과의 관계나 판매 촉진비와 매출 간의 관계를 파악할 수 있다. 상관계수 중에는 피어슨(Pearson) 상관계수가 가장 많이 알려져 있다. 피어슨 상관계수는 -1.00 ~ 1.00 사이의 값을 가지며 -1.00이나 1.00에 가까울수록 변수 간 연관성이 높다고 볼 수 있으나, 인과관계를 이야기하는 것이 아니니 주의해야한다. 예를 들어, 경찰서와의 거리와 범죄율과는 상관관계가 높을 수 있는데 경찰서가 많아서 범죄율이 낮을 수는 있지만, 범죄율이 낮아서 경찰서가 많다는 것은 이상한 논리이다. 그리고 통화량과 물가 간의 상관관계가 높.. 2020. 4. 22.
파이썬에서 텍스트 파일 읽고 쓰기 파이썬에서 파일을 읽고 쓰는 방법은 다양하다. open() 함수를 이용 Numpy 패키지의 loadtxt(), writetxt() 이용 Pandas 패키지의 read_csv(), to_csv() 이용 데이터 분석을 위해서는 csv 파일을 이용하는 경우 pandas를 이용하고 텍스트 파일인 경우 open() 함수를 이용하면 좋을 것이다. 여기서는 open() 함수를 이용한 텍스트 파일(txt)을 읽고 쓰는 것을 정리한다. 1. 파일 쓰기 open() 함수을 이용하여 파일을 읽고 쓸 수 있다. open() 함수가 궁금하면 아래처럼 함수이름에 물음표(?)를 이용하면 함수의 프로토타입(Prototype, Docstring)을 확인해보자. open() 함수에서 mode='w'로 두어 파일을 생성하고 write().. 2020. 4. 21.
설이 - 심윤경 어느 작가의 소설을 읽고 나면 작가의 다른 소설이 궁금해진다. (물론 그 소설이 마음에 들었을 때..) 설이 또한 심윤경 작가의 소설인 '나의 아름다운 정원'을 읽고 작가의 다른 소설이 궁금해서 찾은 소설이다. 높은 평점과 얇은 책 두께, 출간되지 얼마되지 않았다는 점으로 인해 보다 쉽게 결정할 수 있었다. 설이라는 인물. 보육원에서 길러져 입양과 파양을 반복한 어린아이 강한 듯 나약한 설이의 시선으로 소설은 쓰여졌다. 과연 우리는 설이의 시선으로 살아갈 수 있을까? 아이의 시선에 어른은 너무나도 비겁하고 추악한 존재이며 세상은 한없이 절망적일 것이다. 짧은 이야기 속에 울림도 있었고 복잡 미묘한 감정이 들었다. 도서 평을 보면 책을 읽으면서 울었다는 사람들이 많던데 나는 그저 복잡 미묘했다. 어른으로써.. 2020. 4. 15.
비인 해수욕장 오래된 사진이지만 가끔씩 보게 된다. 그때 난 무엇에 이끌렸을까. 2020. 4. 14.
scikit-learn와 statsmodels 파이썬으로 회귀분석, 시계열 분석 등의 데이터 분석을 위해서는 아래 두가지 패키지를 살펴봐야 한다. 1. scikit-learn https://scikit-learn.org/stable/ scikit-learn: machine learning in Python — scikit-learn 0.22.2 documentation Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more... scikit-learn.org 데이터 분석을 .. 2020. 4. 13.
파이썬 문자열 포매팅(formatting) 파이썬 문자열 포매팅은 크게 두가지로 나눌 수 있다. % 이용 format() 이용 1. 서식 지정자 % 이용 방법 서식지정자라고 하는 %s, %d, %f 는 파이썬2에서 사용하던 방식이다. 최근까지도 많이 사용되고 있지만 개인적으로는 format() 함수를 이용하길 권한다. 하지만 예전 소스를 보다보면 많이 볼 수도 있으니 공부해두는 것이 좋겠다. 사용 방법은 % 뒤에 s, d, f 를 붙혀서 사용한다. %s : 문자형(String) 서식 %d : 숫자형(Decimal) 서식 %f : 소수형(Float) 서식 s_name = 'My name is %s' % '홍길동' print(s_name) s_age = 'My age is %d' % 20 print(s_age) s_score = 'My Score i.. 2020. 4. 6.
Jupyter Notebook 시작시 브라우저가 자동실행 되지 않을 때 파이썬 개발도구로 주피터 노트북(Jupyter Notebook)을 많이 사용한다. 자동완성 기능이 빈약하거나 ipynb라는 특별한 파일 형식을 사용하는 것이 단점일 수 있지만, 코드를 셀 단위로 실행할 수 있다 건 장점이다. 물론 쉽고 편리하기도 하다. 개발 프로젝트에서는 PyCharm을 사용하고, 테스트나 연습 용도로 주피터 노트북을 사용한다면 좋은 선택이 될 것이다. 학교에서 강의할 때도 주피터 노트북(Jupyter Notebook)을 사용하는데, 실행 시 브라우저가 열리지 않아 질문하는 경우가 많다. (참고로 주피터 노트북은 브라우저에서 실행된다) 일반적으로 주피터 노트북을 실행하면 브라우저(익스플로러, 구글 크롬)가 자동으로 실행되지만, 자동으로 실행되지 않으면 설정파일을 수정하면 된다. 설정파일.. 2020. 4. 5.
강원국의 글쓰기 - 강원국 가끔 서점에 간다. 책을 구입하건 안하건 분위기를 좋아해 들렸다가 책을 사기도 한다. 강원국이라는 저자를 알게 된 것도 서점에서 들려서였다. 김대중, 노무현 대통령의 연설비서관을 지냈고, '대통령의 글쓰기', '회장님의 글쓰기' 등의 과거 집필 이력이 있었기에 거리낌 없이 책을 구입할 수 있었다. 개인적으로 글쓰기에 대한 책을 몇권 읽었다. 이 글을 쓰면서 몇 권쯤 되나 곱씹어보니 생각보다는 많이 읽은 것 같다. 유혹하는 글쓰기 - 스티븐 킹 글쓰며 사는 삶 - 나탈리 골드버그 글쓰기의 공중부양 - 이외수 소설가의 일 - 김연수 문장강화 - 이태준 많은 사람들은 글쓰기 추천서로 이태준의 '문장강화'를 이야기하지만 개인적으로 그 책은 다 읽지 못했다. 나머지는 다 읽었는데, 읽은 책 중엔 '유혹하는 글쓰기.. 2020. 3. 29.
두려움 없는 조직 - 에이미 애드먼슨 회사의 경영자, 관리자, 리더 역할을 하는 경우(혹은, 그렇지 않더라도) 효율적인 조직에 대해서는 늘 고민한다. 그 고민에 대한 책의 주제는 간단명료하다. 훌륭한 조직은 심리적 안정감이 있어야 한다는 것. 요즘처럼 불확실한 시대에서 조직은 심리적 안정감으로 자유롭게 토론할 수 있어야 하며, 각자의 의견을 자유롭게 게시할 수 있고, 새로움과 위험상황에 대한 대처가 빨라야 한다. 새로운 것에 도전하고 학습해야 하며, 실패를 두려워하지 않고 나아갈 수 있어야 한다. 여기서 심리적 안정감은 무조건적인 친절과는 다르다. 조직의 동기부여 없이는 의미가 없고, 명확한 규율 또한 뒷받침이 되어야 한다. 생각건대, 조직에는 어느 정도의 긴장감이 필요하다. 하지만 두려움으로 침묵하는 조직이 되어서는 안 될 것이다. 심리적.. 2020. 3. 23.
애틀란타(Atlanta) 코로나19가 미국에 상륙하기 직전, 해외출장을 다녀왔다. 당시 찍었던 컬러사진을 흑백으로 변경했다. 누군가 그랬다. 흑백이 빛을 더 잘 표현한다고. 흑백은 단순하면서 여백도 깊다. 그래서일까? 가끔 흑백사진이 그립고 흑백사진을 닮고 싶다는 생각이 든다. 2020. 3. 22.