Soft_Ware/Python(5)
-
Python 데이터 분석(4)
이번 블로그는 파이썬을 이용한 주식 데이터 분석에 관한 글이다. 우선 주식에 관해서 기초적으로 알아야 하는 지식이 있는데, 주식에는 주식마다 종목 코드가 존재한다. 또한 그 종목코드는 6자리로 정해져 있다. ex)134123, 002345 등 따라서 우리가 다룰 주식 데이터에 대해서도 종목코드가 존재하는데 코드의 숫자가 6자리라는 것을 유의해야한다. 필자가 가지고 있던 주식 데이터에는 회사명, 종목코드, 업종, 주요 제품 등 여러가지 칼럼이 있었고, 회사명, 종목코드 칼럼만 추출하는 파이썬 문법은 다음과 같다. import pandas as pd import matplotlib.pyplot as plt 아, 우선 가장 상단에 패키지를 import 해줘야 한다. code = cd.read_csv('data..
2021.08.02 -
Python 데이터 분석(2)
이번 블로그는 지난 블로그보다 조금 더 복잡한 데이터를 다루기로 하자. 사용할 데이터는 상가에 대한 분류명,업소번호,도로명, 시군구 등 39개의 column을 가지는 데이터를 다룬다. 우선 저번과 마찬가지로 Python의 Pandas 라이브러리를 이용하여 csv파일을 읽어들이자. 다음과 같이 읽어들인 데이터는 여러가지 column에 의해서 나뉘며, 데이터의 수도 상당하다. 이렇게 Column이 많은 데이터의 경우 이를 확인하는 방법이 있는데 다음과 같다. list(변수 이름) ##len(list(변수이름))으로 list의 숫자도 파악할 수 있다. 또한 하나의 칼럼에서 분류되는 특징이 어떤 것이 있는지 알 수 있는 방법도 있다. set(변수이름['칼럼 이름']) 필자는 가지고 있는 데이터에서 구에 따른 치..
2021.07.17 -
Python 데이터 분석(3)
오늘은 필자가 수강중인 코딩클럽에서 수강자들이 왜 강의를 수강 도중 포기하는가 그리고 어떤 부분이 문제인가를 파악하기 위해서 강의에 따른 수강완료 수의 합계 그리고 요일에 따른 수강완료 수의 합계에 대한 데이터를 추출하였다. 여느때와 같이 Pandas와 Matplotlib을 사용하였다. import pandas as pd import matplotlib.pyplot as plt plt.rcParams['font.family'] = 'Malgun Gothic' enroll = pd.read_csv('./data/enrolleds_detail.csv') enroll_detail = enroll.groupby('lecture_id')['user_id'].count() lectures=pd.read_csv('...
2021.07.17 -
Python 데이터분석(1)
Pandas pandas는 파이썬 라이브러리로 엑셀과 같이 데이터를 분석하는 라이브러리이다. import pandas as pd 위와 같이 Import를 통해 라이브러리를 포함시켜주고 간결성을 위해 pd로 수행되곤 한다. 주로 파이썬에서 데이터 분석을 위해서 엑셀 등의 파일을 활용하는데 pandas에서는 이러한 엑셀등의 파일을 읽어오는 pandas.read_* 메소드를 제공한다. chicken07 = pd.read_csv('./data/chicken_07.csv') 다음은 치킨데이터를 담고있는 chicken_07.csv파일을 pd.read_csv를 통하여 읽어 들인 모습이다. 이와 같은 데이터를 불러오고 chicken07을 Jupyter Notebook을 통해 확인해보면 엑셀파일과 같이 한눈에 알아보도록..
2021.07.05 -
Python 기초 문법
Python에서 아주 기초적으로 사용하는 문법 및 예시들을 Jupyter Notebook을 통해 설명한다. 1)변수와 자료형 C언어나 JAVA에서와 마찬가지로 Python에서도 변수와 자료형이 존재한다. 변수란, 변할수 있는 수로 코드를 작성할 시에 변할 수 있다. 위는 Jupyter NoteBook을 이용하여 a라는 변수를 선언하고 a를 출력한 것이다. Jupyter NoteBook은 출력을 매우 간단하게 변수만 입력함으로써 가능케 한다. Run은 Ctrl + Enter 와 Alt + Enter 그리고 여러가지 방법들이 많은데 필자는 New Line(?)이 생성되는 Alt + Enter를 많이 사용하였다. 다음과 같이 변수에 작은 따옴표 혹은 큰 따옴표를 이용해 문자열을 저장할 수도 있다. 이 외에도 ..
2021.07.03