본문 바로가기
반응형

크롤링/파이썬 주식 크롤링6

[파이썬을 이용한 주식 크롤링] 6.증권플러스 재무제표 가져오기 (4) [파이썬을 이용한 주식 크롤링] 6.증권플러스 재무제표 가져오기 (4) 지난시간에 문제가 생겼었습니다. 날짜를 단순히 연도만 남긴 숫자로 만들었기 때문에 분기로 할 경우 x값이 중복되었는데요. x값을 시계열로 바꿔주겠습니다. 먼저 원리를 간단히 설명하겠습니다. 우리가 크롤링해온 날짜데이터는 아래와 같습니다. 2009-09-01T00:00:00.000+00:00 위 데이터에서 연,월,일만 가져와서 시계열데이터로 만들어줄 것입니다. 아래 코드를 사용합니다. datetime.strptime(tab.baseDate[i][0:10],'%Y-%m-%d') 0:10은 2009-09-01 까지 가져오는 것을 의미하고, 뒤에 %Y-%m-%d 는 입력된 형식입니다. 연,월,일이 - 로 구분되어있다는 의미입니다. datet.. 2020. 7. 24.
[파이썬을 이용한 주식 크롤링] 5.증권플러스 재무제표 가져오기 (3) [파이썬을 이용한 주식 크롤링] 4. 증권플러스 재무제표 가져오기 (3) 지난 시간까지 만든 코드는 아래와 같습니다. 오늘은 아래 코드를 원하는 종목의 코드와 결과를 입력하면 그래프를 출력해주도록 변형할 것입니다. 연간 데이터를 볼지 분기별 데이터를 볼지도 선택하도록 합니다. 아래와 같이 수정하였습니다. 3강에서 만든 코드와 비교하며 공부해보시면 됩니다. 수정한 부분은 빨간색으로 변경하였고, 주석으로 설명하겠습니다. import jsonimport urllib.request as req import pandas as pdimport requestsfrom bs4 import BeautifulSoupfrom matplotlib import pyplot as pltfrom matplotlib import f.. 2020. 7. 22.
[파이썬을 이용한 주식 크롤링] 4.증권플러스 재무제표 가져오기 (2) [파이썬을 이용한 주식 크롤링] 4. 증권플러스 재무제표 가져오기 (2) 지난 시간까지 만든 코드는 아래와 같습니다. import jsonimport urllib.request as req #url 패키지import pandas as pd myurl='https://stockplus.com/api/companies/KOREA-A119610/financial_statements.json'data= req.urlopen(myurl).read() # decoding to python object dataj = json.loads(data.decode('utf-8')) tab=pd.DataFrame(dataj['yearly']) tab에 담겨진 정보를 확인해봅시다. 열이름을 출력합니다. 중요한 변수들만 설명하면.. 2020. 7. 21.
[파이썬을 이용한 주식 크롤링] 3. 증권플러스 재무제표 가져오기 (1) [파이썬을 이용한 주식 크롤링] 3. 증권플러스 재무제표 가져오기 (1) 증권플러스의 경우 html 소스에 '표'가 표시되지 않는다는걸 지난시간에 알게되었습니다. 표를 URL 요청을 통해 가져오는데 URL은 아래와 같았습니다 . https://stockplus.com/api/companies/KOREA-A005930/financial_statements.json 확장자를 보면 json 데이터라는 것을 알 수 있습니다. json데이터의 형식을 조금 더 알아봅시다. 아래 그림을 보면 quaterly 와 yearly 로 나눠진다는 것을 알 수 있습니다. quaterly 는 분기별 데이터이고,yearly 는 연도별 데이터입니다. 펼치기를 클릭하면 아래 그림처럼 날짜,per,pbr 등이 키:쌍 값으로 입력되어 있.. 2020. 7. 17.
반응형