본문 바로가기
반응형

크롤링3

[파이썬을 이용한 주식 크롤링] 6.증권플러스 재무제표 가져오기 (4) [파이썬을 이용한 주식 크롤링] 6.증권플러스 재무제표 가져오기 (4) 지난시간에 문제가 생겼었습니다. 날짜를 단순히 연도만 남긴 숫자로 만들었기 때문에 분기로 할 경우 x값이 중복되었는데요. x값을 시계열로 바꿔주겠습니다. 먼저 원리를 간단히 설명하겠습니다. 우리가 크롤링해온 날짜데이터는 아래와 같습니다. 2009-09-01T00:00:00.000+00:00 위 데이터에서 연,월,일만 가져와서 시계열데이터로 만들어줄 것입니다. 아래 코드를 사용합니다. datetime.strptime(tab.baseDate[i][0:10],'%Y-%m-%d') 0:10은 2009-09-01 까지 가져오는 것을 의미하고, 뒤에 %Y-%m-%d 는 입력된 형식입니다. 연,월,일이 - 로 구분되어있다는 의미입니다. datet.. 2020. 7. 24.
[파이썬을 이용한 주식 크롤링] 4.증권플러스 재무제표 가져오기 (2) [파이썬을 이용한 주식 크롤링] 4. 증권플러스 재무제표 가져오기 (2) 지난 시간까지 만든 코드는 아래와 같습니다. import jsonimport urllib.request as req #url 패키지import pandas as pd myurl='https://stockplus.com/api/companies/KOREA-A119610/financial_statements.json'data= req.urlopen(myurl).read() # decoding to python object dataj = json.loads(data.decode('utf-8')) tab=pd.DataFrame(dataj['yearly']) tab에 담겨진 정보를 확인해봅시다. 열이름을 출력합니다. 중요한 변수들만 설명하면.. 2020. 7. 21.
[파이썬을 이용한 주식 크롤링] 3. 증권플러스 재무제표 가져오기 (1) [파이썬을 이용한 주식 크롤링] 3. 증권플러스 재무제표 가져오기 (1) 증권플러스의 경우 html 소스에 '표'가 표시되지 않는다는걸 지난시간에 알게되었습니다. 표를 URL 요청을 통해 가져오는데 URL은 아래와 같았습니다 . https://stockplus.com/api/companies/KOREA-A005930/financial_statements.json 확장자를 보면 json 데이터라는 것을 알 수 있습니다. json데이터의 형식을 조금 더 알아봅시다. 아래 그림을 보면 quaterly 와 yearly 로 나눠진다는 것을 알 수 있습니다. quaterly 는 분기별 데이터이고,yearly 는 연도별 데이터입니다. 펼치기를 클릭하면 아래 그림처럼 날짜,per,pbr 등이 키:쌍 값으로 입력되어 있.. 2020. 7. 17.
반응형