Post List

2018년 3월 7일 수요일

get_KOR_price: 국내 전종목 수정주가 다운로드





devtools::install_github("hyunyulhenry/HenryQuant")
library(HenryQuant)


먼저 패키지를 최신버젼으로 다운받습니다.




get_KOR_price(num_limit = 25)


함수에 필요한 입력변수는 num_limit 입니다.
1당 영업일 기준 대략 30일입니다.

입력변수를 입력하지 않으면 디폴트 값은 25 로써,
25 * 30 = 750,
영업일 기준으로 대략 3년 정도의 데이터를 다운로드 받습니다.




명령어를 실행하면 종목들이 차례로 다운로드 됩니다.

타 명령어와 동일하게 명령어가 중간에 중단되어도,
폴더 내에 다운받은 .csv 파일이 존재한다면
새롭게 다운로드 하지 않습니다.



KOR_price 폴더 내에
전종목 가격이 모두 저장됩니다.





삼성전자(005930)의 주가가 잘 저장되어 있습니다.






아모레퍼시픽(090430)의 주가 입니다.
2015년 300만원 즈음에서 1:10 액면분할이 되었죠?

수정주가 답게 잘 적용되어 있습니다.




엠로(058970)의 경우 KONEX 종목이므로
가격을 구할 수 없습니다.

이러한 경우 NA 로 저장되게 됩니다.


간혹 KOSPI, KOSDAQ 종목 임에도 불구하고
크롤링 혹은 R 내부 오류가 발생하는 종목이 있습니다.

해당 종목 역시 NA로 저장되며,
해당 .csv 파일을 삭제한 후 다시 명령어를 실행하면
대부분 정상적으로 다운이 됩니다.





다운로드가 끝난 후 warnings() 를 입력하면
어떠한 종목(티커)의 주가를 다운로드 받지 못했는지 확인할 수 있습니다.





다운로드가 완료되면 KOR_price_list.csv
전종목들의 가격 데이터가 시계열 형태로 저장됩니다.


댓글 1개:

  1. 안녕하세요.
    백테스팅을 공부해 보고자 현열님 블로그에 오게 되었습니다.
    전 종목 주가를 받기 위해 HenryQuant 패키지를 설치하고 get_KOR_price() 명령어를 실행했습니다.
    그런데 아래와 같이 경고: 3 parsing failures. 오류가 발생합니다.
    오류 메시지를 해석해 보면 1열 데이터인데 2열 데이터가 들어와서 오류가 발생하는 거 같은데, 데이터의 구조를 볼 수가 없어서 잘못된 부분을 모르겠습니다.
    혹시 알려주실 수 있으실까요?


    경고: 3 parsing failures.
    row col expected actual file
    20 -- 1 columns 2 columns literal data
    25 -- 1 columns 2 columns literal data
    127 -- 1 columns 2 columns literal data

    에러: Can't subset columns that don't exist.
    x Locations 2, 3, 4, and 7 don't exist.
    i There are only 1 column.
    Run `rlang::last_error()` to see where the error occurred.

    답글삭제