devtools::install_github("hyunyulhenry/HenryQuant") library(HenryQuant)
먼저 패키지를 최신버젼으로 다운받습니다.
get_KOR_price(num_limit = 25)
함수에 필요한 입력변수는 num_limit 입니다.
1당 영업일 기준 대략 30일입니다.
입력변수를 입력하지 않으면 디폴트 값은 25 로써,
25 * 30 = 750,
영업일 기준으로 대략 3년 정도의 데이터를 다운로드 받습니다.
KOR_price 폴더 내에
전종목 가격이 모두 저장됩니다.
다운로드가 완료되면 KOR_price_list.csv 에
전종목들의 가격 데이터가 시계열 형태로 저장됩니다.
명령어를 실행하면 종목들이 차례로 다운로드 됩니다.
타 명령어와 동일하게 명령어가 중간에 중단되어도,
폴더 내에 다운받은 .csv 파일이 존재한다면
새롭게 다운로드 하지 않습니다.
KOR_price 폴더 내에
전종목 가격이 모두 저장됩니다.
삼성전자(005930)의 주가가 잘 저장되어 있습니다.
아모레퍼시픽(090430)의 주가 입니다.
2015년 300만원 즈음에서 1:10 액면분할이 되었죠?
수정주가 답게 잘 적용되어 있습니다.
엠로(058970)의 경우 KONEX 종목이므로
가격을 구할 수 없습니다.
이러한 경우 NA 로 저장되게 됩니다.
간혹 KOSPI, KOSDAQ 종목 임에도 불구하고
크롤링 혹은 R 내부 오류가 발생하는 종목이 있습니다.
해당 종목 역시 NA로 저장되며,
해당 .csv 파일을 삭제한 후 다시 명령어를 실행하면
대부분 정상적으로 다운이 됩니다.
다운로드가 끝난 후 warnings() 를 입력하면
어떠한 종목(티커)의 주가를 다운로드 받지 못했는지 확인할 수 있습니다.
다운로드가 완료되면 KOR_price_list.csv 에
전종목들의 가격 데이터가 시계열 형태로 저장됩니다.
안녕하세요.
답글삭제백테스팅을 공부해 보고자 현열님 블로그에 오게 되었습니다.
전 종목 주가를 받기 위해 HenryQuant 패키지를 설치하고 get_KOR_price() 명령어를 실행했습니다.
그런데 아래와 같이 경고: 3 parsing failures. 오류가 발생합니다.
오류 메시지를 해석해 보면 1열 데이터인데 2열 데이터가 들어와서 오류가 발생하는 거 같은데, 데이터의 구조를 볼 수가 없어서 잘못된 부분을 모르겠습니다.
혹시 알려주실 수 있으실까요?
경고: 3 parsing failures.
row col expected actual file
20 -- 1 columns 2 columns literal data
25 -- 1 columns 2 columns literal data
127 -- 1 columns 2 columns literal data
에러: Can't subset columns that don't exist.
x Locations 2, 3, 4, and 7 don't exist.
i There are only 1 column.
Run `rlang::last_error()` to see where the error occurred.