크롤링 - 주식데이터
본문 바로가기
파이썬(Python)/크롤링 연습

크롤링 - 주식데이터

by 레아დ 2023. 4. 6.

아주 오랜만에 글을 써본다.
깃허브에도 머신러닝 관련 업로드 하긴 했지만 여기까지 잘 오지않는다.
인터넷에서 돌아다니다가 주식데이터 쉽게 크롤링 할 수 있을거 같다는 영상을 봐서
한번 따라 해봤다.
 

유튜브 "AI School" 참고

https://www.youtube.com/watch?v=XLcwsxXwlNw

 
여기서 새롭게 알게된 내용은 주식데이터 크롤링을 위한 파이썬 라이브러리 이다.
 

Finace Data Reader

https://github.com/financedata-org/FinanceDataReader

GitHub - financedata-org/FinanceDataReader: Financial data reader

Financial data reader. Contribute to financedata-org/FinanceDataReader development by creating an account on GitHub.

github.com

 
 

# Finance Data Reader 설치 및 라이브러리 임포트

!pip install finance-datareader

import pandas as pd
import FinanceDataReader as fdr
import matplotlib.pyplot as plt
from tqdm.notebook import tqdm

# 코랩 한글 설정은 여기서는 생략함
# 폰트설정
plt.rc('font', family='NanumBarunGothic')

# 1_거래소별 종목 리스트 받기
# KRX       : KRX 종목 전체
# KOSPI     : 코스피
# KOSDAQ    : 코스닥

fdr.StockListing('KOSPI')
kospi_list = fdr.StockListing('KOSPI')
kosdaq_list = fdr.StockListing('KOSDAQ')

# 코스피
kospi_list.sample(5)

~

뭐가 엄청 간편함ㅋㅋㅋㅋㅋㅋㅋ

# 2_단일 종목 주가 정보
# LG전자😅

# kospi에서 LG전자 종목 찾기

kospi_list[kospi_list['Name'] == 'LG전자']

# LG전자 전체 데이터 (~ 현재)
fdr.DataReader('066570')

# 2020년부터 현재까지
fdr.DataReader('066570', '2020')

# 2020년 01월부터 2023년 01월까지 
fdr.DataReader('066570', '2020-01-01','2023-01-31')

# 결과는 요 마지막꺼만

~ 좀 올라가라 올라가라 ~

( 1개 가지고 있나..???ㅋㅋ 그럴듯 ㅋㅋㅋㅋㅋ)

# 캔들 차트 
# 최근 2020년부터
df_lg2 = fdr.DataReader('066570', '2020-01-01')
fdr.chart.plot(df_lg2, title = 'LG전자(066570)')
# 3_여러 종목 주가 받기
kospi_list[kospi_list['Name'].str.contains('카카오|삼성전자|NAVER')]
# 여기서 이름, 종목코드 알기

# 원하는 종목
stock_list = [
  ["삼성전자", "005930"],
  ["LG전자", "066570"],
  ["카카오", "035720"],
  ["NAVER", "035420"],
]

df = [fdr.DataReader(code, '2020-01-01')['Close'] for name, code in stock_list]
len(df)

# pd.concat() 으로 합치기

df2 = pd.concat(df, axis=1)
df2.columns =  [name for name, code in stock_list]
df2

나으 주식계좌에 네이버는 없음...... 😢

# 시각화
df2.plot(figsize = (10, 5));

일단 나는 국내 코스피 지수로 파악해봄
근데 저기 라이브러리에 가상회폐도 확인 가능함ㅋㅋㅋㅋㅋㅋ
보고싶지 않음...........😭

작성한 이것저것 내용들은 깃허브에 업로드 되어 있음

728x90