지난번 챗GPT로 워드 클라우드 만드는 방법을 쉽게 확인해 봤다.
https://leo-contigo.tistory.com/47
챗GPT+파이썬 : 워드클라우드(Word Cloud) 만들기
예전에 워드 클라우드 포스팅한 적이 있다. https://leo-contigo.tistory.com/24 Python - 워드 클라우드(Word Cloud) 미니 프로젝트하면서 뭔가 배운거 써먹어봐야 하나 하는 생각에 워드 클라우드 생각을 했었
leo-contigo.tistory.com
이번에는 영어가 아닌
한글로 쉽게 데이터를 수집해서 워드클라우드로 표현해보려고 한다.
이건 따로 영상 없이 지난 코드들을 합쳐서 작업해 보았다.

정보를 수집해 보는 건
증권 뉴스들 ㅋㅋㅋㅋㅋ
https://finance.naver.com/news/mainnews.naver?&page=3
주요뉴스 : 네이버페이 증권
관심종목의 실시간 주가를 가장 빠르게 확인하는 곳
finance.naver.com
주식을 보고 있는 틈에 ㅋㅋㅋ
궁금해서 ㅋㅋㅋㅋ
지금 뉴스들을 주요 내용을 워드클라우드로 표현을 해본다면
이슈 되는 단어들이 나오지 않을까 하는 생각에 시작해 봤다.

챗GPT가 알려준 코드
가져올 뉴스 링크와 뉴스 제목과 내용에 해당되는 값을 찾아서 설정해 줌
근데 이건 한 페이지만 나옴
나는 전체 페이지를 원함ㅋㅋㅋ
다시 물어보니 ㅋㅋㅋㅋ 친절하게 알랴줌

이렇게 ㅋㅋㅋㅋㅋㅋㅋㅋ
{page_num} 설정ㅋㅋㅋ
처음에 배울 땐 알았지만 돌아서면 까먹음
이렇게 데이터가 전체 수집이 되었음 ㅋㅋㅋㅋ
Okt
# 형태소 분석기 생성
okt = Okt()
# 제목과 내용을 합쳐서 분석에 활용
text_combined = ' '.join(df['뉴스 제목']) + ' '.join(df['뉴스 내용'])
# 형태소 분석 및 명사 추출
nouns = okt.nouns(text_combined)
# 한 글자 이상의 명사만 추출
nouns = [word for word in nouns if len(word) > 1]
# 추출된 명사 리스트를 공백으로 연결하여 텍스트로 변환
text = ' '.join(nouns)
# 워드 클라우드 생성
wordcloud = WordCloud(font_path='/usr/share/fonts/truetype/nanum/NanumGothic.ttf',
background_color='white',
width=800, height=800,
max_words=100,
colormap='viridis').generate(text)
# 워드 클라우드 출력
plt.figure(figsize=(8, 8))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
결과
ㅋㅋㅋㅋㅋㅋ 하이닉스...........
엔비당 ㅋㅋㅋㅋㅋㅋㅋㅋ
지금은 반도체인가.......
형태소 분석기를
다른 버전으로 돌려봄
KKma
# 형태소 분석기 생성
Kkma = Kkma()
# 제목과 내용을 합쳐서 분석에 활용
text_combined = ' '.join(df['뉴스 제목']) + ' '.join(df['뉴스 내용'])
# 형태소 분석 및 명사 추출
nouns = Kkma.nouns(text_combined)
# 한 글자 이상의 명사만 추출
nouns = [word for word in nouns if len(word) > 1]
# 추출된 명사 리스트를 공백으로 연결하여 텍스트로 변환
text = ' '.join(nouns)
# 워드 클라우드 생성
wordcloud = WordCloud(font_path='/usr/share/fonts/truetype/nanum/NanumGothic.ttf',
background_color='white',
width=800, height=800,
max_words=100,
colormap='viridis').generate(text)
# 워드 클라우드 출력
plt.figure(figsize=(8, 8))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
결과
형태소 분석기에 따라 ㅋㅋ 추출되는 단어들이 다름 ㅋㅋㅋ
여기는 반도체가 ㅋㅋㅋㅋ 작군.....
'파이썬(Python) > 챗GPT+파이썬' 카테고리의 다른 글
챗GPT+데이터분석 : 주식 데이터 예측해보기?ㅋ (0) | 2024.08.10 |
---|---|
챗GPT+데이터분석 : 캐글 브라질이커머스 olist 판매 데이터 (0) | 2024.08.05 |
챗GPT+파이썬 : 자동 번역기 만들기(영어>한국어) (0) | 2024.03.18 |
챗GPT+파이썬 : 워드클라우드(Word Cloud) 만들기 (0) | 2024.03.16 |
챗GPT+파이썬 : 네이버 뉴스 크롤링하기 (0) | 2024.03.14 |