웹크롤링_메타 이미지 가져오기

2021. 9. 30. 21:51데이터과학/웹크롤링

728x90
반응형

이 뉴스기사의 대표이미지를 크롤링을 통해 가져온다.

https://news.naver.com/main/read.naver?mode=LSD&mid=shm&sid1=103&oid=145&aid=0000015528 

 

‘오징어게임’ 속 ‘달고나’ 해외 열풍 “쉬운 줄 알았는데···”

[레이디경향] 넷플릭스 오리지널 시리즈 <오징어게임>의 글로벌 열풍이 달고나의 인기로 이어지고 있다. 최근 <오징어게임> 인기에 힘입어 해외 유튜버와 틱톡 사용자들은 앞다투어 극 중

news.naver.com

 

개발자 도구창을 열어 <head>안에 <meta property>를 직접 찾아도 되고,

Control + F(맥 : Cmd + F)를 하여 "og:image"라고 직접 검색해서 아래와 같이 찾을 수 있다.

 

# URL request 해서 HTML 코드를 response 받음.
data = requests.get(url, headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')
mage_url = ''

#메타 이미지 가져오기
image_url = soup.select_one('meta[property="og:image"]')['content']
print(image_url)

코드를 실행하면

아래와 같이 이미지링크가 나타난다!

'데이터과학 > 웹크롤링' 카테고리의 다른 글

API란?  (0) 2021.09.24
Jupyter notebook mportError: No module named  (0) 2020.11.06