웹크롤링_메타 이미지 가져오기
2021. 9. 30. 21:51ㆍ데이터과학/웹크롤링
728x90
반응형
이 뉴스기사의 대표이미지를 크롤링을 통해 가져온다.
https://news.naver.com/main/read.naver?mode=LSD&mid=shm&sid1=103&oid=145&aid=0000015528
개발자 도구창을 열어 <head>안에 <meta property>를 직접 찾아도 되고,
Control + F(맥 : Cmd + F)를 하여 "og:image"라고 직접 검색해서 아래와 같이 찾을 수 있다.
# URL request 해서 HTML 코드를 response 받음.
data = requests.get(url, headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
mage_url = ''
#메타 이미지 가져오기
image_url = soup.select_one('meta[property="og:image"]')['content']
print(image_url)
코드를 실행하면
아래와 같이 이미지링크가 나타난다!
'데이터과학 > 웹크롤링' 카테고리의 다른 글
API란? (0) | 2021.09.24 |
---|---|
Jupyter notebook mportError: No module named (0) | 2020.11.06 |