반응형
안녕하세요! 오늘은 selenium을 이용한 간단한 웹 크롤링입니다.
사전 준비
- selenium 설치
selenium이 설치가 안되신 분들은 pip install selenium 으로 먼저 설치합니다.
- chromedriver 설치
크롬 - 더보기 - 도움말 Chrome 정보에 가시면 자신의 Chrome 버전이 나와있습니다.
버전에 맞게 chromedriver를 설치합니다.
크롤링
- 원하는 페이지로 들어갑니다. 저는 아래의 기사를 이용하였습니다.
news.v.daum.net/v/20210329142236043
- 가져올 내용을 아래와 같이 copy 합니다 (selector 사용)
- 해당 기사의 주소와 Copy selector를 넣어주면 기사 본문을 가져오게 됩니다.
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome('chromedriver')
driver.implicitly_wait(1)
driver.get("https://news.v.daum.net/v/20210329142236043") #기사 주소
driver.implicitly_wait(1)
elem = driver.find_element_by_css_selector("#harmonyContainer") # Copy한 selector
print(elem.text)
반응형
'코딩 기록 > PYTHON' 카테고리의 다른 글
[Python] 파이썬으로 오라클 데이터베이스 가져오기 (0) | 2021.04.27 |
---|---|
[Python] 네이버 이메일 보내기 (0) | 2021.04.23 |
[Python] tesseract를 이용한 자동차 번호판 인식기 - 2 (0) | 2021.04.01 |
[Python] tesseract를 이용한 자동차 번호판 인식기 - 1 (0) | 2021.04.01 |
[Python] Flask를 이용하여 카카오페이 API 사용하기 (0) | 2021.03.27 |