[크롤링] BeautifulSoup 사용하면서 스크래핑해오기 어려웠던 것 정리
항상 HTML 태그를 파싱하기 까다로운 것들이 있는 것 같아요. 그런 것들을 모아서 정리해볼 생각입니다! 크롤링 공부하면서 계속 추가해 나갈 생각입니다. 1. HTML 코드 사이에 태그로 구성되어 있지 않은 텍스트 가져오기 1번 글 2021.11.23 미리보기 내용 2번 글 2021.11.27 미리보기 내용 위 HTML 코드에서 날짜 부분만 가져오기 위한 코드를 작성해보겠습니다. import requests from bs4 import BeautifulSoup html = ''' 1번 글 2021.11.23 미리보기 내용 2번 글 2021.11.27 미리보기 내용 ''' soup = BeautifulSoup(html, 'lxml') titles = soup.find_all('h1') for title i..