프로그래밍/Python
[크롤링] 파이썬으로 다음 영화 순위 실시간 예매율 가져오기
안녕하세요! 이번에는 크롤링 연습 예제로 다음(DAUM)의 "영화순위"를 가져와보려고 합니다! 다음 영화 순위는 최대 TOP 30까지 보여줍니다. 각 영화 정보는 크게 [이미지, 제목, 평점, 리뷰수, 예매율, 개봉일자]로 구성됩니다. 이번 포스트에서는 정확히 저렇게 6개 항목을 가져와서 출력해보고, 마지막으로 영화 제목과 순위 그리고 이미지를 파일로 저장해볼 생각입니다. 아래 이미지를 보시다시피 한 페이지에 5개의 영화정보가 나오고, 페이지 수는 6개이므로 총 30개의 영화에 대한 순위를 나타냅니다. 이제 위 이미지의 빨간 상자로 표시된 부분을 HTML 코드로 분석해보겠습니다. 보시다시피 ol.movie_list 태그 안에 li 태그들이 많이 있습니다. 그리고 li 태그들이 정확히 30개 임은 세워보면..