종우의 삶 (전체 공개)
웹개발 종합반 3주차 본문
파이썬을 이용한 데이터 크롤링에 대해 알아보았다.
데이터 크롤링.. 말만 들었는데 이러한 느낌이었구나.
숙제 코드를 한번 살펴보자.
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(URL, headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
song_list = soup.select('#body-content > div.newest-list > div > table > tbody > tr')
for tr in song_list:
title = tr.select_one('.title.ellipsis').text.strip()
artist = tr.select_one('.artist.ellipsis').text.strip()
rate = tr.select_one('.number').text[0:2].strip()
print(rate,title,artist)
여기에 배운것의 대부분이 들어있다고 보면 되겠다.
다양한 라이브러리를 인스톨하고..
마지막으로 웹 사이트에서 데이터를 뽑아오는 연습을 할 수 있었다.
지니뮤직.. 순위표...
soup문법이야 복사해서 쓰면 된다하고..
나머지 변수 지정이나 리스트 작성, 데이터를 보기좋게 만드는 것이 역량이 될 것 같다.
아무튼 열심히 합시다.
'일지' 카테고리의 다른 글
23.05.10 내일배움캠프 A03조 미니프로젝트 02 (0) | 2023.05.10 |
---|---|
23.05.09 내일배움캠프 A03조 미니프로젝트 01 (0) | 2023.05.09 |
SQL 3-4주차 문법 정리 (0) | 2023.04.27 |
SQL 2주차 (0) | 2023.04.26 |
SQL 1주차 (1) | 2023.04.26 |
Comments