종우의 삶 (전체 공개)

웹개발 종합반 3주차 본문

일지

웹개발 종합반 3주차

jonggae 2023. 4. 28. 17:01

파이썬을 이용한 데이터 크롤링에 대해 알아보았다.

데이터 크롤링.. 말만 들었는데 이러한 느낌이었구나.

 

숙제 코드를 한번 살펴보자.

 

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(URL, headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')

song_list = soup.select('#body-content > div.newest-list > div > table > tbody > tr')

for tr in song_list:
    title = tr.select_one('.title.ellipsis').text.strip()
    artist = tr.select_one('.artist.ellipsis').text.strip()
    rate = tr.select_one('.number').text[0:2].strip()
    print(rate,title,artist)

 

여기에 배운것의 대부분이 들어있다고 보면 되겠다.

다양한 라이브러리를 인스톨하고..

마지막으로 웹 사이트에서 데이터를 뽑아오는 연습을 할 수 있었다.

 

지니뮤직.. 순위표... 

 

soup문법이야 복사해서 쓰면 된다하고..

나머지 변수 지정이나 리스트 작성, 데이터를 보기좋게 만드는 것이 역량이 될 것 같다.

 

아무튼 열심히 합시다.

 

 

 

'일지' 카테고리의 다른 글

23.05.10 내일배움캠프 A03조 미니프로젝트 02  (0) 2023.05.10
23.05.09 내일배움캠프 A03조 미니프로젝트 01  (0) 2023.05.09
SQL 3-4주차 문법 정리  (0) 2023.04.27
SQL 2주차  (0) 2023.04.26
SQL 1주차  (1) 2023.04.26
Comments