Coding

쿠팡 상품 크롤러

쿠팡 상품 크롤러 📜쿠팡 상품 크롤링 뉴스 검색 결과에서 제목 및 URL 크롤링 조건 1. 100개까지만 상품 추출 조건 2. 광고상품 표시 조건 3. 엑셀 파일로 결과 저장 import requests from bs4 import BeautifulSoup import pyautogui import openpyxl keyword = pyautogui.prompt("검색어를 입력하세요 >> ") wb = openpyxl.Workbook('coupang_result.xlsx') ws = wb.create_sheet(keyword) ws.append(['순위','브랜드명','상품명','가격','상세페이지링크']) rank = 1 done = False for page in range(1,5): if done == True: break print(page, "번째 페이지 입니다....

네이버 주식 현재가 정보 수집

1️⃣ 네이버 주식 현재가 정보 수집 네이버 증권 사이트 현재가 데이터를 파이썬으로 수집 📜네이버 주식 현재가 크롤링 크롤링 해올 정보의 id 값과 URL의 파라미터를 확인 필요 id="_nowVal" / ?code=086960 (URL 상의 종목 코드 확인) import requests from bs4 import BeautifulSoup #종목 코드 리스트 codes = [ '005930', '000660', '035720' ] for code in codes: url = f"https://finance.naver.com/item/sise.naver?code={code}" reponse = requests.get(url) html = reponse.text soup = BeautifulSoup(html, "html.parser") price = soup.select_one("#_nowVal").text price = price....

crawler

1️⃣ Crawler Python 을 이용한 Crawler 📜crawler를 위해 필요한 내용들 requests HTTP 통신을 위한 Python 라이브러리 beautifulsoup HTML 분석을 위한 Python 라이브러리 pyautogui CSS 선택자 크롤링할 HTML 태그를 선택할때 사용함 태그 선택자 (h1, a 등 태그 이름으로 선택) id 선택자 (#을 앞에 붙인 후 id 값으로 선택) HTML <div id="articleBody"> 본문-- </div> 선택자 #airticleBody class 선택자 (.을 앞에 붙인 후 class 값으로 선택) HTML <div class="info_group"> 뉴스목록 </div> 선택자 .airticleBody 자식 선택자 (바로 아래에 있는 태그를 선택한다)...

네이버 뉴스 크롤러

네이버 뉴스 크롤러 📜네이버 뉴스 크롤링 네이버 뉴스 검색 > 일반, 연예, 스포츠 뉴스가 각각 다르게 크롤링 후 엑셀파일에 저장 import requests from bs4 import BeautifulSoup import pyautogui from openpyxl import Workbook from openpyxl.styles import Alignment # 사용자 입력 keyword = pyautogui.prompt("검색어를 입력하세요") lastpage = int(pyautogui.prompt("몇 페이지까지 크롤링 할까요?")) pageNum = 1 # 엑셀 생성하기 wb = Workbook() # 워크 시트 생성하기 ws = wb.create_sheet(f"{keyword}") # 열 너비 조절 ws....