本文實例講述了Python爬蟲實現抓取京東店鋪信息及下載圖片功能。分享給大家供大家參考,具體如下:
這個是抓取信息的
from bs4 import BeautifulSoup import requests url = 'https://list.tmall.com/search_product.htm?q=%CB%AE%BA%F8+%C9%D5%CB%AE&type=p&vmarket=&spm=875.7931836%2FA.a2227oh.d100&from=mallfp..pc_1_searchbutton' response = requests.get(url) #解析網頁 soup = BeautifulSoup(response.text,'lxml') #.text將解析到的網頁可讀 storenames = soup.select('#J_ItemList > div > div > p.productTitle > a') #選擇出商店的信息 prices = soup.select('#J_ItemList > div > div > p.productPrice > em') #選擇出價格的信息 sales = soup.select('#J_ItemList > div > div > p.productStatus > span > em') #選擇出銷售額的信息 for storename, price, sale in zip(storenames,prices,sales): storename = storename.get_text().strip() #用get_text()方法篩選出標簽中的文本信息,由于篩選結果有換行符\n所以用strip()將換行符去掉 price = price.get_text() sale = sale.get_text() print('商店名:%-40s價格:%-40s銷售額:%s'%(storename,price,sale)) #使打印出來的信息規范 print('----------------------------------------------------------------------------------------------')
本文標題:Python爬蟲實現抓取京東店鋪信息及下載圖片功能示例-創新互聯
瀏覽地址:http://vcdvsql.cn/article28/ceocjp.html
成都網站建設公司_創新互聯,為您提供手機網站建設、搜索引擎優化、外貿網站建設、關鍵詞優化、做網站、網站制作
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯