Python爬虫实现抓取京东店铺信息及下载图片功能示例-创新互联

本文实例讲述了Python爬虫实现抓取京东店铺信息及下载图片功能。分享给大家供大家参考,具体如下:

创新互联长期为千余家客户提供的网站建设服务,团队从业经验10年,关注不同地域、不同群体,并针对不同对象提供差异化的产品和服务;打造开放共赢平台,与合作伙伴共同营造健康的互联网生态环境。为印台企业提供专业的成都网站建设、网站设计,印台网站改版等技术服务。拥有十余年丰富建站经验和众多成功案例,为您定制开发。

这个是抓取信息的

from bs4 import BeautifulSoup
import requests
url = 'https://list.tmall.com/search_product.htm?q=%CB%AE%BA%F8+%C9%D5%CB%AE&type=p&vmarket=&spm=875.7931836%2FA.a2227oh.d100&from=mallfp..pc_1_searchbutton'
response = requests.get(url)                          #解析网页
soup = BeautifulSoup(response.text,'lxml')                   #.text将解析到的网页可读
storenames = soup.select('#J_ItemList > div > div > p.productTitle > a')    #选择出商店的信息
prices = soup.select('#J_ItemList > div > div > p.productPrice > em')     #选择出价格的信息
sales = soup.select('#J_ItemList > div > div > p.productStatus > span > em')  #选择出销售额的信息
for storename, price, sale in zip(storenames,prices,sales):
  storename = storename.get_text().strip()   #用get_text()方法筛选出标签中的文本信息,由于筛选结果有换行符\n所以用strip()将换行符去掉
  price = price.get_text()
  sale = sale.get_text()
  print('商店名:%-40s价格:%-40s销售额:%s'%(storename,price,sale))   #使打印出来的信息规范
  print('----------------------------------------------------------------------------------------------')


网站标题:Python爬虫实现抓取京东店铺信息及下载图片功能示例-创新互联
网站地址:http://ptjierui.cn/article/ceocjp.html

其他资讯

Copyright © 2024 青羊区广皓图文设计工作室(个体工商户)(郫都区郫县站) All Rights Reserved 蜀ICP备19037934号
友情链接: 重庆企业网站建设 营销网站建设 网站设计制作报价 网站制作 宜宾网站设计 手机网站制作 app网站建设 成都网站设计制作公司 重庆网站设计 高端网站建设 泸州网站建设 定制网站建设多少钱 网站制作报价 攀枝花网站设计 定制网站设计 企业网站建设公司 成都响应式网站建设 四川成都网站建设 高端定制网站设计 营销型网站建设 网站建设公司 营销型网站建设