平步青云win

2020-04-12 12:43 已编辑东南大学 C++

关注

Python爬取淘宝商品的销量

运行程序，输入想要爬取的商品关键词，在代码中的‘###’可以进一步约束商品的属性，比如某某作者的书籍，可以在###处输入作者名字，以及时期等等。最后可以得到所要商品的总销量

本人博客：专属博客，欢迎浏览

import requests
import bs4
import re
import json

def open(keywords, page):
      headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36"}

      payload = {'q':keywords, 'sort':"sale-desc", 's':(page-1)*44}
      url = "https://s.taobao.com/search"

      res = requests.get(url, params = payload)
      return res
      
      
def get_item(res):

      g_page_config = re.search(r'g_page_config = (.*?);\n', res.text)
      page_config_json = json.loads(g_page_config.group(1))
      page_item = page_config_json['mods']['itemlist']['data']['auctions']

      result = []#整理出我们关注的信息(ID,标题，链接，售价，销量和商家)
      for each in page_item:
            dict1 = dict.fromkeys(('id','title','link','price','sale','shoper'))
            dict1['id'] = each['nid']
            dict1['title'] = each['title']
            dict1['link'] = each['detail_url']
            dict1['price'] = each['view_price']
            dict1['sale'] = each['view_sales']
            dict1['shoper'] = each['nick']
            result.append(dict1)

      return result
            
def count_sales(items):
      count = 0
      for each in items:
            if '###' in each['title']:#规定只取标题中‘###’的商品
                  count += int(re.search(r'\d+',each['sale']).group())
                  
      return count

def main():

      keywords = input("请输入搜索关键词：")#可以为各种商品名称
      length = 10#淘宝商品页数
      total = 0
      
      for each in range(length):
            res = open(keywords, each+1)
            items = get_item(res)
            total += count_sales(items)#销售总量
      print(total)


if __name__ == "__main__":
      main()

全部评论

推荐最新楼层

05-06 15:53

杭州电子科技大学算法工程师

投了一个多月实习了，0回复，到底怎么找实习啊

投了一个多月实习了，0回复，到底怎么找实习啊

程序员小白条：简历不写好，投再多，就是浪费时间和机会了

我的求职进度条

点赞评论收藏

分享

05-06 22:48

上海戏剧学院运营

研三快毕业，求指点

纠结是继续搞艺术还是转行

点赞评论收藏

分享

03-31 14:46

已编辑

门头沟学院 Web前端

励志成为双港第一ja...：这其实很正常，离的太远了，他认为你不会来，就为了混个面试，而且成本很高，实习生都优先选本地高校。吃了地域的亏，所有很多时候地域可能比院校层次更重要。

点赞评论收藏

分享

04-06 22:13

河海大学 Java

28届简历求拷打

bg211，暑假才转回南京校区😭😭根据星球做了一份简历，项目是一个rag+点评不知道能不能进八股简历上写的背的差不多了，hot100刷了一半，暑假想留校实习，做日常或暑假实习，求各种大佬指点，不玻璃心😭😭

站队站对牛：这个还是很重要的实习

你已经投递多少份简历了

点赞评论收藏

分享

05-04 17:22

已编辑

兰州大学 C++

各种拷打项目，由于和之前实习岗位挺类似的，拷打的很细   C++中，unordered_map和普通的map有什么区别？   unordered_map什么时候触发扩容（rehash）？解决哈希冲突的算法是什么？  首先明确哈希的本质目标——将键（key）快速映射到存储位置（数组索引）。实现步骤可分为四层： （1）定义键值对结构； （2）设计哈希函数，将key转为非负整数索引； （3）处理哈希冲突（多个key映射到同一索引）； （4）当负载因子（load factor = 元素数 / 数组长度）超过阈值（如0.75）时，触发扩容与重哈希（rehashing），保证性能稳定。 重哈希的过程（以链...

查看9道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

88536次浏览 638人参与

# 什么专业适合考公 #

69480次浏览 345人参与

# 在爱玛，骑向未来 #

44298次浏览 434人参与

# 机械人，说说你的烦心事 #

148513次浏览 1162人参与

# 毕业季，给职场新人一些建议 #

221144次浏览 2600人参与

# 工作压力大，你会干什么？ #

82348次浏览 707人参与

# 选offer应该考虑哪些因素 #

172482次浏览 1057人参与

# 工作后，你落下了哪些病根 #

42340次浏览 294人参与

# 机械人，秋招第一次笔试的企业是哪家？ #

103447次浏览 707人参与

# 巨人网络工作体验 #

76601次浏览 507人参与

# 如何缓解入职前的焦虑 #

290774次浏览 1505人参与

# 携程笔试 #

174200次浏览 916人参与

# 我的第一份实习怎么找的 #

288557次浏览 2108人参与

# 重来一次，我还会选择这个专业吗 #

466669次浏览 3983人参与

# 你被哪些公司挂了？ #

198004次浏览 1076人参与

# 职场新人体验 #

192729次浏览 1241人参与

# 实习生的蛐蛐区 #

957550次浏览 4840人参与

# 实习生工资多少才算正常？ #

76136次浏览 526人参与

# 应届生，你找到工作了吗 #

174069次浏览 900人参与

# 找工作中的小确幸 #

92825次浏览 472人参与

# 你上一次加班是什么时候？ #

157453次浏览 823人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务