爬虫带你了解一下Golang的市场行情 - Go语言中文社区

爬虫带你了解一下Golang的市场行情


了解一下Golang的市场行情

项目地址:https://github.com/go-crawler...

如果对你有所帮助,欢迎 Star,给文章来波赞,这样可以让更多的人看见 :)

目标

在工作中 Golang 已是一份子,想让大家了解一下 Golang 的市场行情,也想让更多的人熟悉它。因此主要是展示数据分析的结果

目标站点是 某招聘网站 的职位数据抓取和分析,爬取城市分别为 北京、上海、广州、深圳、杭州、成都,再得出一个结论

分析

首先需要进行页面分析,找到我们的抓取方向

image

搜索 golang 关键字,打开页面 F12 就能看到它发送了四个请求,留意 positionAjax.json 这个请求

image

我们仔细研判这个接口的入参和出参

入参

1、Query String Param

  • city:请求的城市
  • needAddtionalResult:是否需要补充额外的参数,这里默认 false

2、Form Data

  • first:是否首页
  • pn:页码
  • kd:关键字

出参

image

就是它了,从返回结果可得出许多有用的信息

  • companyFullName:公司全称
  • companyLabelList:公司标签
  • companyShortName:公司简称
  • companySize:公司规模
  • education:学历要求
  • financeStage:融资阶段

等等~

分页

在上面两张图中,可以发现在 content 节点中包含 pageNo、pageSize 字段,content.positionResult 节点有 totalCount 字段,可以得知当前是第几页,每页显示多少条,当前的职位总条数

需要注意一下,分页的计算是要向上取整的

模拟浏览器头

User-Agent 可以用 fake-useragent 这个项目来随机生成 UA 头

版权声明:本文来源CSDN,感谢博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/weixin_33806914/article/details/88860299
站方申明:本站部分内容来自社区用户分享,若涉及侵权,请联系站方删除。
  • 发表于 2019-09-04 14:22:19
  • 阅读 ( 1965 )
  • 分类:Go

0 条评论

请先 登录 后评论

官方社群

GO教程

猜你喜欢