博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python爬虫 智联招聘 工作地点
阅读量:6503 次
发布时间:2019-06-24

本文共 1644 字,大约阅读时间需要 5 分钟。

需求:智联上找工作的时候,工作地点在搜索页面只能看到城市-区。看不到具体的地址。(离家近的工作肯定优先考虑) 思路:爬取搜索页面(页面一)然后进去其中一个内页,再爬工作地点(页面二),【废话】 利用的库:re,csv,bs4,requests 基本功能已实现。 下一步方向,调取地图api 计算离家距离。 运算速度方面的话,可以考虑多线程处理。

  

 

 

 

 

以下代码拿来就用哈!
import requests from bs4 import BeautifulSoup import re import csv location = "广州" search = "网络工程师" fileName = location + "-" + search + ".csv" with open(fileName, "w", newline="") as datacsv:     csvwriter = csv.writer(datacsv, dialect=("excel"))     # res = requests.get("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=%E4%BD%9B%E5%B1%B1&kw=%E7%BD%91%E7%BB%9C%E5%B7%A5%E7%A8%8B%E5%B8%88&sm=0&p=1")     Url = ("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=%s&kw=%s&sm=0&p=1" % (location, search))     res = requests.get(Url)     res.encoding = 'utf-8'     soup = BeautifulSoup(res.text,'html.parser')     all_work = []     for link in soup.find_all('a'):         if re.search("com/[0-9]*.htm",str(link.get('href'))):             all_work.append(link.get('href'))     for i in all_work:         work = []         res2 = requests.get(i)         res2.encoding = 'utf-8'         soup2 = BeautifulSoup(res2.text,'html.parser')         for z in soup2.find_all("h2"):             work.append((z.get_text()).split()[0])         work_list = str(soup2.get_text()).split()         work_list2 = []         count_y = 0         for y in work_list:             count_y +=1             if "职位月薪" in y:                 work_list2 = work_list[count_y-1:count_y+6]                 for xx in work_list2:                     work.append(xx)                 csvwriter.writerow(work)                 break     datacsv.close()
 

转载于:https://www.cnblogs.com/dblpl/p/8676141.html

你可能感兴趣的文章
PHP学习笔记 第八讲 Mysql.简介和创建新的数据库
查看>>
【git】git入门之把自己的项目上传到github
查看>>
js获取鼠标位置
查看>>
2016.8.11 DataTable合并及排除重复方法
查看>>
php 魔术方法 说明
查看>>
Mysql
查看>>
POJ-1860-Currency Exchange
查看>>
跨越企业的“中等收入陷阱”
查看>>
Android 开发者必知的开发资源
查看>>
软件工程技术基础-(软件复用技术)
查看>>
给django视图类添加装饰器
查看>>
简述 clearfix 的原理
查看>>
【Project Euler】530 GCD of Divisors 莫比乌斯反演
查看>>
luogu P1280 尼克的任务 序列DP
查看>>
iphone UIView的一些基本方法理解
查看>>
sys.check_constraints
查看>>
vue问题
查看>>
ThinkPHP 框架学习
查看>>
css3箭头效果
查看>>
MathType在手,公式不求人!
查看>>