爬虫工程师
10K-15K
收藏职位 申请职位
上海| 人数: 1| 经验:3-5年| 性别:不限| 年龄:不限| 学历:本科| 0人浏览
温馨提示: 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报 ;如遇岗位要求海外工作,请提高警惕,谨防诈骗
北京众标智能科技有限公司上海分公司
IT互联网
职位描述
岗位要求:
1. 负责公司业务所涉及数据的爬取,清洗,结构化,ETL;
2. 负责持续运营和更新爬虫以及数据;
3. 负责基础组件维护(验证码平台 无头浏览器平台等);
3. 负责数据仓库及管道建设;

任职要求
1、熟练使用java或python语言开发;
2、熟练掌握网页抓取原理及技术,熟悉网站登录原理,熟悉基于正则表达式、XPath、CSS等网页信息;
3、熟悉MySQL等关系型数据库以及SQL语言,至少掌握一种NoSQL数据库
4、能解决如图片验证码/滑块/账号限制/ip限制/访问频繁限制等问题者优先
5、有互联网、电商平台、移动端数据、政府网站爬取技术经验者优先。
工作地点
上海普陀区上海清华国际创新中心4号楼403室