上海| 人数: 1|
经验:3-5年|
性别:不限|
年龄:不限|
学历:本科|
0人浏览
温馨提示: 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报 ;如遇岗位要求海外工作,请提高警惕,谨防诈骗
职位描述
岗位要求:
1. 负责公司业务所涉及数据的爬取,清洗,结构化,ETL;
2. 负责持续运营和更新爬虫以及数据;
3. 负责基础组件维护(验证码平台 无头浏览器平台等);
3. 负责数据仓库及管道建设;
任职要求
1、熟练使用java或python语言开发;
2、熟练掌握网页抓取原理及技术,熟悉网站登录原理,熟悉基于正则表达式、XPath、CSS等网页信息;
3、熟悉MySQL等关系型数据库以及SQL语言,至少掌握一种NoSQL数据库
4、能解决如图片验证码/滑块/账号限制/ip限制/访问频繁限制等问题者优先
5、有互联网、电商平台、移动端数据、政府网站爬取技术经验者优先。
工作地点
上海普陀区上海清华国际创新中心4号楼403室