北京人工智能行业数据采集工程师岗位介绍JD模板

阅读: 评论:0

湍流耗散率北京人工智能行业数据采集工程师岗位介绍JD模板
岗位名称:数据采集工程师
岗位关键词:python,css
职责描述:
应崇江1、负责多平台信息的数据采集和页面内容的提取分析,负责解决各类数据采集机制;
2、负责HTTP、AJAX等各类网络请求分析,探索和研究高效的数据采集解决方案;
3、研究数据采集策略和防屏蔽规则,解决封账号、封IP、验证码、页面跳转等难点,提升网页采集的效率和质量;
除冰车4、不断完善和重构现有数据采集系统,通过对采集、解析、调度、存储等模块的拆分与优化,构建和完善统一的数据采集服务平台;
除冰车5、关注数据质量,进行监控,对已有网站进行维护,及时修复;
任职要求:
1、全日制统招本科及以上学历,计算机相关专业,1年及以上数据采集经验;
和嫩太阳能庭院灯2、精通至少一门开发语言,如Python;
3、精通数据采集技术熟悉HttpClient/jsoup/XPath/CSS/正则表达式/验证码加密处理/代理池等网页信息抽取技术,精通HTTP底层协议;
4、精通动态网页采集、浏览器模拟采集等技术;
5、熟悉网页数据采集原理及技术,熟悉基于Cookie的网站登录原理; 手机镜片
6、熟悉模拟登录、数据清洗、去重、入库等技术。"

本文发布于:2023-05-21 11:17:57,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/2/107677.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:采集   数据   技术   网页   熟悉   分析   进行   岗位
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图