工作经历
-
河南聚量信息技术有限公司-Python 爬虫工程师 2025.01-2025-07
负责抖音生态和快手相关网站数据的采集。
负责直播指标数据、店铺数据、商品评价、订单售后单、广告计划、人群画像等数据的采集。 -
郑州潮阔电子科技有限公司-Python 嵌入式工程师 2024.08-2025-01
负责3D打印机服务端Klipper的开发。
负责开源框架klipper和moonraker的源码解析和研究。
负责基于klipper的二次开发和模块重构工作。 -
郑州埃文科技有限公司-Python 开发工程师 2021.07-2024-07
负责官网IPUU的My IP 和 IP Report的开发。
负责IP定位系统GEO开发和维护,IP定位数据的分析。 -
浙江星汉信息技术股份有限公司-Python 研发工程师 2018.04-2020.12
PDF文字识别、扫描图像OCR识别。
Octopus 项目管理系统开发和维护;文本内容错误检测。 -
杭州沃趣科技股份有限公司-Python 工程师 2017.05-2018.04
独立负责QData MySQL产品的bug修改、维护和兼容MariaDB的开发。
负责QFusion自动化打包编译和物理机生命周期的开发。
项目经验
-
电商数据爬虫项目
该项目基于Feapder开源框架开发,我负责抖音生态平台数据、快手直播和视频号直播数据的采集。 数据采集任务由feaplat平台部署定时任务调度,数据采集过程涉及的难点主要是cookie采集和加密参数逆向解析,譬如请求头和响应的加密参数__payload__解析,我通过js逆向找到参数位置 和结合hook url的油猴js脚本定位到接口的具体请求逻辑,解析出请求参数,进一步通过模拟接口请求获取到接口返回的结果数据,对结果数据进一步解析后进行入库操作。
-
IP定位系统GEO
该项目基于python语言开发,我负责GEO功能的开发和探测机的维护。 GEO根据大洲划分四组探测服务,亚洲、欧洲、北美洲和其他的大洲,而四组服务部署30台探测机服务,包含亚洲、欧洲、北美洲、南美洲、大洋洲、非洲,各洲各分5台探测机进行探测管理。 业务应用端通过消息队列和GEO进行通信,GEO分为探测端和结果处理端,探测端和结果处理端也是以消息队列进行通信,我负责探测端开发和探测机服务维护。
-
官网IPUU
该项目基于springboot框架开发,我负责其中的My IP和IP Report工具接口的开发。 My IP工具主要是使用者打开IPUU官网时,自动获取用户的IP信息,基于用户IP生成三种不同规格的IP定位信息的图片,支持用户通过链接直接使用。 IP Report工具主要实现了用户上传批量IP,通过对IP的统计和分析,返回IP的定位信息、应用场景、AS信息、所属机构等统计结果。
-
档案扫描件OCR识别项目
该项目基于chineseocr识别模型,针对档案扫描件,例如纯文字档案、带有表格档案等进行识别,使用flask+connexion 实现restful API 接口封装。
例如,使用opencv库对表格图像进行了单元格切割,图像切割之后再进行识别,提高了对表格图像识别的准确率;后端采用了flask作为web服务, 实现了web页面上传表格图像,进行实时识别表格文字,并输出表格形式文字结果。该项目只是图像识别的一个模块, 我作为研发工程师,独立完成该模块。
自我描述
我作为一名python coder,注重代码的规范和易维护性;喜欢通过解决实际问题提升自我技术能力;轻松使用linux系统,解决问题效率高。
致谢
感谢您花时间阅读我的简历,期待能有机会和您共事。