一、后端:
1、爬虫:经历过绝大多数反爬与反反爬手段,熟悉 selenium、js 逆向、hook 、加密算法逆向等。了解 app 脱壳、逆向静态分析等。
2、python后端:flask、Django等框架,基本python全技术栈。
3、java后端:java中级开发水平,常见框架、微服务都可,如springboot、spring cloud。
二、nlp算法:
1、数据清洗:多种主流聚类、分类算法,KMeans、som、DBSCAN等,近年主要使用各深度学习模型的多分类任务,如bert、ernie 3.0。
2、训练平台:熟悉 tensorflow、PyTorch、paddlepaddle。
3、词向量: word2vec、bert、gpt3
4、大模型:propmt的有chatgpt、bard、gemini,本地部署过chatGlm等6/13b级别的模型。
工作原因,只能写一个兼职平台可能用得上的项目经历:
基于对业务的深入了解,自行发起、开发了一套对接40余家公司的投递流程,实现一键简历自动投递的系统。涵盖几乎所有拥有自研投递系统界面的公司。
中间过程包括简历 ocr 识别、简历解析、格式化字段内容判定清洗、第三方系统自动登录、一键上传等。
涉及难点:多家系统的反反爬,web 逆向,js 逆向等,工程上涉及第三方系统维护变更报警、登陆持久化、账号映射统一管理等。
工作原因打码较多,还请原谅。 实现了对接多家的简历上传系统,同时做了实时监控报表统计。涉及ocr识别、简历解析、cookie持久化、自动登录、js加/解密、web逆向、request请求等。
算法相关项目 人岗匹配,从ner词性标注到词向量相似度计算,计算人选与岗位间相似度,截图中包含维度计算公式等。