2019.07~2023.11
技术栈: Linux + Python + FastApi+ Celery + MongoDB + Redis
这是一个简历文件解析的平台,我在里面负责开发“解析文件解析”功能,负责简历解析器的日常维护,修复疑难简历的解析问题。
也参与部分开发其它功能,如职位管理、快搜、上传简历、人才库等等。
个人在里面碰到的技术难点有:
简历文件很多,却要求快速、高并发的解析效果。
每人的简历格式不同,不少个性化的简历写法,尤其设计师以图片作品为主的简历,但要求精准解析出简历的所有内容,如姓名等基本信息、工作经历、教育经历等。
采用大量正则表达式来匹配内容,并需要训练大量的基础数据来匹配内容,如公司名、学校名、项目名等。