能熟练使用python进行后端应用开发、网络爬虫、数据挖掘等,不确定是否达到精通程度。掌握git协作开发、项目CI/CD自动化、
linux shell编程、Docker容器、Docker Swarm / Kubernetes 分布式服务部署等能力。此外,了解Go语言/C语言特性,具备使用Go语言开发应用的能力。个人爱好学习,抗压能力强;喜欢钻研技术,性格比较乐观开朗,且擅长沟通。
《上海电信idps系统合同抽取》:
对用户提供的一些合同pdf文件进行字段抽取,idps系统会首先ocr识别文件并对其结果进行抽取,但对一些参杂特殊字符例
如“[]“等字段的抽取效果不理想。解决办法:在抽取逻辑中加入规则抽取。实现方式是系统进行抽取时调用固定的钩子函数,通过此钩子函数加入规则匹配,规则的实现方式是使用模板匹配过滤加多重正则抽取以及回调函数后处理,将符合条件的字段值进行匹配抽取,大幅度提高了抽取的准确率。
作品皆公司内部项目,存在涉密风险,无法分享代码细节。 个人项目://TODO 很抱歉,后面为凑字数内容。 感谢阅览,感谢阅览,感谢阅览。
尊敬的审核员: 本人工作经验尚浅,所做项目均为企业内部项目,由于涉密,无法分享代码实现细节。 给您带来的不便深感抱歉。 《个人项目》://TODO