熟练使用Python的Django、Flask、Swagger、FastApi主流框架
• 熟练掌握Nginx+Keepalived的高可用架构
• 熟练掌握Docker容器、镜像、编配服务
• 熟练掌握基于Jenkins服务的自动化集成平台搭建和维护
• 熟练掌握Celery,Rabbitmq分布式异步消息队列的应用
• 熟练使用Mysql,MongoDB,熟练使用Redis缓存熟悉多种数据库优化方案
• 熟悉TCP/IP/HTTP/HTTPS/等网络协议和RESTful API Web服务
• 熟练Linux版本下的环境开发以及配置,bash、python脚本
• 熟悉Python多进程,多线程,协程开发
• 熟悉数据分析的基本库(numpy, pandas)以及数据的可视化(matplotlib),图像处理(opencv)等
• 掌握机器学习中,分类,回归,聚类,降维,模型选择, 数据预处理等开发流程.
• 熟悉常见的爬虫反爬虫策略和反反爬策略,熟悉基于正则表达式、Xpath等信息抽取技术。
IDP-票据识别平台框架设计、开发
DarwinML TRET-票据、卡证、通用文档/表格识别(OCR)
博雅宏图项目(一期、二期)
RD: • 参与Trnet-Inference后端服务框架设计及平台开发,独立部署维护更新全流程工作。 • 独立编写Trnet-SaaS后台管理系统 • 独立编写Trnet系统的客户演示系统部署迭代维护 • 利用Nginx+keepalived搭建主从热备,负载均衡,反向
智能票据、卡证、通用文档/表格识别系统在金融和财务领域,可以对大量的票据/单据进行准确的定位和校正,然后对单据中的内容进行精准的识别并形成结构化数据,用于后续的分析和处理。为客户提供各种票据、卡证、通用文档/表格识别Sass服务及个性化配置部署等解决方案。