本人硕士毕业12年,在腾讯集团有多年AI算法开发与落地经验,研究生专业:模式识别与智能系统,从学校到毕业一直在从事大模型,AIGC,图像处理,机器学习,人工智能等相关工作研究。专业技能包括:
▲ 熟练掌握C,C++,python,Matlab等编程语言
▲ 大模型:AIGC,文生图,图生图,文生视频,多模态大模型等,熟悉GAN、Stable Diffusion、Qwen-vl、InternVL等
▲ 端侧/轻量模型设计优化与落地
▲ 图像识别:图像分类,目标检测,语义分割,视频理解,应用于人脸检测、人脸识别、行为分析等
▲ OCR检测与OCR识别:卡证(身份证、银行卡等),票据,手机截图等OCR检测与识别
▲ 数据挖掘:智能推荐,回归预测等,熟悉XGBoost,LightGBM,Wide&Deep,DeepFFM
▲ 模型压缩:模型量化与模型剪枝,模型蒸馏
▲ 较强的图像处理与分析能力,有良好的嵌入式视频开发经验
▲ 较好的算法效率优化提速能力
▲ 熟练掌握钞票识别、鉴伪、清分等
▲ 熟练使用DSP C6000系列的DM642、C6727、C6748、OMAP L138、C6455
▲ 较强的算法设计与算法实现能力
▲ 较好的论文写作能力,目前已发表6篇学术论文,超10篇专利
▲ 良好的英文文献阅读能力,数学基础扎实
1、大模型:AIGC,文生图,图生图,文生视频,多模态大模型等,熟悉GAN、Stable Diffusion、Qwen-vl、InternVL等
2、端侧/轻量模型设计优化与落地
3、图像识别:图像分类,目标检测,语义分割,视频理解,应用于人脸检测、人脸识别、行为分析等
4、OCR检测与OCR识别:卡证(身份证、银行卡等),票据,手机截图等OCR检测与识别
5、数据挖掘:智能推荐,回归预测等,熟悉XGBoost,LightGBM,Wide&Deep,DeepFFM
6、模型压缩:模型量化与模型剪枝,模型蒸馏
7、精通C++/C,python编程
一、人脸检测 移动端、嵌入式端和服务端,均支持实时人脸检测,支持多人检测 二、人脸关键点 移动端、嵌入式端和服务端,支持实时人脸106个关键点、240与280个关键点检测 三、人脸3D Mesh 1、移动端或嵌入式端,支持实时高精度⼈脸稠密3D点检测(1438个点)
一、手势识别 1、移动端或嵌入式端,支持超15种种⼿势实时检测,覆盖多种应用场景 2、毫秒级响应,高准确率 3 、各种光照情况下,稳定运行 二、手部关键点 1、移动端或嵌入式端,支持21个手骨骼点实时检测 2、性能优异,内存开销低,实时性高 3、适用图片和视频
一、数字分身 只需提供两段按要求录制的视频材料,即可由AI深度学习生成以假乱真的数字分身。 只需一次复刻,即可解放真人;后续需真人出镜的场景可直接由数字人出镜表演。 二、数字人实时驱动与渲染 1、为客服定制专属仿真人/3D数字人形象 2、为客户提供实时视频/直播的实时数
文生图、图生图与文生视频 1、AIGC智能图片生成,电商、内容营销、自媒体等场景,通过自动化素材生成 2、图生图,图像风格变换等 3、批量营销等素材生成
1、支持大模型的定制与私有化部署,大模型基于ChatGLM,Qwen,LLaMA等底座 2、丰富的大模型训练与调优经验 3、支持轻量大模型(SLM)的设计 4、丰富的大模型应用经验,应用于对话、对话小结,RAG,智能编码,智能助手等场景
辅助智能驾驶 1、驾驶员安全带检测,进行异常告警 2、驾驶员疲劳检测 3、驾驶员抽烟、喝水、打电话等异常驾驶行为检测