10余年软件及人工智能开发经验,具备良好的编程能力及算法功底。具备从零搭建项目的经验,能独立
完成整套项目解决方案。2008年以来,发表EI十余篇。大学期间高等数学、统计学、线性代数成绩较好
并能在毕业后继续对相关知识进行学习。
机器学习方面
熟悉机器学习、深度学习以及强化学习算法及相关Pipline,包括数据获取、特征提
取、训练、调参等内容。对千万级样本去重、特征选择、处理类间样本数量分布不均衡及保证训练结
果的可复现性有一定工程实践经验,用过CharRNN、LSTM、GRU、DNN、RNN等,对自定义
Dataset有一定经验。研究过强化学习在对抗中的应用。熟悉常见模型的应用场景、迁移学习、常见超
参数的作用和调法以及损失函数。能偶尔阅读国内外相关文献并尝试复现。借助少量资料便可手写全
连接层的向前向后传播算法以及卷积层、池化层、RNN和LSTM的向前传播算法。
深度学习方面
1、可以利用numpy实现基础函数或功能,包括sigmoid、softmax、交叉
熵、L1、L2、sigmoid函数的梯度、reshaping arrays、按行(特征)归一化、图像的pad。理解为何需要对
含有多节点的网络权重进行随机初始化而不一定需要对b进行随机初始化,对于逻辑回归则不需要进行随
机初始化。熟悉多层网络中A、Z、w、b以及它们导数的形状。理解如何利用学习率和导数对参数进行更
新。解决同样的问题,使用浅层神经网络的时间复杂度为2的n次方,使用深度网络的时间复杂度为
logn。理解为何L1、L2正则化过大会破坏tanh、sigmoid函数的非线性。理解动量为何对梯度下降有益。
了解tensorflow的基本用法。
2、系统设计的整个过程需要保证开发集和测试集具有相同的分布。针对不同的问题可以快速准确判断
bias和variance。理解为何在解决实际问题的过程中为何端到端的方法并不总是有效或最优的。利用
numpy实现全连接神经网络的向前传播算法(计算代价函数)、反向传播算法(梯度更新)以及卷积层
和池化层的向前传播算法。实现梯度检查工具,Adam优化器。
3、理解图像中filter是如何进行边缘检测的。明白为何Ensembling技术和Multi-crop技术在写论文或者打
比赛的时候有用而在实际部署的时候少有人用。了解Landmark Detection,理解残差网络的实现原理,利
用bottle neck加速计算的原理。理解对象检测和YOLO算法的实现原理以及利用评估指标IoU进行Non-
max suppression。了解人脸识别的实现框架以及人脸验证和人脸识别的区别,理解人脸识别问题中如何
使用Triplet Loss。
4、理解RNN、LSTM等网络的单元构造和Forward过程。理解如何计算Embedding Matrix。了解到用于训
练词向量的相关方法:word2vec和Glove word vectors。编程实现利用余弦相似度来进行词推理。了解注
意力模型可以用来进行数据清洗以及机器翻译。
能实现如下系统的原型:
1、分别使用逻辑回归和多层神经网络两种方法实现识别猫的任务。
2、使用两种不同的方法完成手势和数字之间的映射,第一种方法利用tensorflow实现一个多层神经网
络,第二种方法基于Keras来实现ResNet-50。
3、实现Content+Style=Generation的画风迁移。
4、人脸识别系统。
5、基于RNN的字符级语言模型,可以用于生成莎士比亚风格的短文。
6、利用词向量来实现在英文文本中插入与文本含义相同的表情。实验使用了两种方法,一种利用numpy
手写一个简单的网络,一种利用keras来搭建多层神经网络,其中综合使用了Dropout层、LSTM层、自定
义的嵌入层以及密度层。
视频图像方面
使用过FFmpeg,熟悉常用的图像处理方法。对SVM和遗传算法应用于图像、视频处
理有所经验。能利用pytorch、tensorflow、keras、yolo4+等框架开发目标检测系统和人脸识别系统,
能利用开源框架first-order-model实现一些简单的功能。
NLP方面
能利用pytorch等框架开发NLP的部分相关应用。可以利用Rasa实现基础的多轮对话功能、
对中文以及英文语料进行训练、正确设置槽位、识别语句中的意图和实体。对于集成Rasa和一些系统
的IO有一定经验。
量化交易方面
利用Embedding Matrix的思想发明了能击败如KDJ、MACD、布林线、CCI以及均线等
传统指标的新方法,可以更加全面地度量K线上下文信息。可以独自或者带队开发出高精度的量化交
易模型。
软件开发方面
Java使用较多,利用Java从0到1开发过大型系统,能实际运用多线程和并发容器。了
解微服务、架构设计、分布式计算、并行计算、简单的脚本编写以及游戏开发的一般原理并能对这些
领域快速上手。语言方面熟悉Python、c#,会用c/c++、Delphi、Matlab,对汇编语言、ios、安卓编
程、Anaconda的基本使用方法有所了解。数据库方面对mysql使用较多。在dl4j框架中使用过spark的部
分功能。简单进行过微信小程序的开发。先后利用不同语言作为主程至少开发过运动目标检测系统
(c++)、交通流量仿真(C#)、空情融合系统(C#)、装备管理系统(Springboot)以及股票交易
辅助系统(C#、Python、Java)等。
1. 多年来一直在独立完善《股票分析预测系统》,通过对该系统不断优化、维护,通过利用精选的特征以及深度学习框架(dl4j)构建了一个几十层的网络,可以持续领先大盘。2021年初又用pytorch重写了系统,目前正在进行特征和参数的优化。对于如何选择小样本进行快速训练从而寻找更优参数有所心得。利用程序得到的数据撰写的市场分析文章在雪球上能轻松获得单日数万阅读量,并经常能得到正确的分析结论。
2. 2021年3月预研了一个图像拼接的项目,利用分治和递归的思想实现数百张图片的自动拼接。该项目开发使用Pycharm,主要利用sift特征完成拼接。在开发过程中,领悟到增加拼接成功率的一些技巧,比如在拼接的过程中每一小张图片也许不止需要使用一次,为了增加两两图片之间的重合度,有的图片作为padding需要多次使用。
3. 2021年2月初步研究了智能客服系统和隧道车辆监控系统的实现框架。其中智能客服系统可以利用Rasa实现基础的多轮对话功能,可以对中文以及英文语料进行训练,可以识别语句中的意图和实体。为了获得足够的训练语料,利用selenium来对网站中的指定信息进行抓取,熟悉了xpath以及常用网页标签。同时在探索TTS语音合成方面的相关工作。
4. 2021年1月对EasyDL的图像模块以及表格模块的训练性能进行了测试。开始熟悉git的push、pull、merge等操作。
5. 2020年12月对构建高精度人工智能多种场景应用能力有所提升。在股票量化交易系统上线的过程中测试出了bug后紧急定位排查,及时修复系统风险。
6. 2020年12月熟悉了多盟SDK在安卓平台中的调用方法,了解了如何集成OAID。
7. 2020年11月初步实现了利用BERT进行指定语料的训练,并能对指定语料进行正向或负向的评价。
8. 2020年11月利用IDEA部署了一个maven项目,可以使用spark及逻辑回归完成垃圾邮件检测。
9. 2020年11月初步学会利用NLP技术中的CharRNN等模型学习数万句古诗后能自动作诗,框架使用的是tensorflow。
10. 2020年10月在某微型项目预研中利用selenium来对网站中的指定信息进行抓取。
11. 2020年10月在某项目预研中学习了目标检测的yolov4+框架,对于如何利用pytorch开发目标检测应用有了一定把握。
12. 参与了2020年联合作战智能博弈挑战赛,其间学会了docker虚拟机的使用,熟悉了Linux操作系统,探索了强化学习框架的设计和使用方法。
13. 2020年利用springboot、layui、echart、javascript、百度api等手段为单位开发了某细分领域的数据管理可视化系统。 该系统可以利用爬虫下载相应的离线地图切片数据。
14. 2020年应总部某单位要求,三天时间快速开发了一个简易的疫情统计上报系统。
15. 2019年在南京出差期间,在与来自20多个省的业务部门同事一起工作期间,快速统一意见,独自快速开发了《单位驻点数据模型》,该模型用于为总部某机关提供了决策支撑。
16. 2018年在北京工作期间作为中游环节将上游软件需求方和下游技术部门进行反复对接,并作为业务需求和数据的提供方,完成了《伞降管理系统》以及《某单位编成结构的可视化系统》,这两个系统主体结构利用了华如的快速开发框架。
17. 2018年1月利用C#调用掘金的API做了一个看盘程序,该程序可以筛选不同周期、不同板块,动态获取满足特定K线及指定条件的股票集。
18. 2017年在拉萨工作期间主导开发了《空情融合系统》。该项目语言使用的是C#,主要以国外的一个开源地理信息系统为基础进行的二次开发,地图调用的是Open Street API。二次开发后加入了CS结构以及标图计算。系统完成后受到了单位最高领导的亲切接见与肯定。
19. 2016年在拉萨工作期间主导开发了《休假管理系统》,该项目用的是netbeans+java+mysql,由于没有办法破解上级分发的Oracle数据包,也没有途径与上级业务部门取得有效沟通,最后利用Excel API变相进行数据读取。
20. 2015年单位处于转型期,专业工作非常少,业余时间自己利用遗传算法、支持向量机等技术,通过对大量量化指标的各种组合对国内的股票市场进行了反复研究与回测。 期间掌握了利用JProfiler对系统内存及运算性能进行分析和优化的技术。
21. 2012年至2014年先后为单位不同子部门独立开发了训练信息网、地图查询系统、政工网、物资采购网。其中训练信息网用ASP.NET开发,利用We7建站工具实现了信息发布系统。政工网用PHP建站。
22. 2011年撰写硕士毕业论文期间完成了《航拍视频中运动对象的检测、跟踪与识别》系统的开发。开发该系统使用了VS2008+mfc+opencv。该系统从别人那里接手过来的时候是利用Harris角点对运动目标进行捕捉,系统运行速度比较慢,实验室的权威说这个问题无法解决,但是我不迷信权威,通过对角点进行采样并对原图像进行缩放,然后对角点重定位,我将原系统的运行速度提高了10倍。该系统使用Mean-Shift算法对分离出的运动前景对象进行跟踪,可以生成运动轨迹,并对前景目标进行对象识别。
23. 2011年独立完成了南京某银行技术部的一个课题。该课题需要自动识别成捆钞票上图章个数,对时间性能和准确率有一定要求。
24. 2009年至2010年参与通信装备科研计划项目《XX图像的语义标注技术研究》。该系统利用SVM对图像进行训练,可以实现50个类的判别。该项目我作为主程,选择jbuilder为IDE进行开发,核心算法是SVM+遗传算法+聚类。该项目前后持续两年,期间一直和图像特征提取、训练、调参、修改核函数打交道,保证了项目正常结题。
25. 2009年协助实验室某博士利用matlab+Ncut算法完成其博士论文中的相关实验。
26. 2008年至2009年在南京学习期间参与“十一五”通信装备预先研究项目,跟着实验室师兄们一同完成了信息源管理界面的开发。这是一个基于web的信息收发系统,技术栈涉及mysql+tomcat+jsp+servlet等。服务器端信息推送分为主动推送和被动推送两种模式。
27. 2008年至2009年期间根据导师要求做了一些与主成分分析以及聚类有关的代码实现。
28. 2008年在全国电子仿真大赛中利用c#实现了一个交通流量模拟系统。
29. 2008年作为组长带领小组成员一同利用delphi开发了股票交易系统demo。
30. 2008年使用delphi独立开发了图书管理系统,该系统送给同专业的另外一名同学作为毕业设计提交。
2010年前后在实验室对该技术进行了探索。该系统利用SVM对图像进行训练,可以实现50个类的判别。该项目我作为主程,选择jbuilder为IDE进行开发,核心算法是SVM+遗传算法+聚类。该项目前后持续两年,期间一直和图像特征提取、训练、调参、修改核函数打交道,保证了项目正常结题
2010年前后开发了这个系统,该系统使用了VS2008+opencv。该系统从别人那里接手过来的时候是利用Harris角点对运动目标进行捕捉,系统运行速度比较慢,实验室的权威说这个问题无法解决,但是我不迷信权威,通过对角点进行采样并对原图像进行缩放,然后对角点重定位,我将原系统的
该看盘助手用于帮助实时查看各种筛选条件下的股票集合,筛选条件可以区分周期和常用指标。目前只做了v1.0到v1.2三个版本。
项目描述:该系统可以利用Rasa实现基础的多轮对话功能,可以识别语句中的意图和实体,可以利用正则表达式聚合训练样本、正确使用槽位、对中文以及英文语料进行训练、能集成Rasa和一些平台的IO。同时探索TTS语音合成方面的相关工作以及机器主播的合成方法。 项目进展:2020年1