1、爬虫、数据清洗、数据分析、数据挖掘,nlp
2、nodejs、django、laravel前端制作
3、熟悉后台php,js
4、担任南方科技大学金融系研究助理,讲授《数据库金融应用》、《金融数据分析与数据挖掘》等课程,对金融科技有深刻的了解,具备机器学习、数据挖掘、自然语言处理等理论知识
《ICOs白皮书的相似性验证》
· 从tokendata上爬取781个电子货币的白皮书,编写python代码,利用pdfminer、tesseract和pyocr分别将文本式pdf、 图片式pdf转换为txt文件
· 对txt文件进行预处理(词性识别、stemming、stopword、滤掉低频词等),封装为Bag_Of_Word后进行Tf-Idf处理,利 用LDA模型计算白皮书之间的相似性
· 发现246篇白皮书之间的相似性大于50%,可见某些电子货币的原创性以及可信度不高,ICO的监管问题十分严峻
《利用深度学习预测比特币价格走势》
· 从Kaggle和Poloniex上爬取并以5分钟为间隔时序比特币历史数据,并缩放操作使神经网络易于理解
· 利用CNN、LSTM、GRU三种神经网络模型计算并预测数据,反向缩放后用pyplot可视化,预测结果图形接近现实价格走势
· 通过比较,CNN模型训练速度快,但性能稍差于另外两个模型;最好的模型是用tanh和Leaky ReLU作为激活函数的LSTM
模型
《关联账户识别研究》
· 负责网络分析模块的框架思路撰写,通过收集MAC、IP地址,发现人与人之间在社交层面和动态行为轨迹上的隐含联系
· 编写SaS代码,结合SSH Secure Shell下载WRDS的TAQ高频交易数据,导入SQL Server后编写存储过程,并结合twitter
的时间节点,计算公司的Abnormal Return
· 对twitter进行NLP处理,并对交易数据预处理后利用R语言进行T-Test,从而验证关联账户对股市的影响
微信小程序《淘宝客》前端设计 2017.07-2017.08 · 基于小程序开发工具,查看官方文档,修改编写app.js、app.json、app.wxss文件内容
· 实现Flex布局、侧栏分类、仿淘宝分类入口、购物数量加减、商品属性分类等功能