sql数据库开发:主要是大数据Hive、Spark等数据报表开发
python机器学习算法开发:各类数据分类classification、回归regression,包含但不局限于随机森林、SVM、logist等
Tensorflow深度学习算法开发:卷积、LSTM等,图像处理、自然语言处理
Matlab算法开发(目前无开发环境)
1、pyqt5制作数据处理小工具
2、数据仓库开发(大数据)
3、各类数据等随机森林、xgboost、贝叶斯等,分类、回归等机器学习算法(有监督、无监督)
4、深度学习网络搭建
通过对热门音乐网站的歌单歌曲等信息爬虫,利用python 对歌单与歌曲、歌曲本身的标签通过莱温斯坦距离计算可信度筛选判断,以spark集群作为运算引擎编写脚本(pyspark),建立标签体系;通过每首歌曲的歌词对歌曲本身进行LDA模型的情感分析,丰富标签库
随机森林分类,目标是为企业提供可运营的目标客户,推荐产品;前期的数据预处理,数据情况,数据算法运算,均独立完成,沟通需求效果,达到预期