熟练掌握python编程,对数据进行分析处理可视化挖掘等工作,熟练掌握机器学习算法和深度学习算法对数据进行挖掘等方面人工智能技术,数学基础较强,线性代数概率论基础扎实,墨尔本大学统计学硕士毕业,且具备较强的英文水平。
1,利用python对业务数据分析挖掘,利用pandas,numpy,matplotlib等python库对业务数据进行探索新数据分析挖掘,识别数据特征结构及相关分析;
2,利用机器学习算法(集成学习:随机森林,boost ing)对业务文本数据(自然语言处理后)进行文本分类分析。
3,时间序列分析及预测建模。
时间序列预测:对业务数据进行处理分析,发现其较明显的时间季节周期性,进而对数据成分拆分,提取出趋势项,周期项,季节项,随机项,对每个部分分布运用不同的模型算法进行预测(如趋势项在平稳性检验通过后,运用arima算法进行时间序列预测等)
基于业务层面的文本二分类多分类任务 对文本数据进行处理:分词,词嵌入,实现文本数据特征向量表示的转化; 分类:对向量化的文本数据特征采用集成学习算法(随机森林,xgboost)进行有监督的分类任务; 结果:准确率达94%。
沟通及时,专业精通