近期编程语言:Python scala
近期使用平台:Hadoop spark
近期方向 机器学习 大数据平台搭建、分析 爬虫
之前从事方向:web网站编写
个人特点:具有方向专研的毅力,具备分析、解决问题的能力
1、社区二手网站信息爬取 推送
通过二手网站信息爬取,并抓取二手信息关键词进一步去百度、优酷、商品官网爬取对应二手商品的详细信息进行文稿自动编辑,并推送到社区。
2、基于调度技术支持系统的电力设备工况分析
根据电力设备工况记录数据来源多样、种类繁多、结构各异且密度不同的特点,利用大数据平台对电力设备工况数据进行多维度、多类别、立体化分析。根据遥信遥测,采用特征提取,降维处理以及MapReduce等数据转换方法,实现多源异构数据的规律化,从而对设备工况的判断提供决策和帮助。
3、基于调度技术支持系统的短期电力负荷预测
采用基于spark平台和并行随机森林回归算法的短期电力负荷预测方法,根据特定变电站各个出线的历史电力负荷数据,以及对应时间的天气、事件因素,预测未来日期的电力负荷预测,从而达到为调度系统提供准确、迅速负荷预测的目的。
4、基于深度学习的大客户负荷预测技术研究与应用
基于spark分布式平台,采用循环神经网络,完成对负荷数据、天气数据、大客户用电信息的数据预处理、模型训练,实现对负荷数据的短期、中期、中长期的预测,用户可以通过简单的在线操作完成不同类型的负荷预测过程,并通过可视化界面展示给用各个维度的预测结果,从而给用户提供准确、及时的预测信息。
5、用电客户流入流出分析
通过对居民用户每天的用电情况和专变用户的用电负荷情况,通过朴素贝叶斯分类算法来进行对用电行为的流入流出分析。通过分析,国网公司可以了解到用户的用电习惯,针对此可以做出相应的政策更好地提供用电服务。