编程语言:python、java、C/C++。以python为主。
技能:
数据分析:熟练使用numpy,matplotlib,pandas等常用库进行数据分析;
机器学习、深度学习算法原理、实现及应用:熟练使用scikit-learn完成聚类、回归、分类、降维和模型选择等任务;熟练基于pytorch实现各种深度学习算法。
网络爬虫编写:熟练基于 Requests, Scrapy, Selenium 各模块的数据抓取,利用Xpath, BeautifulSoup, Re 的数据清洗。
1. 基于深度学习算法实现网络流量分类识别、恶意网络流量检测,所研发模块已在相关检测设备进行集成并在试点环境进行部署应用。
2. 基于机器学习技术的恶意网页检测。
3. alexa top 10万网站内容爬取。
基本介绍: 基于待监管网络中采集的正常网络流量来为每种类别的流量数据学习正常的低维特征空间下的特征表示。自定义的损失函数保证了在学习到的特征空间下,相同类别的流量数据在特征空间下的表示更加接近,不同类别的流量数据在特征空间下分离性更强,通过设定阈值,若出现偏离阈值(与任何类别正
简介: 首先从alexa top 10万爬取了正常网页数据并从公开的恶意网站源中爬取了8万份恶意网页数据,通过提取url结构特征、网页内容特征、js运行时特征、js混淆模式匹配特征以及js执行前后dom树的变化特征等构建正常/恶意网页二分类器,识别准确率超过99%。 本人