本人熟悉python编程,主要有以下几个方面:爬虫方向:网站数据的获取,接口参数分析,模拟浏览器操作,构造代理IP,多线程爬虫,熟悉scrapy爬虫框架,操作mysql数据库,excel的读写;
机器学习:机器学习框架sklearn、数据处理库numpy以及pandas等,机器学习理论知识(SVM、K-NN、随机森林、HMM等);
深度学习:搭建BP网络,CNN网络等,了解深度学习理论知识(梯度下降,dropout),可实现验证码的识别;
自然语言处理:知识图谱的构建,查询,分词,词嵌入,word2vector技术,以及熟悉主流的框架(seq2seq、transformer、lstm);
1深度学习项目:学校教务系统4位英文+数字组成的验证码识别,准确率80%以上
2自然语言处理项目:智能问答系统(QA),可以解析用户的语句,分析语法,根据互联网信息返回问题的答案(主要是知识图谱的运用)
智能问答系统,主要有以下几个步骤,知识抽取,知识图谱构建,知识图谱查询,分词技术,词向量技术,语句句法分析,爬虫技术
本软件采用艾宾浩斯记忆曲线为理论依据,结合qt图形界面编程,运用pandas数据处理模块,软件具有稳定性,便捷性,实用性。