熟练掌握和运用python,熟悉python底层。
熟练掌握和应用爬虫scrapy框架,mysql,Django框架,flask框架,html5,js,jQuery,hadoop
熟练掌握和应用opencv,numpy,panda,matplotlib等数据分析模块库
码龄3年,共参加一个python项目,项目名称《图片文字识别》,在该项目中主要负责图片分割,去噪,文字识别算法模块和网站的搭建。
在平时喜欢研究各大网站的反扒技术,积累了很多的爬虫经验。
《图片文字识别》项目主要是通过前端传入一张带中国汉字的图片,后台先通过对图片进行分割,去噪处理,分割出图片中的单个文字,单个文字图片通过神经网络识别出图片的汉字是什么字,在通过图片相似度匹配算法匹配该汉字的字体。我主要在项目中负责分割图片,图片去噪模块。
《快手爬票桌面小工具》主要就是前端输入出发站,到达站,触发时间,点击确认之后,后通过网络爬虫对12306网站的车次信息的爬取
《图片字体识别》主要是通过前端传入一个带汉字的图片,后端先通过训练好的神经网络,识别出图片上面的字是什么字,在通过相似度匹配算法与后端的字体库进行相似度匹配,最后的返回结果就是与该字字体最相似的字体,识别成功率95%左右,本人主要负责图片的分割模块和字体相似度匹配算法模块。