Python:
Python中几种数据类型的基础使用
Python匿名函数、列表推导式、装饰器的基础使用
Python中re、requests、beautifulSoup等库的基础使用,爬虫伪装中代理IP、UserAgent的熟练使用
Python操作Mysql,MongoDB数据库增删改查,
熟练运用Chrome、Firefox浏览器,了解开发者调试工具
了解计算机网络、数据结构等基础课程
了解常用的一些基础算法,HTML(H5)+css+js等相关内容,具有一定的开发基础
了解Linux日常工作环境,了解常用命令
掌握 git 工具,使用码云管理维护自己的代码
自然语言处理:
掌握matplotlib数据可视化工具,viso等流程框架图展示工具;
能够使用各种无监督和有监督方法对用户行为建模,熟练阅读国外文献和相关论文;
具有通过数据洞察问题,独立撰写分析报告的能力。
熟悉自然语言处理领域的相关知识,了解NLP相关算法;
熟悉文本预处理流程,掌握jieba、stanfordcorenlp、NLTK等分词,预处理工具的使用;
能够运用gensim等工具进行embedding训练,实现文本语义表示、相似度计算、关键知识抽取等;
对文本聚类方法,热点话题分析、自动摘要、舆情检测等有一定理解;
了解CNN、RNN的在Pytorch和TensorFlow应用,能够利用深度学习进行信息挖掘,如:文本分类、机器翻译等;
具有良好的逻辑思维和语言表达能力,较强的数据分析和解决问题的能力。
云南省科技厅专家人才管理系统
背景:利用大数据技术,集成技术类、管理类和财务类高层次专业人才,涵盖科技人才专家入库、专家管理、专家选取、专家评价、数据统计等“五大功能”,服务于省科技厅科技管理
主要职责:技术负责人,负责售前售后技术支持,与客户沟通技术方案、方案评审及后续维护
所使用的技术:JAVA、JS、Struts2框架、Oracle、Json、sql语句
功能模块:活动设置、条件设置、审核条件、抽取专家、短信通知、系统测试
结果:顺利完成项目的验收,对于一个完整的项目设计有了更加深刻的理解,对于程序的调试定位掌握了更多