1.具备良好的基本功,熟练使用基本的数据结构和算法,深入理解多线程、Socket等相关技术;
3.具备良好的编码习惯,结构清晰,命名规范,逻辑性强,代码冗余率低;
4.熟练掌握Django,Tornado,Sqlalchemy,Celery等主流框架,深入理解框架实现原理及特性;熟练使用python的常用库
5.熟悉Python的高级特性,深入理解各种设计模式和应用场景。
6.有大规模分布式系统的开发和高可用相关的实践经验,具备设计复杂系统的能力;
7.熟练掌握MySQL数据库,具备MySQL索引优化、查询优化的能力;
8.熟练掌握一种以上非关系型数据库,如Redis,Cassandra,理解其使用场景及限制;
9.熟悉分布式系统,熟练掌握一种以上服务框架和消息中间件,了解其实现原理;
10.熟悉Internet常用协议,如HTTP、TCP/IP、熟悉RESTful规范;
2022.10-2023.2 携程酒店评论的舆情分析 爬取数据、数据清洗、数据命中
数据爬取:利用 requests 和 lxml 等模块,从携程网站上爬取常用酒店的相关消费体验评论数据。确保数据的完整
性和准确性,同时遵循相关法律法规和网站的 robots.txt 文件规定。 数据清洗:使用 Pandas 对爬取到的评论数据进行预处理,包括去除无效评论、清洗重复数据、处理缺失值等,确
保数据质量。 文本处理与分类:应用 jieba 分词器对评论进行分词,建立词袋模型。通过词频逆文档频率(TF-IDF)和朴素贝叶
斯算法对评论进行分类,评估算法性能并进行优化。 数据分析与评估:利用 Pandas 和 Sklearn 进行数据分析和评估。提取主要关键词,识别主要的差评和好评关键词,
为提升服务质量和发现市场趋势提供数据支持。 结果输出与反馈:将分析结果以易于理解的方式呈现,包括可视化报告和数据摘要,反馈给店面,帮助他们根据
问题进行整改
个人利用闲暇时间录制的技术视频,包括Django、Flask、算法相关,由于项目早已不在线,只能通过视频来验证。
教学内容包括Flask、Django、Mysql、华为面试题目、以及小白的普及课程,如果需要验证,我这边可以配合提供相关证明。