精通Python/SQL,熟悉数据采集、数据清理、数据分析与建模;
熟悉Django/flask/tornado等Web框架;
熟练使用Linux,熟悉常用命令,有基本的运维能力;
熟悉Hadoop、Spark等主要大数据技术组件;
熟练使用深度学习框架(如TensorFlow、PyTorch),以及pytorch, sklearn, numpy, pandas等开发库工具;
熟悉CV相关开源模型、熟悉机器学习算法、了解深度学习模型(CNN、LSTM、Transformer、GPT等);
熟悉NLP,包括但不限于如情感分析,文本分类,关键信息提取等。
数据采集类项目:豆瓣、京东、校园BBS以及特定网页数据采集;
开发类项目:基于flask/Django的小程序/Web开发;
算法类项目:文本分类、关键信息提取、文本纠错、目标检测、图像分类、图像分割等。
该作品爬取优衣库官网的所有商品明细数据,并存储到mysql数据库中。 本人可提供数据采集与存储服务。
本项目可以纠正拼写错误等语言问题,并转换成手语展示。 本人在其中完成数据采集、语言纠错算法开发、Python后端开发和小程序开发等工作。