•精通Python、Java、C++,具备扎实的编程基础与软件开发能力。
•熟练掌握前端开发技术,包括HTML5、CSS、JS等,以及后端框架SpringBoot。
•数据可视化与分析:运用Echarts进行数据呈现,掌握Hive、MySQL数据库管理,以及Kafka数据流处理。
•自动化测试与API管理:熟练使用Selenium、Playwright进行自动化测试,以及Postman进行API接口测试。
•数据采集技术:熟练使用自动化工具进行爬取页面信息以及视频内容。
•数据处理与分析:擅长使用Numpy、Pandas进行数据清洗、分析与处理。
•数学建模与机器学习:成功建立决策树模型与随机森林模型,运用机器学习技术进行模型预测,评估并优化模型性能。
机器学习与数学建模项目:机票信息分析与价格预测
技术栈:Python、Numpy、Pandas、Matplotlib、Scikit-learn等模块
项目描述:本项目旨在通过机器学习和数学建模技术对机票价格信息进行分析与预测,从而为用户提供更准确的价格预测和购买建议。项目的核心目标是提高机票价格预测的准确率,并通过数据驱动的决策支持用户做出更明智的购票选择。
职责:数据预处理对爬取到的数据集进行清洗,运用数据可视化探索特征之间的关系进行特征分析,建立机价预测模型并调优,对模型的训练和验证,达到89%的模型准确率。基于影响机票价格的重要特征,如起飞时间、机票价格等,构建航线预测模型,预测最优航线,将预测准确率提升至93%。
数据展示:在数据预处理阶段,从初始的约10,000条机票记录中,通过清洗和标准化处理,最终得到约9,500条高质量数据记录用于模型训练和测试。特征分析确定了10个对模型预测影响最大的特征,这些特征包括起飞和落地时间、航空公司、航班间隔、机型等。
Web后端项目:SpringBoot与Vue结合的后台管理系统
技术栈:SpringBoot,Vue,Echarts,Axios
职责:采用SpringBoot框架连接数据库,结合Vue前端与Echarts实现数据可视化,运用Axios模块请求后端接口,实现动态加载Echarts数据源,构建具备增删查改功能的后台管理。
功能实现:搭建完整的后台管理系统,支持数据的动态展示与操作,提升管理效率。
HTML5项目:天猫母婴数据可视化大屏以及个人主题网站设计
项目描述: 在可视化大屏项目中,我负责使用HTML5、CSS和JavaScript技术来设计和开发一个天猫母婴数据可视化大屏。这个项目的主要目标是通过可视化的方式展示天猫母婴数据集的数据分析结果,并提供一个直观且易于使用的界面供用户浏览和交互。
职责: 为了实现数据的可视化展示,我负责绘制和组装可视化大屏的每个区块。精确地定位了各个元素的位置,并进行了精细的调试,以确保HTML代码的正确性和兼容性。将天猫母婴数据集的数据以图形化的形式呈现出来,使用户可以一目了然地了解数据分析结果。
数据展示: 在项目中,我实现了天猫母婴数据集的图形展示。我设计了一个直观的可视化大屏,通过图表、图形和表格等形式展示了各种数据,如销售额、用户行为分析等。这些可视化元素帮助用户更好地理解数据,并提供了更深入的洞察。
Python爬虫项目:自动化信息抓取与处理
项目描述:在多个不同的项目中,我负责了复杂的爬虫开发和数据处理工作。以下是我的主要项目经历,这些经历展示了我在自动化工具与处理方面的专业技能。
项目一:招聘网站爬虫项目:我使用Playwright自动化爬虫工具,结合代理池技术来有效地应对网站的反爬机制。我的主要职责包括实现高效的数据抓取流程,从而获取Python工程师的岗位信息,涵盖职位名称、发布时间、工作地点和薪资等关键数据,并将这些数据存入数据库中。
项目二:机票网站信息爬虫项目:在此项目中,我利用Playwright自动化工具进行自动登录,并抓取机票价格、起落时间、出发日期、是否中转以及中转地、机票余量等重要信息。通过按顺序访问航班名和航线链接,我能够高效地收集大量航空数据,同时运用异步协程和多线程技术以提高程序的性能和效率。
项目三:视频网站爬虫项目:在知名学习网站这个项目中,我使用Playwright工具来抓取用户主页上的所有视频。通过输入目标用户的ID,我能够下载视频和音频内容,并借助ffmpeg工具将它们合并为完整的视频文件。为了提升处理速度,我引入了线程池来管理爬取视频链接、下载和合并的操作。在其他视频网站中,我首先使用自动化工具获取网页元素,然后下载m3u8文件和ts文件,并利用ffmpeg将它们合并成mp4格式的视频文件。我采用了异步协程和多线程下载技术,以确保下载过程的高效和快速。
成果展示:项目一成功获取并存储了包含职位名称、发布时间、工作地点和薪资等关键数据的招聘信息,为数据分析和市场研究提供了丰富的资源。项目二采集的机票信息支持了机器学习模型的数据分析和数学建模,为预测模型和推荐系统提供了准确的历史数据。项目三实现了对在线视频内容的高效下载和永久存储,为内容分析和知识提取提供了可靠的数据源。
视频网站爬虫项目:在知名学习网站这个项目中,我使用Playwright工具来抓取用户主页上的所有视频。通过输入目标用户的ID,我能够下载视频和音频内容,并借助ffmpeg工具将它们合并为完整的视频文件。为了提升处理速度,我引入了线程池来管理爬取视频链接、下载和合并的操作。在其他视
视频网站爬虫项目:在知名学习网站这个项目中,我使用Playwright工具来抓取用户主页上的所有视频。通过输入目标用户的ID,我能够下载视频和音频内容,并借助ffmpeg工具将它们合并为完整的视频文件。为了提升处理速度,我引入了线程池来管理爬取视频链接、下载和合并的操作。在其他视