掌握Python、R、Excel和SQL,用户可以覆盖数据科学工作流的每个阶段:
数据获取与读取:通过SQL从数据库提取数据,或者使用Python、R或Excel导入数据文件。
数据清洗与处理:在Python或R中使用丰富的库进行复杂的清理工作,也可以在Excel中手动调整小规模数据或在SQL中进行简单的清洗。
探索性数据分析(EDA):利用Python、R和Excel进行数据的初步分析和可视化,发现数据中的趋势和模式。
数据建模与预测:在Python或R中应用机器学习或统计模型,进行分类、回归或聚类等建模任务,生成预测结果。
结果展示与报告:通过Excel生成图表,或者在Python、R中使用高级可视化工具进行数据故事的讲述,最后生成报告。
在智弘佳誉公司对吉利、奇瑞、比亚迪等汽车公司的销售数据进行处理,分析输出分析报告
在校期间多次参加数学建模比赛,获得泰迪杯数据挖掘挑战赛全国二等奖、亚太杯全国二等奖、中青杯全国二等奖,全国大学生数学建模比赛市级一等奖、正大杯社会调查比赛市级一等奖、美国大学生数学建模二等奖等
创建了创业项目获得三创比赛市级一等奖、全国大学生挑战杯市级二等奖等
随着城市化进程的加快和机动车数量的持续增加,交通拥堵、事故频发以及环境 污染等问题日益严重。这些问题不仅影响了出行效率和生活质量,也制约了社会经济 的发展。因此,科学合理地进行交通管控尤为重要。 针对问题一,为分析 2024 年 4 月 1 日至 5 月 6 日车流量差异,
多模态数据检索技术针对检索结果属于不同媒体类型的场景,当用户对一种 模态的查询词进行检索时,它能返回与之匹配的其他模态的检索结果。这种技术 能够有效地提高平台多模态数据的利用率,提升用户的使用体验。为此,本文采 用了视觉语义嵌入(VSE)模型来进行图像文本检索,并通过自适应