Random forest 的项目. 数据要英文的,可以从下面几个地方来选
Awesome datasets: https://github.com/awesomedata/awesome-public-datasets
NCAA: https://stats.ncaa.org/
Data.gov: https://data.gov/
Kaggle: https://www.kaggle.com/datasets
UCI Repository: https://archive.ics.uci.edu/
这个可以作为大体参考:https://github.com/brichards21/PHP2550-Final-Project
简介: 项目的背景, 然后这个项目是预测什么? 我们使用随机森林算法可以帮助我们实现什么?
要用 R markdown 来写代码
代码的逻辑要注释,写清楚, 然后任何一些提升算法结果的办法都要写一下,让后前后效果的对比. 可以英文也可以中文. 使用中文的话, 专业词要有英文来在后面, 例如 随机森林(random forest)
理论的来源要说一下, 使用这个: https://arxiv.org/abs/1407.7502
一定要把公式公式列出来
主要就是代码部分和数学公式这部分,其他的一些介绍什么的可以稍微来点就好.
分析的数据从我提供的里面自选, 最好不要太简单也不要太复杂, 别太大众