使用python。用sklearn的机器学习方法进行数据分析。用pandas对表格数据进行处理。用pytorch和tensorflow建立神经网络进行回归和预测。使用selenium自动化测试软件爬取数据、测试网站。使用pyqt5进行GUI编程。使用pyecharts进行数据可视化。
项目一:临床静脉血栓患者预测。根据患者各项特征数据,预测患者是否患有静脉血栓。运用了随机森林模型和神经网络模型。最终准确率达到80%以上,ROC得分在0.74以上。
项目二:设计《全网爬价》软件。采用selenium在淘宝和京东爬取数据,并给电商提供定价策略的软件。
输入商品名称和搜索条件,可以爬取京东和淘宝上相关的所有数据。并根据价格数据,给出定价策略。是我自己设计的软件。
根据临床患者的各项体征和是否患有静脉血栓进行预测,使用随机森林和神经网络(LSTM)模型。最终ROC得分稳定达到0.74以上。