一、编程语言:
主要开发语言:Python
常用开发语言:R
二、数据挖掘:
基本工具:Numpy、Pandas、dplyr
机器学习:熟练使用scikit-learn
深度学习:熟练掌握Pytorch,擅长基于图像(特别是医疗影像)的深度学习建模
可视化:matplotlib、ggplo2、ggplotly
结构化报告:Rmarkdown
网页开发:Flask、Plumber、Jinja2
数据库:Pymysql、redis
三、爬虫:
基本技能:selenium,模拟登陆,验证码识别
网页解析:正则表达式、xpath、pyquery、CSS
爬虫框架:pyspider
四、专业技能
熟练掌握医疗dicom数据的操作
一、机器学习平台的算法部分开发,用户可以使用平台完成以下操作
· 对表格进行解析和清洗
· 对表格数据进行缺失值处理、归一化、离散化、过采样欠采样等预处理
· 对表格数据进行随机拆分、非随机拆分、交叉验证等分组建模
· 进行基于各种算法的特征筛选
· 整理建模结果,形成表格和图像
· 进行超参搜索,优化模型结果
· 部署训练好的模型,进行预测
二、深度学习平台的算法部分开发,用户可以使用平台完成以下操作
· 对图像文件进行整理和清洗
· 对图像文件进行预处理
· 镜像、裁剪、色彩变换等数据增强
· 自定义各种参数,完成图像分类、目标检测、语义分割等任务
· 模型可视化
· 模型部署和预测
三、基础统计平台的算法部分开发,用户可以使用平台完成以下操作
· 描述性分析、各种检验、回归分析、一致性检验、生存分析等统计任务
· 结构化输出统计图表
· 支持对各种统计图表的自定义编辑
四、AI辅助标注系统的开发
· 提供各种深度学习分割和检测模型的API,用于人体各类器官和病灶的辅助分割
· 支持用户自主上传和配置模型,并用于分割任务
· 系统进行任务调度和资源管理
· 界面华操作,实时输出结果