医疗文本多标签和多类别分类

基本信息

案例ID:137290

技术顾问:Dr. Tony - 12年经验 - IBM

联系沟通

微信扫码,建群沟通

项目名称:医疗文本多标签和多类别分类

所属行业:医疗健康 - 专业细分服务

->查看更多案例

案例介绍

对医疗文本进行多标签分类。数据是关于用户提交的各类关于癌症研究的proposal,比如皮肤癌,肺癌等等。数据大概有6000个这样的proposal,每个proposal为PDF或word文件(PDF文件居多),平均10页内容。每个proposal可能隶属于多个具体的癌症类型。目标是对这些proposal进行多标签分类。
我的职责全程独立负责完成项目。
1. 转换PDF,word到txt文件
2. 对数据进行预处理
3. 使用不同的特征工程方法(比如TFIDF,Word2Vec, BERT etc.,)
4. 使用不同的分类模型(比如SVM, Random Forest, XGB, Neural Network 等等)
5. 对数据集进行10轮交叉验证
6. 使用多个指标对结果进行验证和分析
7. 对结果进行可视化展示

相似案例推荐

其他人才的相似案例推荐

  • 合同制约,不可公开

    合同制约,不可公开

    一人负责该网站前后台以及数据库搭建,编写,测试,上线,页面主

  • 上海某医院系统

    上海某医院系统

    需求分析、数据库设计、模块开发、测试、修复bug,解决幂等问

  • 食品检测

    食品检测

    提供食品安全抽检业务全流程管理功能,对食品安全数据进行深度挖

  • 食品检测

    食品检测

    提供食品安全抽检业务全流程管理功能,对食品安全数据进行深度挖

  • 惠食安

    惠食安

    通过打造全链条、实时、动态、闭环式联动的食品安全管理机制并信

  • 全民战疫

    全民战疫

    最近武汉肺炎 2019-nCoV来势汹汹,全城戒备。虽然是一

  • MIC-1000

    MIC-1000

    项目为医疗领域某开发设备,本人负责设备通讯及总控,开发使用三

  • 移动护理平台

    移动护理平台

    针对临床护理工作设计与开发的一套平台,依托移动 PDA 与无

  • Crisis VR

    Crisis VR

    使用electron打包桌面应用,通过调取自定义协议URLP

  • 医院ITIL系统

    医院ITIL系统

    主要为辅助医院信息科对工单进行管理。本系统包含服务申请、服务

  • 医药 B2B 商城项目

    医药 B2B 商城项目

    医药 B2B 商城项目。使用了 CSS3 和 HTML5 的

  • 健康管理平台

    健康管理平台

    该产品主要针对的是本公司的常视康肠镜检查仪器做的一个人体健康

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服