医疗与健康领域文本LDA主题建模和分析

基本信息

案例ID:137287

技术顾问:Dr. Tony - 12年经验 - IBM

联系沟通

微信扫码,建群沟通

项目名称:医疗与健康领域文本LDA主题建模和分析

所属行业:医疗健康 - 专科门户

->查看更多案例

案例介绍

这是我独立全程完成的一个医疗与健康领域文本主题建模和分析的项目:
本人所在行业是医疗与健康行业,所以大部分的项目都是和医疗相关。数据是近30年来的医疗与卫生年报,文件都是OCR的PDF文件,每个文件比较大,有的多达1000页,少的也有200页。 目标对这些年报进行主题建模和分析。
目。
1. 转换PDF,word到txt文件
2. 对数据进行预处理(停用词,Abbreviation extraction, Lemmatization,Phrasing 等等)
3. 对这些文本使用LDA模型进行主题建模
4. 计算perplexity值选择最优的主题数目

相似案例推荐

其他人才的相似案例推荐

  • 淘不锈

    淘不锈

    一个在线钢铁交易网站网站,vue1.0+java搭建,电商下

  • 管理系统

    管理系统

    智能疼痛管理系统:医护人员可正常登录系统,查看患者卡片、数据

  • 早期胃癌筛查全流程管理系统

    早期胃癌筛查全流程管理系统

    医院上报院内的胃癌筛查数据项给全国早期胃癌筛查联盟,社区居民

  • 医鼎

    医鼎

    项目介绍:医鼎-是北京欧应科技有限公司开发运营的一款专用于住

  • 远程病理信息系统

    远程病理信息系统

    前后端均有参与,以及项目需求调研分析。 技术要点: 1、

  • 产线数据支撑平台

    产线数据支撑平台

    主要功能有配置生成计划,配置设备参数,查询告警,处理告警,人

  • 银医通自助机终端

    银医通自助机终端

    银医通自主服务系统 是线下医疗服务终端系统,包含 挂号 充

  • 公众号汕头华美美容医院

    公众号汕头华美美容医院

    公众号汕头华美美容医院,开发前端以及后端,采用医院专科门诊挂

  • 早早发现

    早早发现

    早早发现APP是由北京智康科技有限公司开发的人工智能医疗健康

  • 康源平民大药房

    康源平民大药房

    担任前端开发工程师,html+css+js开发,药品查询、公

  • 科瓦门户网站

    科瓦门户网站

    主要针对科瓦齿科门户网站进行展示,包含科瓦文化,医疗团队,科

  • 特殊药品管理

    特殊药品管理

    特殊药品管理特殊药品管理特殊药品管理特殊药品管理特殊药品管理

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服