案例ID:223942
技术顾问:芝麻开花 - 14年经验 - 东软
联系沟通
项目名称:在大量的pdf语料中统计出单词的使用频度
所属行业:企业服务 - 数据服务
项目采用python进行大数据的统计处理。在大量的pdf文档中分词统计单词使用频度,其中使用了numpy、pandas、pdf解析、正则检索等技术,并使用matplotlib展现出Top10的高频词。
其他人才的相似案例推荐
该项目是用 Vue 框架技术研发,用 ElementUI 框
该项目是基于 HTML+Css3+JS+JQ+Vue 技术研
一、负责平台的开发与运维及数据爬取 二、功能模块
主要负责该网站前后台的开发与运维,该网站主要覆盖EHS领域法
提供项目关键环节监测图形化展示功能,展示项目的执行状态,以及
1. 负责日常管理和建设工作,带领团队管理300多台服务器,
物业管理系统的主要功能 物业管理:系统可以实现对物业设施、
在公司开发的SIMLinkERP系统,这是一个测试站点,系统
尚品爱购是一家大型综合性商业广场,为他们开发的是公众号程序,
财保箱(小程序全栈开发) 项目描述:该项目是一款类 AI
项目描述: 采用B/S和C/S架构,建设土地征收管理信息监
为国家卫生监督资源中心搭建辅助决策大数据支撑平台,归集各类报
企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才
关注猿急送微信平台,接收实时人才推送