在大量的pdf语料中统计出单词的使用频度

基本信息

案例ID:223942

技术顾问:芝麻开花 - 14年经验 - 东软

联系沟通

微信扫码,建群沟通

项目名称:在大量的pdf语料中统计出单词的使用频度

所属行业:企业服务 - 数据服务

->查看更多案例

案例介绍

项目采用python进行大数据的统计处理。在大量的pdf文档中分词统计单词使用频度,其中使用了numpy、pandas、pdf解析、正则检索等技术,并使用matplotlib展现出Top10的高频词。

相似案例推荐

其他人才的相似案例推荐

发布任务

企业点击发布任务,工程师会在任务下报名,招聘专员也会在1小时内与您联系,1小时内精准确定人才

微信接收人才推送

关注猿急送微信平台,接收实时人才推送

接收人才推送
联系需求方端客服
联系需求方端客服