• LDA/LSI 专利、论文数据gensim主题模型分类
• Word2Vec同义词模型分类3T论文数据/TF-IDF文本权重接口
• 对英语论文、专利数据进行词性标注、词干提取(nltk)
• 文本分词、停用词、相似度预处理等(jieba/genism/nltk)
• scrapy/requests数据爬取、pandas常规业务分析
• 会员匹配搜索ElasticSearch、Kafka增量同步
• Kafka实时流水采集/监控系统,日流水460G
• Spring boot/Mybatis/React/Dubbo 网页端系统前后端开发
• Hive/Spark/MLlib 常规业务数据分析/算法挖掘
• Mysql性能调优、复制/分布式redis、codis
• 涉及工具: IDEA、PyCharm、macbook、HHKB、vim、zsh
• LDA/LSI 专利、论文数据gensim主题模型分类
• Word2Vec同义词模型分类3T论文数据/TF-IDF文本权重接口
• 对英语论文、专利数据进行词性标注、词干提取(nltk)
• 文本分词、停用词、相似度预处理等(jieba/genism/nltk)
• scrapy/requests数据爬取、pandas常规业务分析
• 会员匹配搜索ElasticSearch、Kafka增量同步
• Kafka实时流水采集/监控系统,日流水460G
• Spring boot/Mybatis/React/Dubbo 网页端系统前后端开发
• Hive/Spark/MLlib 常规业务数据分析/算法挖掘
• Mysql性能调优、复制/分布式redis、codis
• 涉及工具: IDEA、PyCharm、macbook、HHKB、vim、zsh