软件工程硕士学位,研究方向为自然语言处理,研究领域包括新闻文本抽取,文本数据清洗,提取特征和文本分类、新闻文本摘要,有实时新闻文本摘要系统开发经验,学术期刊发表论文《一种新的融合BM25与文本特征的新闻摘要算法》,在国际知名软件公司从事基于阿里云的数据库软件开发工作。熟悉SpringBoot等服务端软件开发框架,擅长Java,Python,golang等编程语言。有自然语言处理和网络爬虫开发经验。
新闻文本正文抽取工具:https://github.com/chrislinan/cx-extractor-python