一、需求描述:
类别:利用序列生成网络进行诗歌生成
进度:网上有已经利用seqgan生成诗歌的代码
功能:在原有seqgan(序列生成对抗网络)的基础上进行改进,使得最终生成的诗歌一方面要满足诗歌的平仄规则的要求;其次,原有seqgan中采用的是蒙特卡洛树搜索算法,具有一定的随机性,改进的另一个点要设法降低它的随机性,提高效率;最后,原本生成的诗歌最终用BLEU(机器生成与人工创作之间的相似度)这个指标进行评测的,改进后,BLEU指标要明显高于原本的数值。总之,使得机器生成的诗歌要尽可能的接近人工创作,指标进行相应的提升。
技术:深度学习、基于pytorch框架。
二、人才要求:
熟悉深度学习,熟悉自然语言处理技术(包括但不限于如:古诗词研究语料库的建立、分词处理、平仄标注等)、熟练使用pytorch框架进行编程、熟悉近几年前沿自然语言处理技术和深度学习技术,从事过自然语言处理技术的经验者优先。
三、参考产品:
已有的古诗词研究语料库
Lantao Yu的论文:Sequence Generative Adversarial Nets with Policy Gradient
四、合作方式:
工作方式:远程开发。
工作周期:5-8天