诚招NLP研究方向硕博项目组成员
项目主题:少数民族语言反向词典任务
1.定义:反向词典是指接收用户的一段话描述,返回与其语义相似的100个候选词的一种电子词典。例如:用户输入:形容山很高。模型1秒内输出:山岳、崇山峻岭、高峰....等词。现成的参考有清华大学的【汉语反向词典】,网址为:https://wantwords.net/,请尝试用一下。
2.我的目标:我看了不少参考文献,掌握了最新构建方法的思路,可是本人是文科出身,具体实现起来时间成本很大,所以想找一位【生成式或其它大语言模型微调或训练】有经验的人士,一起探索新ideal,并落地这个项目。
3.数据方面:我已经准备了几部词典的近20w词条和其对应的词典定义,其中未重复词条包含8w余个,已经经过了校对,直接可用。
4.期待的开发者:NLP自然语言处理硕博优先、有相对充裕的时间一起探索思路(ps:我已有一种成熟的思路,但还需优化),一起设计实验框架,认真负责、微信回复不拖延的开发者。