本节详细介绍了推理感知预训练方法以及预训练的模型结构,并设计提出了针对
预训练任务的数字掩盖算法。之后介绍了预训练阶段的模型结构和损失函数,最后在
应用到本文研究任务即结构化数据到逻辑文本生成时提出了两阶段 Prefix-tuning 的方案,
大大减少训练的参数量以及模型的存储开销。
4.2.1 预训练任务
推理感知预训练任务是一项数值预测任务,该任务是经典掩蔽语言建模目标
(Masked Language Model)的变体,但旨在提高预训练语言模型的数值推理技能。该
任务包括输入 C 和相应的输出 D,即目标序列。C 由一对文本序列 C1 和 C2 组成,它
们用特殊字符分隔。C2等同于 D,但包含可从 C1推断出的被掩盖的数字。任务是通过
从 C1 的内容正确预测被掩盖的数字来重构 C2 的原始内容。