Holcomb Michael

ditihekhatun15 · Dołączył: 07 Maj 2024 Posty: 1

表现因此尚不清楚会发生哪一个。我们通过运行与之前相同的两个设置来研究这个问题只是这次我们专注于将标准语言模型特别是与其指令调整变体进行比较。首先我们发现当我们使用语义不相关的标签时比更好。这种效果在小型模型中非常突出比性能高出几乎赶上了。这种趋势表明指令调整增强了学习输入标签映射的能力这并不特别令人惊讶。经过指令调整的语言模型比仅预训练的语言模型更擅长学习输入标签映射。更有趣的是我们发现在跟踪翻转标签方面实际上比更差这意味着指令调整模型无法覆盖其先验知识模型无法达到翻转标签的随机猜测以下但没有指令调优的模型在相同设置下可以达到的准确率。

这些结果表明指令调整必须提高模型对语义先验的依赖程度当它们可用时。当在上下文中呈现翻转标签时指令调整模型在学习覆盖语义先验方面比仅预训练模型沙特阿拉伯手机号码列表更差。结合前面的结果我们得出结论虽然指令调优提高了学习输入标签映射的能力但它更多地加强了语义先验知识的使用。结论我们通过利用预训练期间学到的先验知识与上下文中呈现的输入标签映射来检查语言模型在上下文中学习的程度。我们首先证明当提供足够多的翻转标签时大型语言模型可以学习覆盖先验知识并且这种能力随着模型规模而出现。然后我们发现使用语义不相关的标签成功地进行是模型规模的另一个新兴能力。

最后我们分析了指令调整的语言模型发现指令调整提高了学习输入标签映射的能力而且还进一步加强了语义先验知识的使用。未来的工作这些结果强调了语言模型因此我们提出了一种新的位置嵌入方案称为裁剪位置嵌入它可以更好地与检测微调中区域裁剪的使用保持一致。此外我们在对比图像文本学习中用焦点损失替换了交叉熵损失使我们能够从更具挑战性和信息量更大的示例中学习。最后我们利用新对象提议的最新进展来增强开放词汇检测微调这是由于观察到现有方法经常由于对前景类别的过度拟合而在提议阶段错过新对象。我们也在这里发布代的语言模型具有将输入映射到多种类型标签的新兴能力这是一种可以学习输入标签映射的推理形式。任意符号。未来的研究可能有助于深入了解这些现象在模型规模上发生的原因。致谢这项工作由和进行。我们要感谢和的同事提供的建议和有益的讨论。
_________________
沙特阿拉伯手机号码列表

Reklama