LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证
「任何认为自动回归式 LLM 已经接近人类水平的 AI,或者仅仅需要扩大规模就能达到人类水平的人,都必须读一读这个。AR-LLM 的推理和规划能力非常有限,要解决这个问题,并不是把它们变大、用更多数据进行训练就能解决的。」
即使 GPT-4 偶然猜出了一个有效的颜色,它的自我批判可能会让它产生幻觉,认为不存在违规行为。
-
自我批判实际上会损害 LLM 的性能,因为 GPT-4 在验证方面很糟糕; -
来自外部验证器的反馈确实能提高 LLM 的性能。
在 100 个实例中,验证器准确识别了 61 个(61%)。
下表显示了 LLM 在接受不同级别反馈(包括没有反馈)时的表现。
文章来源:https://mp.weixin.qq.com/s/osHH3wkPvSw2eZvNQO8Pzg
版权声明:MM 发表于 2023-10-25 2:28 PM。
转载请注明:LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证 | GO123.AI网址大全 | ChatGPT | Midjourney | Stable Diffusion | AI工具软件 | AI软件免费教程
转载请注明:LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证 | GO123.AI网址大全 | ChatGPT | Midjourney | Stable Diffusion | AI工具软件 | AI软件免费教程
京公网安备 11010502044423号