GPT-4学会“自我反思”:测试表现提升达30%
时间:2023-04-04 15:03:37 来源:快科技
(资料图片)
早些时候,OpenAI正式对外展示了GPT-4多模态模型,展示了它相较此前GPT-3.5强大的性能。
但事实上,从近日放出的信息来看,GPT-4最为强大的并不是它诞生时的能力,而是它能够像人类一样自我反思”。
根据研究人员Noah Shinn和Ashwin Gopinath在论文中的表述,他们开发了一种新的技术,能够让AI模拟人类的自我反思,并评估自己的表现。
这使得GPT-4 在完成各种测试的时候,会增加一些额外的步骤,让它能够自己设计测试来检查自己的答案,找出错误和不足之处,然后根据发现来修改自己的解决方案。
团队目前已经使用该技术对GPT-4进行了多种不同的性能测试。
在HumanEval测试中,GPT-4需要解决164个从未见过的Python编程问题,原本准确率为67%,使用反思技术后,准确率提升到了88%。
在 Alfworld测试中,GPT-4则需要在各种不同的交互环境中,通过执行一些允许的操作,来做出决策和解决多步任务;使用反思技术后,AI的准确率从73% 提高到97%,只有4个任务失败。
总体来看,基于这一技术,GPT-4在高难度的测试中能够取得明显进步,提升达到了30%左右。
(举报)
标签:
最新文章推荐
- GPT-4学会“自我反思”:测试表现提升达30%
- 异动快报:ST明诚(600136)4月4日14点14分触及跌停板
- 2023年4月4日氯化石蜡价格最新行情预测
- 巴西男主持正直播,妻子竟一丝不挂突然入画,惊觉秒蹲却为时晚矣 世界播报
- 民生证券给予美亚柏科推荐评级
- 为了身体健康着想,去外面吃饭3种菜品可别经常吃,有害还不干净
- 我省风电装备产业链今年《行动方案》印发|世界简讯
- 易居推出境外债重组计划,阿里巴巴已签署支持协议-环球今亮点 全球播报
- 世界快资讯丨郑州的“一环”沿用了三千多年?
- 岳西县气象局更新暴雨黄色预警【III级/较重】
X 关闭
资讯中心

2023-02-16

2022-08-06

2022-07-08

2022-05-20
X 关闭