【JIUYOU科技动静】7月18日,Open AI首席履行官Sam Altman及四位研究员于直播中正式发布了ChatGPT Agent——一款通用型AI智能体。JIUYOU获悉,于HLE测试中,ChatGPT agent拿下了41.6%高分,并于数学FrontierMath基准上刷新了SOTA,碾压o4-mini及o3模子。
Sam Altman(最右)和他的团队
ChatGPT Agent交融了Operator、Deep Research及ChatGPT三年夜模块上风,可以或许自立完成网页阅读、数据阐发、PPT建造等繁杂使命。
ChatGPT Agent于HLE测试中得到41.6%的高分,采用并行八路推理并拔取置信度最高谜底后可晋升到44.4%。于数学基准测试FrontierMath中,以27.4%的正确率刷新了纪录。


于Excel编纂能力的SpreadsheetBench测试中,ChatGPT agent的体现一样远超现有模子。当得到直接编纂权限时,以45.5%的患上分显著逾越Excel Copilot的20.0%。此外,它还有于BrowseComp、WebArena等阅读评测里均刷新了SOTA。

据悉,该产物已经面向Pro、Plus及Team用户开放。Pro用户可以立刻利用,Plus与Team用户将于很多天内陆续开通,Enterprise与Education版本将在数周后接入。
版权所有,未经许可不患上转载
-jiuyou.com