OpenAI | 第 2 页

GAIA基准测试：AI智能体的新战场与OpenAI的Deep Research

本文探讨了GAIA基准测试在AI智能体领域的重要性，重点分析了OpenAI的Deep Research在测试中的表现及其对AI技术发展的影响。通过对比Manus等竞争对手，揭示了A...

AI快讯

3个月前

OpenAI最新发布的AI智能体Operator依托CUA模型，能够在Web上执行复杂任务，如点击、滚动和输入文字。尽管在OSWorld上的表现仅为38.1%，显示出其在操作系统任...

AI快讯

3个月前

OpenAI最新发布的GPT-4.5标志着其在人工通用智能（AGI）领域的进一步探索。尽管模型在情感理解和直觉方面有所提升，但其高昂的成本和增量改进引发了关于AGI实...

AI快讯

3个月前

OpenAI发布了基于CUA模型的AI智能体Operator，能够代理用户执行网页操作，如点击、滚动和输入文字，自动完成复杂任务。CUA模型融合视觉识别与高级推理，无需...

AI快讯

3个月前

OpenAI发布的CUA模型是其首款AI智能体Operator的核心，能够代理用户执行基于网页的操作，如点击、滚动和输入文字，并自动执行复杂任务。CUA模型融合了视觉识...

AI快讯

3个月前

GAIA测试作为评估通用AI助手能力的国际化基准测试，已成为衡量AI智能体性能的“黄金标准”。本文深入探讨GAIA测试的核心价值，分析Manus和DeepResearch在测试中...

AI快讯

3个月前

本文探讨了Manus和DeepResearch在GAIA测试中的表现，分析了它们在AI智能体领域的创新与竞争。Manus作为全球首款通用型智能体，在GAIA测试中创下新纪录，而Dee...

AI快讯

3个月前

OpenAI最新发布的DeepSearch产品由Grok-2模型驱动，专为网页浏览和数据分析优化，能够整合数百个在线来源生成高质量报告。该产品已向ChatGPT Pro用户开放，每...

AI快讯

3个月前

OpenAI在东京直播活动中正式推出Agent产品DeepResearch，该产品由o3模型特定版本驱动，专为网页浏览和数据分析优化。DeepResearch能够查找、分析并整合数百个...

AI快讯

3个月前

本文探讨了OpenAI最新发布的DeepSearch产品，由o3模型驱动，专为网页浏览和数据分析优化。DeepSearch能够整合数百个在线来源，生成高质量报告，并对软件板块...

AI快讯

3个月前