近日,Meta 提出了 Agent-as-a-Judge 的概念,被视为智能体优化方面的又一重要成果。传统的智能体评估方式往往只关注最终结果,忽略了执行过程中的关键细节,或依赖大量人力进行评估。为了解决这一痛点,Meta ...
在人工智能领域,大型语言模型(LLMs)如OpenAI和谷歌所宣称的先进“推理”能力被认为是迈向未来的关键一步。然而,苹果的六名工程师进行的一项新研究显示,这些模型在面对看似微不足道的常规基准问题变化时,其数学“推理”能力极其脆弱且不可靠。这项新研究 ...
编辑:Lumina 【新智元导读】近期微软的高层人员调动以及新工具的推出,可能暗示着其AI战略的转向。 微软已经有一段时间没有向外界透露任何有关GenAI的讯息了。 在减少对OpenAI技术依赖的过程中,GenAI本该是微软的重要战略,但 ...
受限于AI技术的特性,AI大模型的烧钱能力让处在旋涡中的奥尔特曼,再也无法以“非营利”为前置条件来规划公司前景。伴随投资规模的不断扩大,OpenAI的性质也在发生着变化。
日前,Anthropic CEO Dario Amodei 在其个人博客中呼吁人们重视人工智能(AI)安全问题,“原则上 AI 可以帮助好人,也可以帮助坏人”,过于低估 AI 风险将成为“阻碍我们走向积极未来的唯一障碍”。
在人工智能迅速发展的今天,大模型的应用正在改变各行各业。然而,对于技术小白来说,面对诸如“LlamaIndex”、“Ollama”、“Anthropic”等复杂术语,往往感到无从下手。这篇文章旨在为你解读这些关键名词,帮助你理清思路,轻松入门大模型开 ...
Needham分析师对SentinelOne Inc (NYSE:S)给予了积极评价,以买入评级和32.00美元的目标价开始覆盖。