OpenAI 发布 GPT-4.5,其最新且规模最大的非推理 AI 模型

OpenAI 发布 GPT-4.5,其最新且规模最大的非推理 AI 模型

OpenAI 近日隆重推出 GPT-4.5,这是迄今为止其规模最为宏大、知识储备最为渊博的非推理语言模型,其性能已超越前代 GPT-4o。尽管未被归类为前沿模型,GPT-4.5 仍拥有更强大的世界知识、更精湛的写作技巧以及更臻于完善的交互风格。它在写作、编程和解决问题方面表现卓越,其模式识别和会话能力也得到了显著提升,早期测试人员称其更具情商,互动性更强。

GPT-4.5 支持搜索、文件和图像上传以及画布等功能,但在发布之初,尚不具备原生多模态功能,如语音模式、视频和屏幕共享。此外,它对计算资源的需求较高,这可能会影响其部署和可扩展性。在基准测试中,GPT-4.5 在 SWE-bench Verified 基准测试中获得了 38% 的评分,比 GPT-4o 提高了 2-7%。它在减少幻觉方面也表现出显著的进步,从而提高了其可靠性。然而,GPT-4.5 并非旨在取代 o3-minideep research 模型,而是作为一种更为通用的模型而存在。

GPT-4.5 的研究预览版现已通过网页、移动和桌面端的模型选择器向 ChatGPT Pro 用户开放,并将于下周扩展到 ChatGPT Plus 和 Teams 用户。

open AI 的介绍

在人工智能领域,我们通过扩展两种互补的范式来提升其能力:无监督学习和推理。这两种范式代表了智能的两个维度。

  1. 扩展推理能力:通过训练模型进行思考,并在给出答案之前生成思维链,使其能够解决复杂的科学、技术、工程、数学问题或逻辑难题。OpenAI o1 和 OpenAI o3-mini 等模型正是这一范式的代表。
  2. 无监督学习:另一方面,它通过增加计算量和数据量,以及架构和优化方面的创新,来提高世界模型的准确性和直觉。

GPT-4.5 就是扩展无监督学习的一个范例。它在微软 Azure AI 超级计算机上进行训练,最终得到的模型拥有更广泛的知识和对世界更深刻的理解,从而减少了幻觉,并在更广泛的主题上提高了可靠性。