奥本 AI 将所有的最新 AI 聚合到了一起,为您开启多模型 AI 绘画新时代!

扫码即刻关注公众号

GPT-4o Mini 替代了 GPT-3.5,更快且更强大。


7 个月前

GPT-4o Mini 替代 GPT-3.5,更快更强

全新免费快速的 ChatGPTOpenAI 宣布发布 GPT-4o mini,这是一种开创性的模型,旨在使最先进的人工智能技术更易获取且更具经济性。

GPT-4o mini 现已立即可用,取代了已过时的 GPT-3.5 模型,提供了增强的性能和显著降低的成本。这一发展标志着人工智能的一个重要里程碑,为开发者和企业提供了强大的工具,以高效构建和扩展他们的应用程序。# 模型性能和能力 GPT-4o mini 在人工智能性能方面设定了新的标准,在多个基准测试和实际应用中表现出色。该模型在大规模多任务语言理解(MMLU)基准测试中取得了令人印象深刻的82%的得分,超越了GPT-4在聊天偏好方面的表现,展示了其在文本智能和多模态推理方面的先进能力。

大规模多任务语言理解(MMLU)是一项旨在评估人工智能模型在57个学科知识和推理能力的基准测试,覆盖从初级到高级专业水平。# 基准性能 推理任务:GPT-4o mini 在 MMLU 上得分 82.0%,超过了竞争对手如 Gemini Flash(77.9%)和 Claude Haiku(73.8%)。数学和编码能力:在多语言小学数学(MGSM)基准测试中,GPT-4o mini 取得了 87.0%的成绩,显著高于 Gemini Flash(75.5%)和 Claude Haiku(71.7%)。在 HumanEval 编码基准测试中,其得分为 87.2%,而 Gemini Flash 为 71.5%,Claude Haiku 为 75.9%。多模态推理:在多模态推理评估(MMMU)中,GPT-4o mini 的得分为 59.4%,优于 Gemini Flash(56.1%)和 Claude Haiku(50.2%)。Gemini Flash 和 Claude Haiku 是来自其他公司的竞争性人工智能模型,各自具有独特的优势。由谷歌开发的 Gemini Flash 专注于速度和效率,而 Anthropic 的 Claude Haiku 则强调在人工智能应答中的高级推理和伦理考量。

多语言基础学校数学基准(MGSM)包括翻译成多种语言的小学数学问题,评估人工智能模型在不同语言环境下进行数学推理的能力。

HumanEval 是一个评估由人工智能模型生成的代码功能正确性的基准,涉及测试语言理解、算法和简单数学技能的任务。

MMMU 评估人工智能模型在理解和推理来自多个模态(如文本、图像和图表)信息的能力,涵盖广泛的学科领域。

能力

目前,GPT-4o mini API 支持文本和视觉,未来将支持文本、图像、视频和音频的输入/输出。该模型具有 128K 令牌的上下文窗口,知识截止于 2023 年 10 月。

其改进的分词器使其在处理非英语文本时更加经济高效。该模型在# 成本效益 GPT-4o mini被设计为广泛应用的一种经济实惠的解决方案。其输入令牌仅需每百万15美分,输出令牌每百万60美分,价格比以前的顶尖模型便宜一个数量级,比GPT-3.5 Turbo便宜超过60%。这大幅度的成本降低为开发者和企业开辟了新的可能性,使他们能够更高效地构建和扩展AI应用程序。OpenAI首席执行官山姆·阿特曼指出,人工智能模型的成本显著下降,称大型模型的成本在两年内下降了99%。这一剧烈的下降使得先进的人工智能技术可供更广泛的受众使用,促进了各个行业的创新和发展。# 现实世界的应用和用例 GPT-4o mini 的低成本和低延迟使其非常适合各种现实世界的应用。它在需要链接或并行处理多个模型调用、处理大量上下文以及提供快速实时文本响应的任务中表现出色。例子包括:

客户支持: 实时提供快速、准确的客户咨询响应。数据提取: 从收据或发票等文档中提取结构化数据。内容生成: 根据提供的上下文生成高质量的电子邮件回复和其他书面内容。 OpenAI 与 Ramp 和 Superhuman 等公司合作,在现实世界场景中测试 GPT-4o mini,结果其始终表现优于 GPT-3.5 Turbo。这种合作凸显了该模型在各种应用中的实用性和有效性。

安全功能和增强

OpenAI 已在 GPT-4o mini 中融入了强大的安全措施,以确保安全可靠的使用。在预训练阶段,团队过滤掉不良内容,如仇恨言论、成人内容和垃圾邮件。训练后,采用人类反馈强化学习(RLHF)等技术,使模型的行为GPT-4o mini 是第一款应用 OpenAI 的指令层次方法论的模型,该方法提高了对越狱、提示注入和系统提示提取的抵抗力。超过 70 位外部专家对该模型进行了测试,以识别潜在风险,这些风险将在未来的更新中得到解决。OpenAI 对安全性的承诺确保了 GPT-4o mini 可在大规模应用中安全使用。

结论

GPT-4o mini 代表了人工智能技术的一项重大进步,以极低的成本提供无与伦比的性能。它在推理、数学和编码任务以及多模态理解方面的能力,使其成为开发者和企业的强大工具。该模型的经济性结合强大的安全特性,为广泛采用和创新铺平了道路。OpenAI 的愿景是使人工智能广泛可用且具有成本效益,这在 GPT-4o mini 中得到了体现,为人工智能驱动的应用开辟了一个新时代。

参考资料

  • GPT-4o mini:推动成本效益智能
  • LMSYS 排行榜
  • 如何用 Tiktoken 计算令

上海赋迪网络科技

电话:18116340052