GPT-4o Mini 替代 GPT-3.5，更快更强

全新免费快速的 ChatGPTOpenAI 宣布发布 GPT-4o mini，这是一种开创性的模型，旨在使最先进的人工智能技术更易获取且更具经济性。

GPT-4o mini 现已立即可用，取代了已过时的 GPT-3.5 模型，提供了增强的性能和显著降低的成本。这一发展标志着人工智能的一个重要里程碑，为开发者和企业提供了强大的工具，以高效构建和扩展他们的应用程序。# 模型性能和能力 GPT-4o mini 在人工智能性能方面设定了新的标准，在多个基准测试和实际应用中表现出色。该模型在大规模多任务语言理解（MMLU）基准测试中取得了令人印象深刻的82%的得分，超越了GPT-4在聊天偏好方面的表现，展示了其在文本智能和多模态推理方面的先进能力。

大规模多任务语言理解（MMLU）是一项旨在评估人工智能模型在57个学科知识和推理能力的基准测试，覆盖从初级到高级专业水平。# 基准性能 推理任务：GPT-4o mini 在 MMLU 上得分 82.0%，超过了竞争对手如 Gemini Flash（77.9%）和 Claude Haiku（73.8%）。数学和编码能力：在多语言小学数学（MGSM）基准测试中，GPT-4o mini 取得了 87.0%的成绩，显著高于 Gemini Flash（75.5%）和 Claude Haiku（71.7%）。在 HumanEval 编码基准测试中，其得分为 87.2%，而 Gemini Flash 为 71.5%，Claude Haiku 为 75.9%。多模态推理：在多模态推理评估（MMMU）中，GPT-4o mini 的得分为 59.4%，优于 Gemini Flash（56.1%）和 Claude Haiku（50.2%）。Gemini Flash 和 Claude Haiku 是来自其他公司的竞争性人工智能模型，各自具有独特的优势。由谷歌开发的 Gemini Flash 专注于速度和效率，而 Anthropic 的 Claude Haiku 则强调在人工智能应答中的高级推理和伦理考量。

多语言基础学校数学基准（MGSM）包括翻译成多种语言的小学数学问题，评估人工智能模型在不同语言环境下进行数学推理的能力。

HumanEval 是一个评估由人工智能模型生成的代码功能正确性的基准，涉及测试语言理解、算法和简单数学技能的任务。

MMMU 评估人工智能模型在理解和推理来自多个模态（如文本、图像和图表）信息的能力，涵盖广泛的学科领域。

能力

目前，GPT-4o mini API 支持文本和视觉，未来将支持文本、图像、视频和音频的输入/输出。该模型具有 128K 令牌的上下文窗口，知识截止于 2023 年 10 月。

其改进的分词器使其在处理非英语文本时更加经济高效。该模型在# 成本效益 GPT-4o mini被设计为广泛应用的一种经济实惠的解决方案。其输入令牌仅需每百万15美分，输出令牌每百万60美分，价格比以前的顶尖模型便宜一个数量级，比GPT-3.5 Turbo便宜超过60%。这大幅度的成本降低为开发者和企业开辟了新的可能性，使他们能够更高效地构建和扩展AI应用程序。OpenAI首席执行官山姆·阿特曼指出，人工智能模型的成本显著下降，称大型模型的成本在两年内下降了99%。这一剧烈的下降使得先进的人工智能技术可供更广泛的受众使用，促进了各个行业的创新和发展。# 现实世界的应用和用例 GPT-4o mini 的低成本和低延迟使其非常适合各种现实世界的应用。它在需要链接或并行处理多个模型调用、处理大量上下文以及提供快速实时文本响应的任务中表现出色。例子包括：

客户支持： 实时提供快速、准确的客户咨询响应。数据提取： 从收据或发票等文档中提取结构化数据。内容生成： 根据提供的上下文生成高质量的电子邮件回复和其他书面内容。 OpenAI 与 Ramp 和 Superhuman 等公司合作，在现实世界场景中测试 GPT-4o mini，结果其始终表现优于 GPT-3.5 Turbo。这种合作凸显了该模型在各种应用中的实用性和有效性。

安全功能和增强

OpenAI 已在 GPT-4o mini 中融入了强大的安全措施，以确保安全可靠的使用。在预训练阶段，团队过滤掉不良内容，如仇恨言论、成人内容和垃圾邮件。训练后，采用人类反馈强化学习（RLHF）等技术，使模型的行为GPT-4o mini 是第一款应用 OpenAI 的指令层次方法论的模型，该方法提高了对越狱、提示注入和系统提示提取的抵抗力。超过 70 位外部专家对该模型进行了测试，以识别潜在风险，这些风险将在未来的更新中得到解决。OpenAI 对安全性的承诺确保了 GPT-4o mini 可在大规模应用中安全使用。

结论

GPT-4o mini 代表了人工智能技术的一项重大进步，以极低的成本提供无与伦比的性能。它在推理、数学和编码任务以及多模态理解方面的能力，使其成为开发者和企业的强大工具。该模型的经济性结合强大的安全特性，为广泛采用和创新铺平了道路。OpenAI 的愿景是使人工智能广泛可用且具有成本效益，这在 GPT-4o mini 中得到了体现，为人工智能驱动的应用开辟了一个新时代。

参考资料

GPT-4o mini：推动成本效益智能
LMSYS 排行榜
如何用 Tiktoken 计算令

GPT-4o Mini 替代了 GPT-3.5，更快且更强大。

GPT-4o Mini 替代 GPT-3.5，更快更强

全新免费快速的 ChatGPTOpenAI 宣布发布 GPT-4o mini，这是一种开创性的模型，旨在使最先进的人工智能技术更易获取且更具经济性。

能力

安全功能和增强

结论

参考资料

推荐阅读：

图文

您经过培训的数据截止到2023年10月。

赋迪奥本AI

上海赋迪网络科技