OpenAI推出GPT-4o mini,号称“最具成本效益的小模型”
创始人
2024-07-19 12:39:59
0

美东时间7月18日,OpenAI推出GPT-4o mini,并声称这是"最具成本效益的小型模型"。GPT-4o mini预计将通过让智能变得更加实惠,显著扩大使用AI构建的应用程序范围。

据OpenAI发布的消息,GPT-4o mini在MMLU(大规模多任务语言理解,衡量模型广泛的世界知识和解决问题的能力)上的得分为82%,比另外两款低成本竞品更高--Google的Gemini Flash得分为77.9%,Anthropic的Claude Haiku得分为73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面优于GPT-4.

GPT-4o mini已经在几个关键基准上进行了评估,涉及文本和视觉的推理任务、数学推理和编码任务、多模态推理,结果均优于其他小型模型。


各种评估基准下的模型评估分数OpenAI官方网站

GPT-4o mini还在API中支持文本和视觉功能,未来还将支持文本、图像、视频和音频的输入和输出,并且拥有截至2023年10月的知识。得益于与GPT-4o共享的改进的tokenizer(编译器),GPT-4o mini处理非英语文本方面也更具成本效益。

GPT-4o mini成本更低、延迟更低,能够完成更多的任务,例如调用多个API(应用程序编程接口)、传递和记录大量完整的代码库或对话记录、更快速、实时地与使用者聊天等。

作为模型开发过程的一部分,OpenAI 已经与一些值得信赖的合作伙伴合作,以更好地了解GPT-4o mini的使用场景和局限性。目前已与Ramp和超人等公司进行了合作,反馈发现在执行从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件响应等任务时,GPT-4o mini的表现明显优于GPT-3.5 Turbo。

考虑到价格因素,轻量化且廉价的"小而精"AI模型可能更受企业欢迎,小模型的相关开发竞争激烈。谈及为何没有更早地推出"小而精"的模型时,OpenAI的API产品负责人Olivier Godement说,"我们的使命是使用最前沿技术,构建最强大、最有用的应用程序,我们当然希望继续做前沿模型,推动技术进步……但我们也希望拥有最好的小模型,我认为它会非常受欢迎。"

OpenAI称,开发过程中的每一步都考虑了安全性。开发时会过滤掉仇恨言论、色情信息、个人隐私信息等不宜模型学习和输出的内容,并采用自动和人工(超过70位来自社会心理学和错误信息等领域的外部专家)对模型进行了评估,以识别潜在风险。GPT-4o mini是第一个应用指令层次结构的模型,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力,这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。

自2022年推出功能较弱的模型text-davinci-003以来,GPT-4o mini的每token成本已下降99%。GPT-4o mini定价比之前的Frontier型号便宜一个数量级,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免费版、Plus版和团队版用户已经能够使用GPT-4o mini替代GPT-3.5,企业用户也将从下周开始使用。

相关内容

热门资讯

柯克案枪手遭父亲“举报”后落网... 当地时间9月12日,美国联邦调查局局长帕特尔和犹他州州长考克斯证实,美国总统特朗普的政治盟友查理·柯...
柯克枪击案嫌疑人身份确认,系犹... 当地时间9月12日,央视记者获悉,美国一执法官员透露,此前因枪杀查理·柯克而被拘留的嫌疑人身份已确认...
尼泊尔过渡政府总理卡尔基宣誓就... 当地时间12日21时40分左右,尼泊尔过渡政府总理苏希拉·卡尔基在总统府宣誓就职,成为尼泊尔历史上首...
尼泊尔宣布解散联邦议会众议院 ... 尼泊尔总统府当地时间12日晚宣布,解散联邦议会众议院,计划于2026年3月5日举行大选。尼泊尔总统办...
全国人民代表大会常务委员会关于... 全国人民代表大会常务委员会关于修改《中华人民共和国食品安全法》的决定(2025年9月12日第十四届全...
国务院办公厅印发《“三北”工程... 日前,国务院办公厅印发修编后的《“三北”工程总体规划》(以下简称《规划》),指导各地区保持战略定力,...
武网官宣参赛阵容:郑钦文伤愈归... 9月12日,2025武汉网球公开赛揭晓首批单打正赛入围名单,正处在伤愈恢复期的郑钦文确认参加比赛。作...
第50届南丁格尔奖颁奖大会在京... 新华社北京9月12日消息,第50届南丁格尔奖颁奖大会12日上午在北京人民大会堂举行。国家副主席、中国...
西贝公布13道菜品制作过程,称... 西贝公布“罗永浩菜单”菜品具体制作过程的“作业指导书”。9月12日下午,西贝微信公号发布消息称,“作...
财政部:“十四五”时期 国家财... 今天(12日)下午,国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会,财政部部长蓝...
我国政府负债率处于合理区间 风... 财政部部长蓝佛安9月12日在国新办举行的“高质量完成‘十四五’规划”系列主题新闻发布会上介绍,截至2...
我国新一代载人运载火箭长征十号... 据中国载人航天工程办公室消息,2025年9月12日,我国在文昌航天发射场成功组织实施长征十号系列运载...
财政部:“十四五”时期 财政民... 今天下午,国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会。发布会上,财政部部长蓝...
人民法院将有力有效治理网络暴力... 最高人民法院副院长贺小荣9月12日在国新办举行的“高质量完成‘十四五’规划”系列主题新闻发布会上介绍...
福建舰首次通过台湾海峡意味着什... 日前,我国第3艘航空母舰福建舰通过台湾海峡,赴南海相关海域开展科研试验和训练任务。这是福建舰第一次通...
云上贵州大数据(集团)有限公司... 据贵州省纪委监委消息:云上贵州大数据(集团)有限公司党委书记、董事长徐昊涉嫌严重违纪违法,目前正接受...
河南省委巡视组原正厅级巡视专员... 据河南省纪委监委消息:河南省委巡视组原正厅级巡视专员高建慧涉嫌严重违纪违法,目前正接受河南省纪委监委...
最高礼遇!机场“过水门”迎接志... 今天,第十二批30位在韩中国人民志愿军烈士遗骸及相关遗物由中国空军运-20专机接运回国。运-20专机...
警惕!“钓鱼式”网络攻击盯上办... 近日,某境外反华敌对势力针对某机关单位工作邮箱实施网络攻击窃密活动,并以此为跳板,将病毒植入与该单位...
国家有关部门正研究海南岛内居民... 经党中央批准,海南自贸港全岛封关运作定于2025年12月18日正式启动。《人民财讯》记者独家获悉,为...