OpenAI推出GPT-4o mini,号称“最具成本效益的小模型”
创始人
2024-07-19 12:39:59
0

美东时间7月18日,OpenAI推出GPT-4o mini,并声称这是"最具成本效益的小型模型"。GPT-4o mini预计将通过让智能变得更加实惠,显著扩大使用AI构建的应用程序范围。

据OpenAI发布的消息,GPT-4o mini在MMLU(大规模多任务语言理解,衡量模型广泛的世界知识和解决问题的能力)上的得分为82%,比另外两款低成本竞品更高--Google的Gemini Flash得分为77.9%,Anthropic的Claude Haiku得分为73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面优于GPT-4.

GPT-4o mini已经在几个关键基准上进行了评估,涉及文本和视觉的推理任务、数学推理和编码任务、多模态推理,结果均优于其他小型模型。


各种评估基准下的模型评估分数OpenAI官方网站

GPT-4o mini还在API中支持文本和视觉功能,未来还将支持文本、图像、视频和音频的输入和输出,并且拥有截至2023年10月的知识。得益于与GPT-4o共享的改进的tokenizer(编译器),GPT-4o mini处理非英语文本方面也更具成本效益。

GPT-4o mini成本更低、延迟更低,能够完成更多的任务,例如调用多个API(应用程序编程接口)、传递和记录大量完整的代码库或对话记录、更快速、实时地与使用者聊天等。

作为模型开发过程的一部分,OpenAI 已经与一些值得信赖的合作伙伴合作,以更好地了解GPT-4o mini的使用场景和局限性。目前已与Ramp和超人等公司进行了合作,反馈发现在执行从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件响应等任务时,GPT-4o mini的表现明显优于GPT-3.5 Turbo。

考虑到价格因素,轻量化且廉价的"小而精"AI模型可能更受企业欢迎,小模型的相关开发竞争激烈。谈及为何没有更早地推出"小而精"的模型时,OpenAI的API产品负责人Olivier Godement说,"我们的使命是使用最前沿技术,构建最强大、最有用的应用程序,我们当然希望继续做前沿模型,推动技术进步……但我们也希望拥有最好的小模型,我认为它会非常受欢迎。"

OpenAI称,开发过程中的每一步都考虑了安全性。开发时会过滤掉仇恨言论、色情信息、个人隐私信息等不宜模型学习和输出的内容,并采用自动和人工(超过70位来自社会心理学和错误信息等领域的外部专家)对模型进行了评估,以识别潜在风险。GPT-4o mini是第一个应用指令层次结构的模型,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力,这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。

自2022年推出功能较弱的模型text-davinci-003以来,GPT-4o mini的每token成本已下降99%。GPT-4o mini定价比之前的Frontier型号便宜一个数量级,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免费版、Plus版和团队版用户已经能够使用GPT-4o mini替代GPT-3.5,企业用户也将从下周开始使用。

相关内容

热门资讯

集资诈骗240多亿元!“山海集... 2025年6月27日,辽宁省大连市中级人民法院对周志峰等三人非法集资一案公开宣判。被告人周志峰因犯集...
4月全球经贸摩擦指数涉及金额同... 今天(6月27日)上午,中国贸促会举办新闻发布会,公布了今年4月份的全球经贸摩擦指数,数据显示,4月...
已接待全球超60万人次 大阪世... 今天(6月27日)上午,中国贸促会举办新闻发布会,发布会上,贸促会新闻发言人介绍,自大阪世博会中国馆...
新修订的治安管理处罚法自明年元... 据新华社消息,6月27日,十四届全国人大常委会第十六次会议表决通过新修订的治安管理处罚法,自2026...
欧盟呼吁立即实现加沙停火,将继... 欧盟成员国领导人26日在布鲁塞尔举行的欧盟峰会上呼吁立即实现加沙地带停火,并表示将继续就以色列是否遵...
曾凭一颗手榴弹活捉三个日本兵,... 原标题:抗战老兵孟昭身凭一颗手榴弹活捉三个日本兵——“要有勇气,跟敌人干到底”(时空对话)在辽宁省军...
“苏超”火爆出圈!国家发改委:... 1最近“苏超”火爆出圈,在发展体育、文旅产业以及开展“苏超”等地方性活动带动消费方面,国家发展改革委...
时隔三个多月 世卫组织首批医疗... 世界卫生组织26日表示,该组织25日向加沙地带运送了自3月2日以来的第一批医疗援助物资。世卫组织总干...
河北霸州市住建局通报“工人徒手... 针对媒体报道的“工人徒手掰断钢筋”的视频,6月26日,河北省霸州市住房和城乡建设局公开通报称,经调查...
马克龙:法国不会接受不对等的欧... 当地时间6月27日,法国总统马克龙表示,法国不能接受一项与自身利益不对等的关税协议。他强调,法国“必...
泰州靖江多名村民举报为建船厂遭... 1近日,泰州靖江市新桥镇三太村多名村民向记者反映,2024年4月起,当地政府征收土地用于江苏扬子泓远...
菏泽市城市管理局原党组成员,市... 据菏泽市纪委监委消息:菏泽市城市管理局原党组成员,市城市管理事业发展中心原主任武领吉涉嫌严重违纪违法...
神舟二十号航天员乘组圆满完成第... 神舟二十号航天员乘组圆满完成第二次出舱活动。(总台央视记者 黄显文 王刚)
山东小伙杨瀚森发文感谢,首轮1... 北京时间6月26日,NBA选秀大会,中国球员杨瀚森在首轮第16顺位被开拓者选中。这位身高2米18的中...
伊朗宪法监护委员会批准暂停伊朗... 伊朗伊斯兰共和国广播电视台26日报道,伊朗宪法监护委员会已批准了暂停伊朗与国际原子能机构合作的法案。
依法保障对辩护人的选择权,“两... 今天,最高人民法院、最高人民检察院联合发布《关于依法保障在押犯罪嫌疑人、被告人选择辩护人权利有关问题...
泰国警方在普吉岛发现多个可疑爆... 据央视新闻消息,泰国警方26日在普吉芭东海滩销毁了一枚疑似爆炸装置。该可疑物体是在普吉岛一家酒店附近...
商务部介绍对欧盟稀土出口审批情... 6月26日下午,商务部召开例行新闻发布会,有记者就对欧盟稀土出口审批情况提问。商务部新闻发言人何亚东...
全国首艘氢电拖轮在青岛港入列 ... 6月26日,全国首艘氢电拖轮“氢电拖1”轮在山东港口青岛港正式入列。该拖轮搭载“氢燃料电池+液冷锂电...