OpenAI推出GPT-4o mini,号称“最具成本效益的小模型”
创始人
2024-07-19 12:39:59
0

美东时间7月18日,OpenAI推出GPT-4o mini,并声称这是"最具成本效益的小型模型"。GPT-4o mini预计将通过让智能变得更加实惠,显著扩大使用AI构建的应用程序范围。

据OpenAI发布的消息,GPT-4o mini在MMLU(大规模多任务语言理解,衡量模型广泛的世界知识和解决问题的能力)上的得分为82%,比另外两款低成本竞品更高--Google的Gemini Flash得分为77.9%,Anthropic的Claude Haiku得分为73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面优于GPT-4.

GPT-4o mini已经在几个关键基准上进行了评估,涉及文本和视觉的推理任务、数学推理和编码任务、多模态推理,结果均优于其他小型模型。


各种评估基准下的模型评估分数OpenAI官方网站

GPT-4o mini还在API中支持文本和视觉功能,未来还将支持文本、图像、视频和音频的输入和输出,并且拥有截至2023年10月的知识。得益于与GPT-4o共享的改进的tokenizer(编译器),GPT-4o mini处理非英语文本方面也更具成本效益。

GPT-4o mini成本更低、延迟更低,能够完成更多的任务,例如调用多个API(应用程序编程接口)、传递和记录大量完整的代码库或对话记录、更快速、实时地与使用者聊天等。

作为模型开发过程的一部分,OpenAI 已经与一些值得信赖的合作伙伴合作,以更好地了解GPT-4o mini的使用场景和局限性。目前已与Ramp和超人等公司进行了合作,反馈发现在执行从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件响应等任务时,GPT-4o mini的表现明显优于GPT-3.5 Turbo。

考虑到价格因素,轻量化且廉价的"小而精"AI模型可能更受企业欢迎,小模型的相关开发竞争激烈。谈及为何没有更早地推出"小而精"的模型时,OpenAI的API产品负责人Olivier Godement说,"我们的使命是使用最前沿技术,构建最强大、最有用的应用程序,我们当然希望继续做前沿模型,推动技术进步……但我们也希望拥有最好的小模型,我认为它会非常受欢迎。"

OpenAI称,开发过程中的每一步都考虑了安全性。开发时会过滤掉仇恨言论、色情信息、个人隐私信息等不宜模型学习和输出的内容,并采用自动和人工(超过70位来自社会心理学和错误信息等领域的外部专家)对模型进行了评估,以识别潜在风险。GPT-4o mini是第一个应用指令层次结构的模型,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力,这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。

自2022年推出功能较弱的模型text-davinci-003以来,GPT-4o mini的每token成本已下降99%。GPT-4o mini定价比之前的Frontier型号便宜一个数量级,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免费版、Plus版和团队版用户已经能够使用GPT-4o mini替代GPT-3.5,企业用户也将从下周开始使用。

相关内容

热门资讯

伊朗称美军打击伊朗6艘民用船 据伊朗方面9日消息,伊朗伦格港地方官员法瓦德·穆拉德扎德表示,8日晚美军战斗机在阿曼海塞卜港附近打击...
中方敦促国际社会合作应对移民问... 中国常驻联合国副代表孙磊8日在第二届国际移民审查论坛作一般性辩论发言时敦促国际社会加强团结合作,共同...
受贿数额特别巨大 江西省政协原... 记者今天(9日)从最高人民检察院获悉,江西省政协原党组成员、副主席胡幼桃涉嫌受贿一案,由国家监察委员...
涉疫邮轮荷兰公民回国后将居家隔... 荷兰政府8日宣布,“洪迪厄斯”号邮轮上的荷兰公民回国后将居家隔离6周。同时,政府决定将汉坦病毒家族中...
欧盟出台措施应对航空燃油供应紧... △欧洲航空公司飞机(资料图)当地时间8日,欧盟委员会发布指导意见称,为缓解欧洲航空燃油供应紧张状况,...
厄尔尼诺将带来史上最热夏天?中... 近日,部分自媒体利用国家气候中心发布的2026年主汛期(6月至8月)气候趋势预测的部分结论,指出20...
探访浏阳烟花厂爆炸事故现场:工... 5月4日16时40分许,湖南长沙浏阳市华盛烟花制造燃放有限公司生产车间发生爆炸事故,造成重大人员伤亡...
世卫组织:“洪迪厄斯”号邮轮疫... 世卫组织8日更新“洪迪厄斯”号邮轮疫情最新数据,截至5月8日,共报告8例病例,其中3例死亡病例。8例...
泽连斯基:乌方不会袭击红场阅兵 △泽连斯基(资料图)乌克兰总统网站8日深夜发布泽连斯基签署的总统令,表示乌方鉴于与美国方面8日会谈时...
天舟飞船为何不回收?坠海有讲究 天舟十号船箭组合体已于今天(8日)垂直转运至文昌航天发射场发射区,计划于近日择机发射。而天舟九号货运...
国务院成立湖南长沙浏阳烟花特别... 5月4日16时43分许,湖南省长沙市浏阳市华盛烟花制造燃放有限公司发生特别重大爆炸事故,截至5月8日...
一艘伊朗商船遭美国海军袭击,至... 总台记者8日获悉,伊朗地方官员表示,一艘伊朗商船当地时间7日晚在霍尔木兹海峡附近遭美国海军袭击并起火...
天舟“下班”为什么不回收而是坠... 天舟九号货运飞船昨天受控再入大气层,少量残骸落入预定安全海域。为何天舟飞船完成使命后不像神舟飞船那样...
乌官员称该国防空系统导弹短缺 ... △乌克兰空军发言人伊格纳特(资料图)当地时间5月8日,乌克兰空军发言人伊格纳特表示,受导弹供应不足影...
商务部:一季度 我国服务进出口... 2026年一季度,我国服务进出口总额18229亿元(人民币,下同),同比增长2.3%。其中,出口70...
欧盟气候监测机构:4月全球海洋... 欧盟气候监测机构哥白尼气候变化服务局8日发布的公报显示,2026年4月全球极地外海域的海洋表面温度达...
俄胜利日临时停火开始后 乌俄互... 当地时间5月8日,俄罗斯国防部发布通报称,出于人道主义考虑,为庆祝卫国战争胜利81周年,自5月8日零...
日本近期发生疑似熊袭击致死事件 据日本方面7日消息,日本近期接连发生熊袭人事件,并出现疑似熊袭击致人死亡事件。消息称,7日,在岩手县...
美官员称美国务院正在审查所有墨... △美国国务院(资料图)据美国方面7日消息,一名美国官员说,美国国务院正在对全部53个墨西哥驻美领事馆...
北方多地风力8至10级 空气湿... 近日,我国北方部分地区轮番出现大风天气过程,从东北地区南部至黄淮大风呼啸,局地风力达到8至10级。气...