OpenAI推出GPT-4o mini,号称“最具成本效益的小模型”
创始人
2024-07-19 12:39:59
0

美东时间7月18日,OpenAI推出GPT-4o mini,并声称这是"最具成本效益的小型模型"。GPT-4o mini预计将通过让智能变得更加实惠,显著扩大使用AI构建的应用程序范围。

据OpenAI发布的消息,GPT-4o mini在MMLU(大规模多任务语言理解,衡量模型广泛的世界知识和解决问题的能力)上的得分为82%,比另外两款低成本竞品更高--Google的Gemini Flash得分为77.9%,Anthropic的Claude Haiku得分为73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面优于GPT-4.

GPT-4o mini已经在几个关键基准上进行了评估,涉及文本和视觉的推理任务、数学推理和编码任务、多模态推理,结果均优于其他小型模型。


各种评估基准下的模型评估分数OpenAI官方网站

GPT-4o mini还在API中支持文本和视觉功能,未来还将支持文本、图像、视频和音频的输入和输出,并且拥有截至2023年10月的知识。得益于与GPT-4o共享的改进的tokenizer(编译器),GPT-4o mini处理非英语文本方面也更具成本效益。

GPT-4o mini成本更低、延迟更低,能够完成更多的任务,例如调用多个API(应用程序编程接口)、传递和记录大量完整的代码库或对话记录、更快速、实时地与使用者聊天等。

作为模型开发过程的一部分,OpenAI 已经与一些值得信赖的合作伙伴合作,以更好地了解GPT-4o mini的使用场景和局限性。目前已与Ramp和超人等公司进行了合作,反馈发现在执行从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件响应等任务时,GPT-4o mini的表现明显优于GPT-3.5 Turbo。

考虑到价格因素,轻量化且廉价的"小而精"AI模型可能更受企业欢迎,小模型的相关开发竞争激烈。谈及为何没有更早地推出"小而精"的模型时,OpenAI的API产品负责人Olivier Godement说,"我们的使命是使用最前沿技术,构建最强大、最有用的应用程序,我们当然希望继续做前沿模型,推动技术进步……但我们也希望拥有最好的小模型,我认为它会非常受欢迎。"

OpenAI称,开发过程中的每一步都考虑了安全性。开发时会过滤掉仇恨言论、色情信息、个人隐私信息等不宜模型学习和输出的内容,并采用自动和人工(超过70位来自社会心理学和错误信息等领域的外部专家)对模型进行了评估,以识别潜在风险。GPT-4o mini是第一个应用指令层次结构的模型,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力,这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。

自2022年推出功能较弱的模型text-davinci-003以来,GPT-4o mini的每token成本已下降99%。GPT-4o mini定价比之前的Frontier型号便宜一个数量级,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免费版、Plus版和团队版用户已经能够使用GPT-4o mini替代GPT-3.5,企业用户也将从下周开始使用。

相关内容

热门资讯

明起雨雪天气进入鼎盛时段 出行... 今天(1月18日),寒潮将继续影响我国,雨雪向南铺展;明天起,此轮雨雪天气进入鼎盛,河南、山东等多地...
特朗普称将对欧洲8国加征关税 ... 当地时间17日,美国总统特朗普在其社交平台“真实社交”上表示,自2026年2月1日起,丹麦、挪威、瑞...
现金收付新规下月施行 对你我有... 近期,中国人民银行、国家发展改革委、金融监管总局三部门联合制定《人民币现金收付及服务规定》,将于2月...
铁路“静音车厢”列车数量增加 ... 出门坐高铁,有人想安静地看看书、休息一会儿,也有人希望能专心处理工作。但车厢里的交谈声、电子设备的外...
丹麦官员:格陵兰岛不会出售 当地时间1月17日,丹麦税务大臣阿妮·哈尔斯博-约恩森在哥本哈根市政厅广场发表讲话,明确表示支持格陵...
两部门:商业用房(含“商住两用... 为贯彻落实党中央、国务院决策部署,适应我国房地产市场供求关系的新变化,支持构建房地产发展新模式,现就...
严惩政商勾连腐败!年度反腐大片... 反对腐败、建设廉洁政治,是我们党一贯坚持的鲜明政治立场,是党自我革命必须长期抓好的重大政治任务。进入...
严惩政商勾连腐败!年度反腐大片... 反对腐败、建设廉洁政治,是我们党一贯坚持的鲜明政治立场,是党自我革命必须长期抓好的重大政治任务。进入...
严惩政商勾连腐败!年度反腐大片... 反对腐败、建设廉洁政治,是我们党一贯坚持的鲜明政治立场,是党自我革命必须长期抓好的重大政治任务。进入...
谷神星二号民营商业运载火箭首次... 1月17日12时08分,谷神星二号民营商业运载火箭在酒泉卫星发射中心点火升空,火箭飞行异常,首次飞行...
伊朗全境已恢复互联网服务 △伊朗首都德黑兰(资料图)总台记者当地时间1月17日获悉,伊朗全境已恢复互联网服务。
我国年用电量首超10万亿千瓦时 国家能源局17日宣布,2025年我国全社会用电量历史性突破10万亿千瓦时,达到10.4万亿千瓦时,同...
出行提醒!降雪来临,济南地铁运... 根据济南市气象台预警1月17日夜间至19日济南将出现降雪天气受降雪天气影响轨道交通运行将有变化为确保...
丹麦两架F-35战机在格陵兰岛... 当地时间1月16日,丹麦国防部宣布,两架丹麦F-35战斗机和一架法国多用途加油机在格陵兰岛东南部完成...
美国公布加沙“和平委员会”成员... △白宫(资料图)美国白宫16日公布美方主导的巴勒斯坦加沙地带“和平委员会”成员名单,由美国总统特朗普...
邹加怡出任亚洲基础设施投资银行... 今日,邹加怡正式就任亚洲基础设施投资银行(亚投行)行长兼董事会主席,带领机构迈入第二个十年发展新阶段...
济南市气象台发布暴雪蓝色预警、... 济南市气象台于2026年1月16日16时15分发布暴雪蓝色预警和道路结冰黄色预警:受冷空气和暖湿气流...
关乎骨关节健康!市场监管总局发... 记者今天了解到,市场监管总局发布《允许保健食品声称的保健功能目录 有助于维持骨关节健康(缓解疼痛或僵...
保加利亚宣布提前举行议会选举 在三次组阁均告失败后,保加利亚16日宣布将提前举行议会选举,选举日期尚未确定。
今年首场寒潮即将上线 降温日历... 今年“三九”期间,我国多地温暖如春,但冷暖大反转即将在“四九”上演。今天(1月16日)起,受一股冷空...