OpenAI推出GPT-4o mini,号称“最具成本效益的小模型”
创始人
2024-07-19 12:39:59
0

美东时间7月18日,OpenAI推出GPT-4o mini,并声称这是"最具成本效益的小型模型"。GPT-4o mini预计将通过让智能变得更加实惠,显著扩大使用AI构建的应用程序范围。

据OpenAI发布的消息,GPT-4o mini在MMLU(大规模多任务语言理解,衡量模型广泛的世界知识和解决问题的能力)上的得分为82%,比另外两款低成本竞品更高--Google的Gemini Flash得分为77.9%,Anthropic的Claude Haiku得分为73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面优于GPT-4.

GPT-4o mini已经在几个关键基准上进行了评估,涉及文本和视觉的推理任务、数学推理和编码任务、多模态推理,结果均优于其他小型模型。


各种评估基准下的模型评估分数OpenAI官方网站

GPT-4o mini还在API中支持文本和视觉功能,未来还将支持文本、图像、视频和音频的输入和输出,并且拥有截至2023年10月的知识。得益于与GPT-4o共享的改进的tokenizer(编译器),GPT-4o mini处理非英语文本方面也更具成本效益。

GPT-4o mini成本更低、延迟更低,能够完成更多的任务,例如调用多个API(应用程序编程接口)、传递和记录大量完整的代码库或对话记录、更快速、实时地与使用者聊天等。

作为模型开发过程的一部分,OpenAI 已经与一些值得信赖的合作伙伴合作,以更好地了解GPT-4o mini的使用场景和局限性。目前已与Ramp和超人等公司进行了合作,反馈发现在执行从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件响应等任务时,GPT-4o mini的表现明显优于GPT-3.5 Turbo。

考虑到价格因素,轻量化且廉价的"小而精"AI模型可能更受企业欢迎,小模型的相关开发竞争激烈。谈及为何没有更早地推出"小而精"的模型时,OpenAI的API产品负责人Olivier Godement说,"我们的使命是使用最前沿技术,构建最强大、最有用的应用程序,我们当然希望继续做前沿模型,推动技术进步……但我们也希望拥有最好的小模型,我认为它会非常受欢迎。"

OpenAI称,开发过程中的每一步都考虑了安全性。开发时会过滤掉仇恨言论、色情信息、个人隐私信息等不宜模型学习和输出的内容,并采用自动和人工(超过70位来自社会心理学和错误信息等领域的外部专家)对模型进行了评估,以识别潜在风险。GPT-4o mini是第一个应用指令层次结构的模型,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力,这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。

自2022年推出功能较弱的模型text-davinci-003以来,GPT-4o mini的每token成本已下降99%。GPT-4o mini定价比之前的Frontier型号便宜一个数量级,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免费版、Plus版和团队版用户已经能够使用GPT-4o mini替代GPT-3.5,企业用户也将从下周开始使用。

相关内容

热门资讯

第二轮伊美谈判结束 总台记者17日获悉,伊美第二轮谈判于几分钟前结束。
230.6亿次!2026年总台... 中央广播电视总台《2026年春节联欢晚会》在“欢乐吉祥,喜气洋洋”的主基调中圆满播出,为全球华人和海...
俄美乌三方在瑞士日内瓦开始谈判 俄美乌三方17日在瑞士日内瓦开始谈判。
美伊第二轮间接谈判在瑞士日内瓦... 据沙特方面消息,美国和伊朗第二轮间接谈判17日在瑞士日内瓦开始举行。
中央财政统筹安排12.5亿元支... 为积极应对冬小麦晚播、苗情偏弱的生产形势,近日,财政部会同农业农村部统筹安排中央财政资金12.5亿元...
暖意升级!正月初一至初三山东天... 今天6时,山东省气象局发布最新天气预报,正月初一至初三山东天气以晴为主,最高气温可达18℃。具体天气...
中欧班列“中通道”今年通行量突... 大年初一凌晨,一列满载货物的中欧班列从内蒙古二连浩特铁路口岸启程,缓缓驶出国门,这是该口岸农历马年发...
特朗普称他将间接参与美国和伊朗... 当地时间2月16日晚,美国总统特朗普表示,他会“间接”参与2月17日在日内瓦举行的美国与伊朗新一轮间...
驻日本使馆发言人就日方所谓交涉... 问:日本外务省发表新闻稿称,针对中方在慕尼黑安全会议上就日本安保政策作出的“不恰当发言”,日方已向中...
《武BOT》如何惊艳全场?王兴... 2月16日晚,总台马年春晚舞台上,一群练武的机器人燃爆全场。由宇树科技机器人与河南塔沟武术学校的小朋...
美国空军向中东增派18架F-3... F-35A“闪电II”战斗机(资料图)当地时间2月16日,央视记者获悉,美军驻扎在英国皇家空军莱肯希...
2026春节档票房破7亿 据网络平台数据,2026年春节档电影票房已突破7亿元。
今晚见!中央广播电视总台《20... 2月16日晚8点,中央广播电视总台《2026年春节联欢晚会》将在央视综合频道、综艺频道、中文国际频道...
伊朗革命卫队海军在霍尔木兹海峡... 当地时间16日,伊朗伊斯兰革命卫队海军在霍尔木兹海峡举行军事演习。本次演习名为“智能管控霍尔木兹海峡...
澳大利亚邦迪海滩恐怖袭击枪手被... △资料图总台记者获悉,当地时间16日,澳大利亚悉尼邦迪海滩恐怖袭击案的枪手纳维德·阿克拉姆在被捕后首...
应急管理部派出工作组赶赴江苏东... 2月15日晚,应急管理部紧急召开应急、消防系统调度会,通报江苏连云港东海县烟花零售店发生爆炸的情况,...
美官员称超千名移民执法人员已撤... 明尼苏达州央视记者当地时间2月15日获悉,美国政府边境事务主管汤姆·霍曼表示,超过1000名移民执法...
美国防部称在印度洋拦截一艘油轮 △美国防部公布的画面美国国防部当地时间15日在社交媒体上发文称,美军在印度洋拦截一艘油轮并登船检查。
中国警察参加第七届阿联酋世界特... 2月7日至11日,第七届阿联酋世界特警挑战赛在迪拜举行,来自48个国家的109支(含10支女子队)军...
2月15日全社会跨区域人员流动... 记者从交通运输部获悉,预计2026年2月15日(春运第14天,农历腊月二十八),全社会跨区域人员流动...