OpenAI 发布GPT-4——全网抢先体验
创始人
2025-05-28 07:33:31
0

OpenAI 发布GPT-4

最近 OpenAI 犹如开挂一般,上周才刚刚推出GPT-3.5-Turbo API,今天凌晨再次祭出GPT-4这个目前最先进的多模态预训练大模型。与上一代GPT3.5相比,GPT-4最大的飞跃是增加了识图能力,并且回答准确性也得到显著提高。GPT-4在多个专业和学术基准测试中展现出令人印象深刻的表现,有时甚至达到了人类水平。GPT-4 的关键特性之一是它能够理解和分析视觉和文本信息。通过结合这些模式,该模型能够对各种任务生成更准确、更细致的回答,例如图像说明或问题回答。此外,GPT-4 能够从大量数据中学习,并适应不同的上下文,使其成为自然语言处理、计算机视觉和机器学习等许多领域中非常有价值的工具。

文章目录

  • OpenAI 发布GPT-4
    • GPT-4的能力
    • 对GPT-3.5错误的修正
      • 链式推理
      • 逻辑谬误
      • 数学能力
    • 如何访问GPT-4
    • 总结

GPT-4的能力

img

虽然GPT-4是在其前身GPT-3.5的基础上升级而来,但是一些微妙的差异使得GPT-4可能颠覆整个游戏规则。

第一眼看上去,在一些随意交谈中很难看出GPT-3.5和GPT-4之间的区别。然而,当你让模型完成一些复杂的任务时,区别就显现出来了。GPT-4比GPT-3.5更可靠、更具创造力,并且能够处理更细微的指令。GPT-4最令人印象深刻的功能之一是它能够理解上下文并生成与当前情况更相关的响应。例如,如果你问它一个关于特定主题的问题,它能够考虑到对话的背景,并提供一个更准确和合情的答案。GPT-4的另一个显著改进是它的创造力。它可以对提示产生更具想象力和独创性的响应,使其成为作家、艺术家和任何想要挖掘其创造性一面工作者的绝佳工具。

img

我们具体看看 GPT-3 和 GPT-4 之间令人兴奋的区别,下图是 GPT-3 和 GPT-4 在各种基准测试中的表现对比:

img

从测试数据上看,GPT-4 比 GPT-3 整体好40%,在超过一半的测试中 GPT-4 比 GPT-3 有飞跃性进步。

再给大家看一个我个人认为很神奇的案例:给出食材,让GPT-4食谱。

img

上面案例展示了GPT-4良好的图像理解能力。

对GPT-3.5错误的修正

之前ChatGPT在很多问题上表现并不理想,为此我专门针对ChatGPT过去表现不佳的问题以及我关注的使用场景对GPT-4做了专门测试。

链式推理

GPT-3.5在一些非常复杂的问题,需要多条推理链的问题上,经常会要求提供更多信息。而GPT-4明显改进链式推理能力,在多推理链问题上表现良好。

GPT-3.5

在这里插入图片描述

GPT-4

在这里插入图片描述

逻辑谬误

GPT-3.5经常会在一些简单问题上犯逻辑错误,出现这种问题一般是由于问题中夹杂着一些无用的干扰项,比如:”蓝盒子里有一个苹果,蓝盒子里还有一个红盒子,红盒子有个盖子,请问我要如何取出苹果?“。其中”红色盒子有个盖子“就是无用干扰信息,GPT-3.5会给出完全荒谬的回答:

在这里插入图片描述

而GPT-4可以给出相对合理的答案,且很清楚地说明并避开了问题中的陷阱。

在这里插入图片描述

数学能力

GPT-3.5的数学能力广受诟病,甚至在一些简单的小学数学题上频频出错。比如:”我今年6岁,妹妹年龄是我的一半。那么当我90岁时,妹妹多少岁?“

在这里插入图片描述

GPT-3.5煞有介事的一步一步推理计算,最后给出45岁的错误答案。而GPT-4则修正了这方面的缺陷:

在这里插入图片描述

如何访问GPT-4

目前,ChatGPT Plus 会员可以通过 chat.openai.com 访问 GPT-4,但有使用上限。

在这里插入图片描述

在进入ChatGPT界面后,用户可以选择使用的模型。有3个模型可以选择

在这里插入图片描述

OpenAI很贴心的用直观可视化的方式对比了三个模型。

在这里插入图片描述

从官方给出的功能性能对比指引可以看出,GPT-4在推理能力和简明扼要方面明显由于GPT-3.5。

GPT-4的API与GPT-3.5的接口一致,不过目前需要申请开放。我已经第一时间加入了waitlist,等审批通过后再位大家带来GPT-4的接口使用体验报告。

在这里插入图片描述

总结

总的来说,GPT-4在推理能力上比GPT-3.5进步巨大,很多之前的问题都得到了修正和改良。我还没有测试GPT-4的多模能力,后面我会继续进行更多的测试,并即时更新文章分享给大家。

相关内容

热门资讯

安卓系统包的预装软件,体验升级 你有没有发现,每次拿到新手机,打开安卓系统,总有一堆软件在那里等着你?这些软件就像小跟班一样,不管你...
安卓系统平板和win系统哪个好 你有没有想过,当你手捧一款平板,准备畅游知识的海洋时,是选择安卓系统还是Windows系统呢?这就像...
安卓系统如何下载立借,安卓系统... 你有没有想过,有时候资金周转不过来,急需一笔小钱?别急,今天就来教你怎么用安卓系统下载立借,轻松解决...
光遇ios系统如何加安卓系统,... 你有没有想过,你的光遇账号在iOS系统上玩得风生水起,但突然有一天,你想要在安卓系统上体验一番呢?别...
凤凰系统就是安卓吗,揭开其与安... 你有没有听说过凤凰系统?是不是觉得它和安卓有点像,但又不太一样?今天,我就来给你好好捋一捋,让你对凤...
电视系统安卓和云os,技术革新... 亲爱的读者们,你是否曾想过,家里的电视系统竟然也能如此智能?今天,就让我带你一起探索一下电视系统中的...
安卓系统基带工作原理,工作原理... 你有没有想过,你的安卓手机里那个默默无闻的基带,是怎么帮你打通世界的呢?它就像手机里的隐形英雄,每天...
锤子os安卓系统官网,创新与个... 你有没有听说过锤子OS安卓系统呢?这款系统可是近年来在手机圈里掀起了一股小热潮哦!今天,就让我带你一...
安卓值得玩的系统,盘点那些值得... 你知道吗?在手机世界里,安卓系统就像是个万能的魔法师,总能变出各种让人眼前一亮的玩法。今天,就让我带...
安卓系统如何app升级系统软件 你有没有发现,你的安卓手机最近是不是有点儿“慢吞吞”的?别急,这可能是你的手机在默默告诉你,是时候给...
电视盒子安卓系统设置,畅享智能... 亲爱的电视盒子用户们,你是否在享受高清影视的同时,也对安卓系统的设置感到一丝困惑呢?别担心,今天我就...
苹果13系统没有安卓好 你有没有发现,最近身边的朋友都在讨论苹果13的系统,说它没有安卓系统那么好。这可真是让人好奇,为什么...
vivo是安卓系统还是鸿蒙系统 你有没有想过,手机里的操作系统就像是我们的大脑,指挥着整个设备的运转呢?今天,咱们就来聊聊这个话题,...
王者安卓换苹果系统数据,数据迁... 你有没有想过,从王者安卓换到苹果系统,那数据迁移的过程,简直就像是一场穿越时空的冒险呢?想象你的英雄...
oppo安卓系统如何升级系统空... 亲爱的OPPO手机用户们,你是不是也遇到了这样的烦恼:想要升级安卓系统,却发现系统空间不足?别急,今...
安卓系统进不去无命令,安卓系统... 手机屏幕上突然黑屏了,安卓系统怎么就进不去了呢?别急,别慌,今天就来给你详细解析一下这个问题,让你轻...
适合安卓系统k歌软件,打造个人... 你有没有想过,在手机上也能尽情地唱出你的心声呢?现在,就让我带你走进一个神奇的世界,那就是适合安卓系...
安卓系统怎么充电的视频 手机电量告急,又到了充电的时刻啦!你是不是也和我一样,对安卓系统的充电方式充满了好奇?今天,就让我带...
ios系统与安卓系统的内存对比... 你有没有发现,手机里的世界越来越精彩了?各种应用层出不穷,游戏、社交、办公,样样都离不开手机。而支撑...
安卓7.1系统打开usb方法,... 你有没有想过,有时候你的安卓手机就像一个神秘的宝盒,里面藏着许多你意想不到的小秘密?今天,我就要给你...