​All in AI云基建,阿里云“不想在迟疑中错过”
创始人
2024-09-23 18:43:55
0

"新技术应用早期,渗透率比较低,大部分人会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,让很多人在迟疑中错过。"

去年并未登台的阿里云智能集团董事长兼CEO的吴泳铭,在2024年云栖大会上,不仅分享了其这两年对AI行业的看法,也对外释放了阿里云要坚决投入AI云基建的决心。

吴泳铭表示,当前新增算力需求中,超过50%由AI驱动,而且规模持续扩大。"过去一年,阿里云投资新建大量AI算力,还是远远不能满足客户的旺盛需求。"阿里云会持续以前所未有的强度投入AI技术研发和基础设施建设。

在吴泳铭看来,现在仍处于AGI变革的早期:"生成式AI最大的想象力,绝不是在手机上做一两个新的超级App,而是接管数字世界、改变物理世界。"这意味着,几乎所有行业都需要性能更强、规模更大、更适应AI需求的基础设施。

围绕这些判断,阿里云宣布了一系列新动作,除继续全方位建设更有效率的AI大模型计算设施;还开源了性能逼近GPT-4o的大模型Qwen2.5,涵盖能用到多种场景的0.5B到72B参数规模的多个版本;以及再次大幅降价--Qwen系列主力模型降价85%,百万tokens价格低至0.3元。阿里云CTO 周靖人说,这些新动作会进一步刺激开发者和各行各业客户使用大模型的需求。

作为业内最早布局大模型和生成式AI技术的科技公司,阿里云在2023年4月发布首个大语言模型通义千问后,在2024年的云栖大会上,阿里云通义模型家族全新亮相,产业链不断完善,生态日益壮大,正成为行业新的风向标。

AI云时代需要硬件重构

相比传统的云计算,AI时代支撑大模型的云基建也发生了翻天覆地的变化,其中最明显的则是算力芯片从CPU时代转向GPU时代,这也会直接引发一系列的技术革新和挑战。

阿里云CTO周靖人就表示:底层硬件只是计算基础设施转变的一部分。AI 技术变革,触达计算体系的方方面面,是全栈、全系列的技术革命。

实际上,在AI大模型时代,要解决好GPU网络架构,系统存储调度,海量文件处理,都需要巨量的资金和资源投入,以亚马逊,微软云,谷歌和阿里云为代表的企业均进行了百亿级别的资金投入。

在云栖大会上,周靖人介绍了一批阿里云 AI 基础设施的升级:

磐久AI服务器可以支持单机16卡、显存1.5T,提供AI算法预测GPU故障,准确率到92%;

高性能网络架构HPN7.0可支持10万个GPU稳定互连,模型端到端训练性能提升10%以上;

CPFS文件存储的数据吞吐20TB/s,为 AI 智算提供指数级扩展存储能力;

人工智能平台PAI,可以实现万卡级别的训练推理一体化弹性调度,AI 算力有效利用率超90%。

对于AI云服务基础设施的价值,周靖人表示"云优化一点,大模型才能发展一点,模型发展到一定程度又遇到挑战,又需要云去升级。大家表面上看到的是一句 'AI 的基础设施',但中间有很多重要创新。正是这些重要创新,才让大模型的训练、大模型的创新变成了可能。"

实际上,包括零一万物,百川智能等大模型企业都表示,阿里云为其大模型提供了大量帮助。

升级+降价,规模效应才是AI云的答案

搞好基建只是做到云服务提供商的起点,云服务作为一个规模效应极其明显的行业,如何获得大量客户基本决定了一家云服务商的生死,而在大模型时代,所有厂商似乎又回到了同一起跑线。

值得注意的是,阿里云早就意识到了这个信号,在去年的云栖大会上宣布了要做AI时代最开放的一朵云的战略,在2024年杭州云栖大会上,阿里云依然强调开放与生态。

阶跃星辰创始人姜大昕、月之暗面Kimi创始人杨植麟、生数科技首席科学家朱军的圆桌对谈被安排在大会上午的第二场演讲,仅次于在阿里巴巴集团CEO吴泳铭的演讲之后。而阿里云自身的通义大模型的发布则被安排在下午举行。

在云栖大会的展馆,月之暗面Kimi、百川智能、零一万物、智谱AI等大模型企业也位于主场馆的显著位置。

KIMI展台位于云栖大会主场馆核心位置

除了给与了合作伙伴们C位的待遇,阿里云在本次云栖大会也发布了一系列产品吸引更多的用户使用大模型基建。

周靖人昨天发布阿里最新的旗舰模型 Qwen-Max,称在多个数据集上的评测结果超过或接近 GPT-4o。同时,他们升级针对不同场景开发的大模型,比如数学领域的 Qwen-Math、编程领域的 Qwen-Coder、具备视觉理解能力的 Qwen-VL,以及生成图片的通义万相 Wanx,还新增视频生成功能。

阿里云是中国大模型开源力度最大的大型科技公司,开源战略仍在持续。据周靖人介绍,当前阿里云开源的 Qwen 系列大模型,下载量突破 4000 万,衍生出超过 5 万款大模型,成为仅次于美国 Llama 的模型群。

云栖大会上,阿里云开源最新的大模型 Qwen 2.5 系列,囊括 0.5B 到 72B 的不同参数版本。在周靖人看来,参数 3B 及以下的模型和能够理解视觉的 Qwen-VL,将能够扩大大模型的应用范围,前者能让大模型在终端硬件中运行,后者可以让硬件具备理解物理世界的能力。

在这些大模型的基础上,阿里云用两种方式把它们产品化,降低客户使用门槛:

一方面开发百炼平台,向企业客户和开发者提供大模型服务。百炼平台中内置提示词优化、检索增强生成(RAG)、模型微调等一系列工具,让那些对开发大模型应用有兴趣、有需求的客户,只在阿里云就能调用多种模型开发和部署产品。

"(客户)不需要关注模型背后的 GPU 资源,不需要去关注如何去拉几个模型。只需要一个简简单单的 API,就可以随心所欲调用模型。" 周靖人说。

阿里云还开发了各种面向个人消费者的大模型应用,比如辅助编程的通义灵码,辅助语音转写总结、阅读长文档、生成 PPT 等功能的多种 AI 助手。

阿里云扩大需求的另一个举措是持续降价。今年 5 月以来,中国的大模型公司开启一轮价格战。当时阿里云把对标 GPT-4 的 Qwen-Long API 输入价格降到 0.5 元 / 百万 Tokens。现在阿里云再次降价,幅度达到 85%,同时给新用户赠送 5000 万免费 tokens 和 4500 张图片生成用量。

"相对未来庞大的应用来说,今天的价格还是还太贵了。大量开发者无法有效、大规模使用。" 周靖人说,只有降低价格,才能推动 AI 应用爆发。

过去两年,阿里云还在持续搭建开源模型社区魔搭,目前已经上架上万款各类开源模型供开发者下载,开发者数量超过 690 万。

周靖人说,当前一共有 30 万企业客户接入了通义大模型。其中不仅有对大模型更热情、大众容易感知到的移动互联网客户,如微博、携程、喜马拉雅等;还有饮料公司三得利(中国),以及中国一汽、联想、OPPO 等制造业公司。也有一些公司与阿里云合作建设智算中心,训练大型 AI 模型,如阿里云透露,阿里云与小鹏在乌兰察布合作建设的数据中心,2022 年以来,规模已扩大了 4 倍。

普通人也能玩转AI

值得注意的是,在AI时代,阿里云也在努力降低大模型门槛,让每个人都可以玩转AI,编程能力不再成为阻碍人们使用AI的门槛。

在本次云栖大会上,通义大模型家族重要成员--模型应用,则扩展到通义灵码、实时记录、阅读助手、PPT创作、翻译助手、语音通话等不同的应用,服务更多企业和用户。

作为阿里云大模型的一大应用,通义灵码于 2023年首次亮相。它是智能编码辅助工具,可生成和续写代码、生成单元测试、优化代码与注释、进行研发问答及排查异常报错,提升开发效率与代码质量。

目前市场上的AI辅助编码工具不少,如GitHub Copilot、Code GeeX、Bito、Amazon Code Whisperer等,可生成代码、添加注释、创建测试用例等,提升开发效率。

而阿里云的通义灵码进入Gartner首个AI代码助手魔力象限,成为唯一进入挑战者象限的中国科技公司。

在2024杭州云栖大会上,阿里云通义灵码完成升级,从以前只能完成基础的辅助编程任务,进化到用自然语音就能完成需求理解、任务拆解、代码编写、修改BUG、测试等开发任务,最快几分钟可从0到1完成应用开发,提升数十倍开发效率。

全新升级的通义灵码模拟了人类程序员的能力,可完成更复杂、更全面的任务;可以脱离专业IDE软件,在Web端直接执行缺陷修改、需求分析、代码实现、问题排查等任务工作流,兼具架构师、开发工程师、测试工程师等多种岗位技能,大幅缩短了应用的开发周期。

在应用上,通义灵码已入驻中华财险、哈啰集团、长安汽车等公司,累计生成代码超10亿行,广泛应用于金融、制造、互联网、交通、汽车、能源等行业,是国内最受欢迎的辅助编程工具。

阿里云表示,未来只要有创意,不懂代码也能开发应用和软件。

云栖大会展馆和产品演示中,AI辅助编码的示例屡见不鲜。一位13岁的中学生在通义灵码上输入几句话,2分钟就生成了一个python~A语言编写的倒计时网页。

还有参会者,用通义灵码修改开源魂斗罗游戏代码,在9个代码文件2000多行代码里,几分钟就精准修改了游戏角色的生命值、跳跃高度等参数。

云栖大会自2009年以来已连续举办15届,始终站在云计算发展的前沿,见证中国云计算发展三次浪潮的每个重要时刻。

在第一届云栖大会举办时,国内对于云计算尚未形成共识--不乏有互联网、科技公司高管抛出 "云计算是新瓶装旧酒""还需要很长时间才能普及" 或者 "私有的算力中心才是重点" 的论断。而正是阿里云持续不断的早期大额投资,最后才抓住了移动互联网时代的机遇,一举占据了中国云市场的头把交椅。

十五年后的云栖大会上,吴泳铭在展望AI时代的前景时表示:"从历史经验来看,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们的个人经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但它会在你的怀疑中成长,在你在迟疑中错过大趋势。站在AI时代浪潮的开端,我感到无比兴奋。"

如果如其判断,等到生成式 AI 应用爆发,作为基础设施供应商的云计算公司显然会从中获得更多收入。ALL in AI的阿里云未来会如何,值得我们拭目以待。

相关内容

热门资讯

中国选手获射击世界杯10米气手... 9日,2025年国际射击射击世界杯(宁波站)进入首个决赛日。中国选手姚千寻/胡凯凭借出色发挥,顺利进...
中国银行原党委委员、副行长林景... 中国银行原党委委员、副行长林景臻涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。
法国品牌迪奥发生数据泄露事件 ... 今年5月,多家媒体报道法国时尚消费品牌迪奥发生数据泄露事件,中国大陆地区用户也陆续收到迪奥官方警示短...
退役军人事务部:已为28位在韩... 今天,退役军人事务部召开新闻发布会,介绍第十二批在韩志愿军烈士遗骸回国相关情况。相关负责人在会上表示...
“黑狼”被公安部选定为中国警犬... 近日,公安部警犬工作领导小组设计发布了中国警犬LOGO统一标识,该标识主要由警犬、盾牌、松枝等元素组...
韩国总统李在明回应韩企员工在美... 韩国总统李在明9月9日表示,对于在美国发生的韩国公民被拘留事件深感责任重大,为了韩美关系发展,希望不...
南通报告一例霍乱确诊病例,可疑... 江苏南通市通州区疾病预防控制中心9月9日上午通报:9月4日18时,南通市第三人民医院报告我区发生一例...
朝鲜导弹总局进行碳纤维固体燃料... 朝鲜导弹总局发言人公布,朝鲜导弹总局与化学材料研究院当地时间9月8日再次进行了利用碳纤维增强塑料的大...
航行警告!南海部分海域进行军事... 据中国海事局网站消息,清澜海事局发布航行警告,9月9日9时至12时,南海部分海域进行军事训练,禁止驶...
工信部:我国建成全球最大、覆盖... 9月9日,国务院举行“高质量完成‘十四五’规划”系列主题新闻发布会,介绍“十四五”时期大力推进新型工...
滨州市人大常委会原党组成员、副... 中央纪委国家监委网站讯 据山东省纪委监委消息:经山东省委批准,山东省纪委监委对滨州市人大常委会原党组...
第十二批在韩中国人民志愿军烈士... 今天,退役军人事务部召开新闻发布会,介绍第十二批在韩志愿军烈士遗骸回国相关情况。相关负责人在会上表示...
特朗普翻案失败 仍须赔偿833... 当地时间8日,美国上诉法院宣布维持卡罗尔诉特朗普诽谤案判决,特朗普仍需支付8330万美元赔偿款。20...
首次组织!中俄蒙举行“边防合作... 9月8日至9日,中俄蒙以“联合防范打击边境地区恐怖破坏活动”为课题,在中俄蒙边境某区域组织“边防合作...
内塔尼亚胡称即将攻入加沙城,警... 以色列总理内塔尼亚胡8日说,以军地面部队正在集结,即将攻入加沙地带北部的加沙城。他警告当地居民马上离...
法政府信任投票翻车,马克龙急物... 法国总理贝鲁领导的政府8日在他自己发起的国民议会(议会下院)信任投票中遭遇惨败,总统马克龙将于9日接...
日本自民党有意于10月4日举行... 日本媒体8日援引消息人士的话报道,日本首相、执政党自由民主党总裁石破茂7日宣布辞职后,自民党有意于1...
张艺谋团队跨界执导张艺兴演唱会... 由张艺谋导演团队“操刀”,携手张艺兴联袂打造的“美猴王闹天宫”演唱会将于10月上旬在国家体育场(鸟巢...
法国总理贝鲁未通过议会信任投票... 新华社巴黎9月8日消息,法国总理贝鲁领导的政府8日在国民议会(议会下院)举行的信任投票中未能过关,贝...
小米公告:王腾因泄露公司机密信... 9月8日,王腾发布微博回应被小米辞退:很惭愧跟大家说声抱歉,过去犯了一些错误,接受该有的代价。感谢雷...