根据图片识人、识物,钉钉AI升级多模态能力
创始人
2024-05-19 11:27:24
0

多模态、长文本与RPA(机器人流程自动化)技术,在AI应用的落地上又有新进展。

3月28日,钉钉AI助理迎来重要升级,正式上线图片理解、文档速读和工作流等产品能力。此次升级后,钉钉AI助理将拥有更强的视觉推理能力和长文本速读能力。在AI助理对话框,用户发送长文件、在线文档、网页链接、视频内容,即可进行多轮交互和智能问答。

资料显示,基于通义千问Qwen-VL-Max视觉理解模型,钉钉AI助理能够准确描述和识别图片信息,并进行信息推理、扩展创作、文字提取和翻译等;在收到用户发来的视频后,AI助理会根据视频内容生成字幕,提取关键词,并生成一份智能摘要,对于最高2GB的视频内容,仅需3分钟即可完成智能解读。

唤醒这些功能也并不复杂:用户在钉钉IM消息框或点击魔法棒按钮即可进入AI助理对话框。

从初步测试来看,钉钉新版AI助理,已经具备较为成熟的图片识别和智能对话能力。

如下图(左)所示,根据我们提供的照片,钉钉AI助理几乎瞬间认出了小猫的品种,并对该品种猫咪的特征和照片背景进行了简单描述;在没有任何文字提醒,以及照片内没有文字提示的情况下,钉钉AI助理准确识别了拍摄于上海迪士尼的城堡照片(如下图右)。

钉钉实测图片(下同)

多模态能力的加入,让AI助理更具实用性,例如翻译信息、提取文字等。

我们随手拍摄并上传了一张耳塞外包装(纯英文说明)图片。在识别产品品牌、功能等常规信息之外,钉钉AI助理在外包装明显破损的情况下,对英文说明进行了简单分析和翻译,并提取了关键词。令人感到意外的是,在密集的英文印刷中,AI识别出了模糊的NRR信息(降噪等级),并提示用户对此进行关注。

对于表情包和网络梗图,钉钉AI助理也展示出一定的识别和推理能力。

综合来看,基于通义千问Qwen-VL-Max视觉理解模型,钉钉AI助理能做的事情明显变多了。

公开资料显示,Qwen-VL-Max整体性能堪比GPT-4V和Gemini Ultra。在MMMU、MathVista等测评中超过业界所有开源模型,在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上超越GPT-4V,位于世界第一梯队水平。

不过,AI助理也不是全能的。从实测来看,未来它仍有大量提升空间。例如对影视剧中穿戴墨镜的人物,以及身着古装服饰的人物,钉钉AI有时无法精准识别。此外,对于"一个月才几百块,你玩什么命啊"这样较为晦涩的网梗,AI的理解能力也有待继续完善。

 

更新后,AI助理强化了文档速读和视频速读能力:用户上传相关的文件和视频,即可得到一份内容总结。

值得一提的是,根据不同需要,AI助理能生成各细分领域的助手,用户还能通过链接等形式和他人分享。例如"我的歌曲助手":用户只需输入音乐和唱法风格等"诉求",在约5分钟左右的时间里,AI就会自动生成歌曲,并发送至指定邮箱--初步来看,这些歌曲和音乐其实都有不错的完成度。

据公开资料,此次更新后,钉钉对"工作流"玩法也进行了升级。用户可以通过工作流,对AI执行任务的流程进行拆解和编排,主动接管完成相应操作,并打通外部系统数据和API能力,例如搭建能自动写脚本并生成视频的创作AI助理等。为降低用户的使用门槛,钉钉官方还将提供多种工作流模板。

相关内容

热门资讯

美国扣押一艘与委内瑞拉有关的油... 当地时间15日,据两名美国官员透露,在美国总统特朗普与委内瑞拉反对派代表马查多会晤前夕,美国扣押了一...
缅甸发生5.1级地震 震源深度... 中国地震台网正式测定:1月15日20时12分在缅甸(北纬20.94度,东经96.11度)发生5.1级...
今年第1号台风“洛鞍” 在菲律... 今年第1号台风“洛鞍”(热带风暴级;英文名称:Nokaen;名字来源:老挝;名称意义:一种鸟;燕子)...
日本最大在野党立宪民主党决定和... 当地时间1月15日,日本最大在野党立宪民主党决定和公明党组成新的政党。
人社部等五部门:招聘信息不得再... 近日,人力资源和社会保障部等五部门联合印发《关于规范网络平台招聘类信息发布的通知》(以下简称《通知》...
高市要求撤回“对日两用物项出口... 商务部1月15日举行例行新闻发布会,针对近日日本首相高市早苗表示,中方加强两用物项出口管制措施仅针对...
全国森林覆盖率达25.09% ... 记者今天从国家林草局举办的全国林业和草原工作会议上获悉,2025年,我国完成国土绿化任务1.27亿亩...
联合国秘书长:“77国集团和中... △联合国秘书长古特雷斯(资料图)联合国秘书长古特雷斯14日在“77国集团和中国”主席国交接仪式上发表...
中东部多地将现冷暖大逆转 明起... 今天(1月15日),全国大部依然维持晴朗干燥模式,明天起中东部雨雪呈现增多趋势。与此同时,一波大回暖...
美国将暂停办理对75个国家的所... 央视记者获悉,当地时间14日,美国国务院将暂停办理75个国家的所有签证,“以打击那些可能成为公共负担...
51:50!美国参议院否决限制... 当地时间1月14日下午,北京时间今天(1月15日)早上,美国国会参议院以51票对50票,否决了一项试...
贺娇龙抢救无效不幸离世 2026年1月14日23时12分,新疆维吾尔自治区农产品品牌建设与产销服务中心主任贺娇龙同志因伤抢救...
欧洲多国敦促其公民离开伊朗 伊朗(资料图)波兰外交部当地时间1月14日晚发表声明,敦促波兰公民立即离开伊朗,并建议不要前往伊朗。...
世界气象组织:2025年是有记... 当地时间14日,世界气象组织确认2025年是有记录以来最热的三年之一,延续了全球异常高温的趋势。世界...
现场直击丨在建铁路事故已致超3... 1月14日上午,泰国呵叻府一台起重机在高铁项目施工过程中坠落,砸中一列正在行驶中的火车,导致车厢起火...
三部门:卖房后1年内重新买房 ... 日前,财政部、税务总局、住房城乡建设部联合发布《关于延续实施支持居民换购住房有关个人所得税政策的公告...
中国海警舰艇编队1月14日在我... 1月14日,中国海警1306舰艇编队在我钓鱼岛领海内巡航。这是中国海警依法开展的维权巡航活动。
格陵兰岛各政党领导人:格陵兰人... 原标题:美国欲夺取格陵兰岛暴露霸权思维,格陵兰岛各政党领导人发表声明——“格陵兰人不想成为美国人”(...
全国大部维持晴朗干燥模式 东北... 今明两天(1月14日至15日),全国大部继续维持雨雪稀少的格局,后天起降水将呈现增多趋势。目前,冷空...
美国放宽对英伟达H200芯片出... 当地时间1月13日,据美国联邦公报显示,美国放宽了对英伟达H200芯片出口到中国的监管规定。此前,美...