小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
创始人
2024-07-07 11:08:20
0

(观察者网 讯)2024世界人工智能大会暨人工智能全球治理高级别会议7月4日-6日在上海举行。

7月5日下午,由中国信息通信研究院承办的WAIC 2024 "迈向AGI:大模型焕新与产业赋能"论坛在上海徐汇西岸拉开帷幕。小红书技术副总裁王晓博在论坛上发表主题演讲,分享了小红书在大模型领域的最新布局与探索。

目前小红书社区拥有超过三亿的月活用户,越来越多新一代年轻人因为共同的兴趣爱好在这里相聚,小红书上海量的UGC构成了一部丰富的生活指南。

在演讲中,王晓博从"搜"、"推"、"创"、"美"、"伴"等多个技术应用场景阐述了大模型将如何助力小红书这本"生活指南"更便捷、更鲜活、更美好。

王晓博指出:"我们希望通过多模大模型的能力增强,让AI能够越来越像人一样,能够理解小红书的内容,不仅仅可以看懂笔记,看懂图片和文字,能够进行内容的整理和问答,也能够辅助用户进行更便捷的内容创作,同时通过对内容和用户的深度理解,更好地建立内容和用户之间的关联和匹配效率。"

搜索一直是用户在小红书上高频使用的功能,70%的小红书活跃用户有主动搜索行为。小红书目前正在探索将大模型引入搜索的技术链路,未来能够给用户带来更便捷的搜索体验。

据王晓博介绍,在日常使用中,用户查询一些复杂问题时,往往需要多步搜索才能获得想要的答案。而有了大模型的加持之后,小红书将使用Search Agent来模拟用户的多次搜索过程,通过大模型代理用户的查询过程,直接交付答案给用户,大大提升了搜索效率。

在推荐上,大模型则可以帮助小红书更好地理解内容和用户兴趣。王晓博表示,传统推荐系统依赖行为数据对用户和内容进行建模,会导致新笔记分发难,缺乏推理能力导致信息茧房等问题。

在小红书的推荐系统中,率先将大模型作为笔记的语义编码器来使用,通过语义压缩提示词(prompt)结合对比学习技术,让大模型能够把笔记转化为推荐系统可理解的向量表征,在新笔记分发上取得了非常大的提升。同时,大语言模型(LLM)的推理能力能够更好地建模用户兴趣,小红书通过让大模型从历史行为中推理用户潜在的新兴趣,有效的缓解了信息茧房问题,提升了用户留存。

AI智能创作同样是小红书与大模型擦出火花的重要探索领域。今年小红书内部孵化的创新项目InstantID,通过人脸ID注入方式,成功在技术上兼顾了风格的保持和人脸ID的一致性,它不仅风格多样,同时无需模型训练,实现秒级出图,为用户提供了"发现不一样的自己"的创作方式。

目前,该项目已向业界开源,为商业应用如电子商务、广告和娱乐产业创造了新的可能性。

此外,王晓博还认为,大模型不仅可以为用户提供信息和创意,也可以提供很多情绪价值。为此,小红书在宠物世界、社区群聊、官号私信这几个主要场景下,分别搭建了AI宠物、AI群聊、AI助手这一类聊天BOT产品,为用户提供泛娱乐功能。

以AI宠物为例,每位用户都可以领养一个虚拟宠物,通过对话的方式与它交互,在线上互动中获得乐趣与情感陪伴。在群聊场景,AI 通过角色扮演的方式将自有性格生动的表达,AI助手也可以将生硬的官方活动信息幽默有趣的传递给用户。

"针对陪伴类聊天应用里记忆、人格情绪等技术难点,小红书采取了基于记忆网络、世界体系和驱动飞轮等技术相结合的解决方案。通过精细化记忆建模,对历史对话进行语义分析、重要性判断、节点因子建模,从而深入理解用户行为,构建个性化互动,实现越交互越聪明,越聪明越交互的良性循环。"王晓博说道。

在演讲中,王晓博也指出,应用场景的落地离不开基础能力的建设。

目前,小红书技术团队同时针对语言模型和多模态能力进行了综合研发,结合小红书自身的业务场景和需求,更早做了视觉理解大模型方向的技术攻关:在多模模型架构、多模态alignment和整个数据体系和视觉感知能力上,都做了一定的探索和优化;并基于多种类型的图文数据,通过端到端多模态训练和优化,训练了对业务场景跟友好的视觉理解大模型,兼顾了图像分辨率、OCR、长尾语义识别等能力。

目前小红书在引擎技术上逐步完备布局,在训练方面对于大模型的工程体系做了完备建设,包括预训练、SFT、RLHF都做了针对模型和硬件的改造加速,自研了推理框架,对量化压缩、投机采样等技术都做了进一步优化。"

其中,比较有亮点的前沿技术,一是在MoE框架下,做了5D并行的高效率训练,同时自研了RLHF框架,相较于开源框架性能和收敛稳定性都有提升。推理上我们做了W4A8模型压缩,结合算子优化整体性能超过开源框架20%左右。"王晓博介绍道。

最后,王晓博表示:"人工智能技术在多模态、Agent、算力层都有望持续进步,小红书也将借助大模型的能力,进一步拉近社区链接的距离,更好赋能小红书之城的用户们。"

小红书于2013年在上海创立,以"Inspire Lives"为使命,形成了内容社区、商业广告和电商交易三大业务板块。截至2023年底,小红书月活用户数量超过3亿,超50%用户为95后;同时,小红书社区拥有超过1亿分享者,他们在小红书上分享经验、记录生活。自成立以来,小红书一直以技术为驱动力,目前持有和申请中的专利、商标、版权超过4000项,自研的"珠玑"大模型也已通过算法备案。

相关内容

热门资讯

贵州榕江杨家湾村被洪水围困,无... 1科技的力量具象化!贵州榕江杨家湾村被洪水围困,无人机紧急出动,跨越激流,为受困群众投送救援物资。@...
祝愿早日恢复!洪水过后,贵州“... 1被誉为“村超”胜地的贵州榕江县日前遭遇洪灾。据贵州榕江县榕江县人民政府防汛抗旱指挥部消息,榕江县于...
中越司法行政部门首次边境会晤,... 记者在广西南宁举行的中越司法行政部门首次边境会晤上了解到,中越司法部就推动建立边境边民民商事纠纷多元...
全国首个“宠物”本科专业来了!... 近日,各地2025年高考成绩陆续公布,广大考生正紧锣密鼓地填报自己心仪的大学和专业志愿。在众多选择中...
中国稀土集团辟谣:部分董事、高... 声明针对近期有网民发布的中国稀土集团有限公司(以下简称“中国稀土集团”)旗下上市公司“中国稀土”(0...
当心不良姿势“偷走”孩子的脊柱... 在门诊工作中,我常看到因体态问题前来就诊的孩子,一些看似平常的姿势问题可能引发脊柱侧弯、近视加深、运...
强降雨天气过程已结束 榕江县终... 6月29日,据榕江发布消息,6月28日强降雨天气过程已结束,经调度,全县江河湖库汛情平稳。根据《榕江...
山东舰航母编队将访问香港 对外... 经中央军委批准,中国人民解放军海军山东舰航母编队将于7月3日至7日访问香港,期间编队舰艇面向香港市民...
商务部新闻发言人就美与有关国家... 有记者问:近日,美方官员称,正在加紧推进与有关经济体谈判,有望在7月9日“对等关税”90天暂停期结束...
乌议会称正在起草战时状态结束后... 鲁斯兰·斯特凡丘克(资料图)当地时间6月28日,乌克兰最高拉达(议会)主席鲁斯兰·斯特凡丘克表示,乌...
国家防减救灾委对贵州提升国家救... 针对贵州黔东南州等地近期严重洪涝灾害,国家防灾减灾救灾委员会28日紧急将国家救灾应急响应级别提升至三...
韩国前总统尹锡悦离开特检组,将... 尹锡悦(资料图)当地时间6月29日凌晨1时左右,韩国前总统尹锡悦离开特检组所在地,特检组针对尹锡悦发...
两部门:严厉打击食品中非法添加... 记者今天了解到,市场监管总局会同国家卫生健康委发布联合公告,将那非类、拉非类两类物质纳入食品中可能添...
加拿大政府以所谓“国家安全”为... 6月27日,加拿大政府以所谓“国家安全”为由,命令海康威视加拿大有限公司停止在加拿大运营并关闭其加拿...
城区多处被淹,航拍贵州榕江最新... 贵州榕江县日前遭遇洪水。今天(6月28日),榕江县再次发布暴雨红色预警,当地已启动防汛Ⅰ级应急响应,...
央视《焦点访谈》曝光后,张家界... 6月27日晚,央视《焦点访谈》曝光湖南张家界耗资24亿元建的大庸古城四年累计亏损超10亿元,濒临破产...
转发提醒!2024年度个税汇算... 距6月30日2024年度个人所得税综合所得汇算清缴结束还有3天时间,还没有办理的纳税人要抓紧了!具体...
国家发展改革委紧急追加安排1亿... 近期贵州省发生严重洪涝灾害,目前灾情仍在进一步发展。为贯彻落实习近平总书记关于做好防汛抗洪工作的重要...
贵州榕江县已撤离转移群众415... 截至28日18时,贵州省榕江县8000余名干部已紧急组织撤离转移群众共计11992户41574人,其...
全球首艘!首航成功 全球首艘纯氨燃料内燃机动力示范船舶“氨晖号”28日在安徽合肥巢湖水域首航成功。这标志着氨燃料在船舶领...