ChatGPT相关技术必读论文100篇(2.27日起,几乎每天更新)
创始人
2024-06-03 06:50:46
0

按上篇文章《ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT-N、instructGPT》的最后所述

为了写本ChatGPT笔记,过去两个月翻了大量中英文资料/paper(中间一度花了大量时间去深入RL),大部分时间读的更多是中文资料,2月最后几天读的更多是英文paper,正是2月底这最后几天对ChatGPT背后技术原理的研究才真正进入状态(后还组建了一个“ChatGPT之100篇论文阅读组”,我和10来位博士、业界大佬从23年2.27日起100天读完ChatGPT相关技术的100篇论文),当然 还在不断深入,由此而感慨: 

  1. 读的论文越多,你会发现大部分人对ChatGPT的技术解读都是不够准确或全面的,毕竟很多人没有那个工作需要或研究需要,去深入了解各种细节
  2. 因为100天100篇这个任务,让自己有史以来一篇一篇一行一行读100篇,​之前看的比较散 不系统 抠的也不细
    比如回顾“Attention is all you need”这篇后,对优化博客内的Transformer笔记便有了很多心得

总之,读的论文越多,博客内相关笔记的质量将飞速提升 自己的技术研究能力也能有巨大飞跃

且考虑到为避免上篇文章篇幅太长而影响完读率,故把这100论文的清单抽取出来独立成本文

  1. Attention Is All You Need,Transformer原始论文
  2. GPT:Improving Language Understanding by Generative Pre-Training
    GPT2:Language Models are Unsupervised Multitask Learners
  3. GPT3原始论文:Language Models are Few-Shot Learners
  4. ICL原始论文
  5. Evaluating Large Language Models Trained on Code,Codex原始论文
    预测当前序列的最后一个词时 可以选取概率最大的词(softmax最高的值),但没法全局最优且不具备多样性,当然 可以使用束搜索 一次性获取多个解
    论文中用的是核采样,预测的各个词根据概率从大到小排序,选取前些个概率加起来为95%的词
  6. CoT原始论文:Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
    28 Jan 2022 · Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter, Fei Xia, Ed Chi, Quoc Le, Denny Zhou
    也从侧面印证,instructGPT从22年1月份之前 就开始迭代了
  7. Training language models to follow instructions with human feedback
    InstructGPT原始论文

  8. RLHF原始论文
  9. PPO原始论文
  10. 《Finetuned Language Models Are Zero-Shot Learners》,2021年9月Google提出FLAN大模型,其基于Instruction Fine-Tuning
    FLAN is the instruction-tuned version of LaMDA-PT
  11. Scaling Instruction-Finetuned Language Models,Flan-T5(2022年10月)
    从三个方面改变指令微调,一是改变模型参数,提升到了540B,二是增加到了1836个微调任务,三是加上Chain of thought微调的数据
  12. LLaMA: Open and Efficient Foundation Language Models,2023年2月Meta发布了全新的650亿参数大语言模型LLaMA,开源,大部分任务的效果好于2020年的GPT-3
  13. Language Is Not All You Need: Aligning Perception with Language Models,微软23年3月1日发布的多模态大语言模型论文
  14. GLM: General Language Model Pretraining with Autoregressive Blank Infilling,国内唐杰团队的

  15. A Comprehensive Survey on Pretrained Foundation Models: A History from BERT to ChatGPT:https://arxiv.org/pdf/2302.09419,预训练基础模型的演变史
  16. LaMDA: Language Models for Dialog Applications,Google在21年5月对外宣布内部正在研发对话模型LaMDA
  17. Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
  18. Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing,作者来自CMU的刘鹏飞,这是相关资源
  19. Multimodal Chain-of-Thought Reasoning in Language Models
    23年2月,亚马逊的研究者则在这篇论文里提出了基于多模态思维链技术改进语言模型复杂推理能力的思想
  20. Offsite-Tuning: Transfer Learning without Full Model
    对于许多的私有基础模型,数据所有者必须与模型所有者分享他们的数据以微调模型,这是非常昂贵的,并引起了隐私问题(双向的,一个怕泄露模型,一个怕泄露数据)
  21. Emergent Abilities of Large Language Models
    Google 22年8月份发的,探讨大语言模型的涌现能力

  22. Large Language Models are Zero-Shot Reasoners
    来自东京大学和谷歌的工作,关于预训练大型语言模型的推理能力的探究,“Let's think step by step”的梗即来源于此篇论文
  23. PaLM: Scaling Language Modeling with Pathways,这是翻译之一
    22年4月发布,是Google的Pathways架构或openAI GPT2/3提出的小样本学习的进一步扩展
  24. PaLM-E: An Embodied Multimodal Language Model,Google于23年3月6日发布的关于多模态LLM
  25. Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models,微软于23年3月8日推出visual ChatGPT(另,3.9日微软德国CTO说,将提供多模态能力的GPT4即将一周后发布)
    At the same time, Visual Foundation Models, such as Visual Transformers or Stable Diffusion, although showing great visual understanding and generation capabilities, they are only experts on specific tasks with one round fixed inputs and outputs. 

    To this end, We build a system called {Visual ChatGPT}, incorporating different Visual Foundation Models, to enable the user to interact with ChatGPT by 
    1) sending and receiving not only languages but also images 
    2) providing complex visual questions or visual editing instructions that require the collaboration of multiple AI models with multi-steps. 
    3) providing feedback and asking for corrected results. 

    We design a series of prompts to inject the visual model information into ChatGPT, considering models of multiple inputs/outputs and models that require visual feedback
  26. 《The Natural Language Decathlon:Multitask Learning as Question Answering》,GPT-1、GPT-2论文的引用文献,Salesforce发表的一篇文章,写出了多任务单模型的根本思想
  27. Deep Residual Learning for Image Recognition,ResNet论文,短短9页,Google学术被引现15万多
    这是李沐针对ResNet的解读,另 这是李沐针对一些paper的解读列表
  28. The Flan Collection: Designing Data and Methods for Effective Instruction Tuning

  29. AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE
    Transformer杀入CV界
  30. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
    Swin Transformer V2: Scaling Up Capacity and Resolution
    第一篇的解读戳这,第二篇的解读戳这里
  31. Denoising Diffusion Probabilistic Models
    2020年提出Diffusion Models(所谓diffusion就是去噪点的意思)
  32. CLIP: Connecting Text and Images - OpenAI
    CLIP由OpenAI在2021年1月发布,超大规模模型预训练提取视觉特征,图片和文本之间的对比学习(简单粗暴理解就是发微博/朋友圈时,人喜欢发一段文字然后再配一张或几张图,CLIP便是学习这种对应关系)

    2021年10月,Accomplice发布的disco diffusion,便是第一个结合CLIP模型和diffusion模型的AI开源绘画工具,其内核便是采用的CLIP引导扩散模型(CLIP-Guided diffusion model)
  33. Hierarchical Text-Conditional Image Generation with CLIP Latents
    DALL.E 2论文2022年4月发布(至于第一代发布于2021年初),通过CLIP + Diffusion models,达到文本生成图像新高度
  34. High-Resolution Image Synthesis with Latent Diffusion Models

    2022年8月发布的Stable Diffusion基于Latent Diffusion Models,专门用于文图生成任务
    这些是相关解读:图解stable diffusion(翻译版之一)、这是另一解读,这里有篇AI绘画发展史的总结

    Stable Diffusion和之前的Diffusion扩散化模型相比, 重点是做了一件事, 那就是把模型的计算空间,从像素空间经过数学变换,在尽可能保留细节信息的情况下降维到一个称之为潜空间(Latent Space)的低维空间里,然后再进行繁重的模型训练和图像生成计算
  35. Aligning Text-to-Image Models using Human Feedback,这是解读之一
    ChatGPT的主要成功要归结于采用RLHF来精调LLM,近日谷歌AI团队将类似的思路用于文生图大模型:基于人类反馈(Human Feedback)来精调Stable Diffusion模型来提升生成效果
    目前的文生图模型虽然已经能够取得比较好的图像生成效果,但是很多时候往往难以生成与输入文本精确匹配的图像,特别是在组合图像生成方面。为此,谷歌最新的论文提出了基于人类反馈的三步精调方法来改善这个问题

  36. // 23年2.27日起,本榜单几乎每天更新中

相关内容

热门资讯

小米9安卓系统怎么升级 你有没有发现,小米9这款手机自从你入手以来,性能越来越棒,但总觉得少了点什么?没错,就是那股子最新的...
投影安卓系统授权费,投影背后的... 你有没有想过,为什么你的安卓手机可以运行那么多酷炫的应用?这其中可大有学问呢!今天,就让我带你一探究...
网络21系统和安卓区别,系统架... 你有没有想过,为什么有些人在网上做生意能如鱼得水,而有些人却觉得像是在迷宫里转圈圈?这其中的奥秘,可...
安卓系统水印相机软件,轻松实现... 你有没有发现,手机拍照已经成为我们生活中不可或缺的一部分?无论是记录生活的点滴,还是捕捉美丽的瞬间,...
安卓系统有软音源吗,软音源技术... 你有没有发现,在使用安卓手机的时候,有时候声音听起来有点怪怪的,像是被什么软绵绵的东西包裹了一样?没...
电脑切换系统和安卓,探索多平台... 你有没有想过,为什么你的电脑有时候会突然从Windows系统切换到安卓系统呢?这可不是什么小把戏,而...
原生安卓系统浏览器,原生安卓系... 你有没有发现,手机里的浏览器用起来有时候就像个“小懒虫”,总是慢吞吞的,让人等得心痒痒。今天,就让我...
安卓系统什么打开权限吗,打开权... 你有没有发现,你的安卓手机有时候会跳出来一些奇怪的提示,让你授权这个应用打开那个权限?别急,别慌,今...
安卓系统做游戏机,畅享无限娱乐... 你有没有想过,那个一直陪伴你手机生活的安卓系统,竟然也能摇身一变,成为一台游戏机呢?没错,你没听错,...
虚拟丧葬系统下载安卓版,体验未... 你知道吗?现在科技的发展真是让人惊叹不已,连丧葬这种方式都有了全新的面貌。没错,就是那个听起来有点神...
安卓系统解锁弹广告,揭秘安卓系... 你有没有遇到过这种情况?手机屏幕上突然弹出一个广告,让你瞬间从沉浸式的游戏体验中被打断,心情瞬间跌落...
安卓系统机备用机,智能生活助手... 你有没有想过,当你的安卓手机突然罢工,或者你急需一台备用机来处理一些紧急事务时,你会怎么办呢?别急,...
安卓系统末日生存手游,安卓系统... 你知道吗?在手机游戏的世界里,最近掀起了一股末日生存的热潮。这不,安卓系统上的一款新游戏——《安卓系...
安卓系统应用停用的好处,解锁系... 你知道吗?最近在安卓系统上,有很多应用都宣布停用了。这可不是一个简单的决定,背后可是有着不少好处呢!...
凤凰安卓系统固态硬盘,引领存储... 你知道吗?最近在手机圈里,一款名为“凤凰安卓系统固态硬盘”的新产品可是引起了不小的轰动呢!这款硬盘不...
安卓系统通讯删除,安卓系统通讯... 手机里的通讯录是不是有时候会让你头疼?那些不再联系的人,那些过时的信息,是不是总让你觉得手机里乱糟糟...
安卓系统怎么调成黑白色,轻松实... 你是不是也和我一样,对安卓系统的个性化设置充满了好奇?今天就来手把手教你,如何把安卓系统的界面调成黑...
安卓u盘系统盘,便携式移动办公... 你有没有想过,你的安卓手机或者平板,如果有一天突然变成了一个超级电脑,那会是怎样的场景呢?其实,这并...
安卓系统如何给软件授权,安卓系... 你有没有想过,你的安卓手机里那些可爱的应用是怎么被允许在你的设备上畅行无阻的呢?没错,这就是今天我们...
安卓app调用系统指纹,安全便... 你知道吗?现在智能手机的功能越来越强大,各种APP也是层出不穷。但是,你知道吗?有些APP竟然可以调...