生成式AI:原理、影响和应用

Finder / 2025-10-29


该系列是我学习Generative AI for Everyone 课程的笔记,也是系统学习AI课程的第一站。

概论 #

自从2022年11月OpenAI发布ChatGPT以来,**生成式AI (Gen AI)**已成为一股强大的颠覆性技术,正改变许多人的学习和工作方式。它被认为将赋能许多人,提高生产力,并可能为全球经济增长做出重大贡献。据麦肯锡估计,Gen AI每年可为经济增加2.6万亿至4.4万亿美元。然而,该技术也引发了对自动化导致失业的担忧。

生成式AI指的是能够生成高质量内容的AI系统,主要内容类型包括文本、图像和音频。尽管目前最大的影响体现在文本生成领域(如ChatGPT、Bard、Bing Chat),但它也能够生成精美或超逼真的图像,以及进行音频(声音克隆)甚至视频克隆。

Gen AI的出现,使得许多AI应用的构建比以往更容易、更便宜,促使AI产品和服务数量激增。除了面向消费者的应用外,它作为开发者工具的潜力在长期来看可能更具影响力。

根据您提供的新视频片段“W1 2 how generative ai work”的文字稿,以下是该视频内容的总结:

一、 生成式AI在AI格局中的定位 #

生成式AI(Generative AI)的能力,例如ChatGPT和Bard等系统生成文本的能力,看似具有魔力,代表了AI技术的一大进步。AI可以被视为一系列工具的集合。在当今最重要的AI工具中,包括监督学习(Supervised Learning, SL)生成式AI

二、 监督学习的工作机制 #

监督学习是一种技术,擅长于“贴标签”(labeling things),它在给定输入A时,能够生成相应的输出B。

监督学习的典型应用示例包括:

  • 垃圾邮件过滤: 输入A为一封电子邮件,输出B为判断它是否为垃圾邮件(0或1)。
  • 在线广告: 根据广告和用户信息(A),预测用户是否可能点击该广告(B)。
  • 自动驾驶: 接收汽车前方的图像和雷达信息(A),标记出其他车辆的位置(B)。
  • 医疗诊断: 输入医疗X光片(A),输出医疗诊断(B)。
  • 缺陷检测: 拍摄组装线上手机的图片(A),检查是否有划痕或其他缺陷(B)。
  • 语音识别: 输入音频(A),输出文本转录(B)。
  • 情绪分析: 阅读业务或产品的评论(A),标记其是积极还是消极的情绪(B),这对声誉监控很有用。

三、 大规模监督学习奠定基础 #

大约2010年至2020年是大规模监督学习发展的十年。研究人员发现,对于许多应用而言,即使输入更多数据,如果模型较小,性能提升也有限。然而,如果训练非常大的AI模型,即使用非常快、非常强大的计算机和大量内存,并且输入更多数据,那么性能就会持续提升。正是这种用于贴标签的超大型模型的理念,为现代生成式AI奠定了基础。

四、 大型语言模型(LLMs)如何生成文本 #

大型语言模型(LLMs)是生成式AI生成文本的技术。LLMs的工作原理是通过使用监督学习技术反复预测下一个词

  1. 训练数据: LLMs通过阅读互联网上数千亿甚至数万亿个词语来学习。
  2. 预测机制: 训练过程将句子转化为大量数据点(输入A和输出B)。例如,系统学习到“我最喜欢的食物是” (A) 之后的下一个词可能是“百吉饼” (B)。
  3. 文本生成: 当系统在海量数据上训练成一个非常大的AI系统时,就形成了像ChatGPT这样的LLM。给定一个被称为**“提示”(prompt)**的输入,LLM就擅长于生成额外的词语作为响应。
  4. 应用: 尽管LLMs的核心是预测下一个词,但它们已被许多人发现在日常工作中有用,能够帮助写作、查找基本信息或充当思维伙伴来思考问题。
#LLM #Generative AI for Everyone

最后一次修改于 2025-10-29