生成式人工智能最近变得非常流行。还记得 2022 年 11 月 ChatGPT 的发布吗?很快,它就成为有史以来最快获得 1 亿客户的产品。
如果您在这里,那么您肯定是 ChatGPT、Bard 或 Microsoft Co-Pilot 的用户,对吧?🙂
人工智能已经存在了一段时间,可以做各种各样的事情。但 ChatGPT 之所以如此特别并受到关注,是因为它能够像人类一样聊天,并根据简单的提示创建内容。
这为企业创造了大量的可能性,并引起了所有人的关注。人们开始问:这种“新”人工智能或生成式人工智能是什么?它是如何工作的?
在深入讨论生成式 AI之前,我们先来谈谈人工智能(AI)。AI 就是教机器做人类做的事情。例如,想象一个可以对苹果和香蕉进行分类的机器人。你告诉它什么是苹果,什么是香蕉,它就能很好地完成工作。
你如何告诉机器?好吧,你要编写明确的指令,告诉机器什么是苹果,什么是香蕉。
现在,想象一下这样的场景。机器人一直干得很酷,直到它遇到了一个绿色的苹果。机器人只被编程处理红苹果,现在它不知道如何处理绿苹果了。
这就是机器学习(ML)的用武之地。
ML 指的是机器从数据中学习的能力。在水果分拣机器人的案例中,机器人会看到许多苹果和香蕉的图片。机器会学习图片中的图案和形状,从而推断出苹果和香蕉的样子。
当机器人遇到青苹果时,尽管它没有看到任何青苹果的图片,它仍然根据所了解的苹果的其他属性知道这是一个苹果。
所以,你明白机器学习有多酷、多有用了吧?等你了解了生成式人工智能有多酷之后,你就知道了。
生成式人工智能更进了一步。它不只是识别模式,还根据所知道的内容创建新的东西。想象一下,我们的苹果和香蕉分拣机器人创造出一种全新的水果,将两者混合在一起!
深度学习是生成式人工智能背后的秘密武器。它就像一个超级聪明的大脑,可以理解大量数据并从中找出规律。你给它的数据越多,它就越聪明。
深度学习模型的灵感来源于人类大脑(因此也称为人工神经网络),它包括一个输入层,后面跟着多个隐藏层,最后是输出层。这些隐藏层内可以执行复杂的计算。
这导致了 GPT-3 和 BERT 等基础模型的诞生。这些模型就像超级灵活的工具,可以执行许多不同的任务,因为它们已经过大量数据的训练。
但是 ChatGPT 如何像人类一样聊天呢?这就是大型语言模型(LLM) 的作用所在。LLM 是一种基础模型,经过大量文本数据的训练,可以预测句子中接下来的单词,这使得它们能够像人类一样写作和说话。
您可能想知道这些数据有多庞大。这些数据非常庞大,涵盖多个领域和各种来源。例如,OpenAI 开发的最受欢迎的模型之一 GPT-3 是在数百 GB 的文本上进行训练的。这包括来自书籍、网站和其他结构化和非结构化数据源的文本。
另一个例子是谷歌的 BERT 模型,该模型基于全部英文维基百科(25 亿个单词)以及来自各种网页的 8 亿个单词进行训练。
对于 ResNet 这样的图像识别模型,它们使用来自 ImageNet 等数据集的数百万张图像进行训练,该数据集拥有超过 1400 万张手工注释的图像,涵盖 20,000 个类别。
这些示例突出了基础模型训练的数据规模,使它们能够学习复杂的模式并将其知识应用于广泛的任务和场景。
想象一下苹果和香蕉分拣机器人。除了给机器人输入苹果和香蕉的图片,你还要给它输入大量数据,从蔬菜到电子产品,从天文学到历史。
现在,机器人不仅能够对水果进行分类,还能识别各种物体和主题。这是 Foundation 模型的核心概念:它们在来自多个领域的大量数据上进行训练,并能将其知识应用于无数任务和场景。
看到这里,你可能会想:LLM 真的这么智能吗?
LLM 并不像我们人类一样具备任何认知能力。但是,得益于庞大的训练数据,它们擅长预测下一个单词。因此,它们会预测句子中的下一个单词,加上该单词后,它会再次进行计算并预测下一个单词,依此类推。这就是它能够撰写文章、像人类一样与我们交谈以及总结文本的原因。
LLM 的这种酷炫能力不仅来自于大量的训练数据,还源于其Transformers架构。
你还记得《变形金刚》这部电影吗?如果你还没看过,别担心。它与这一切无关 🙂
Transformer 架构可帮助计算机理解和生成人类语言。它们非常擅长理解语言的上下文,例如单词的含义如何根据其周围的单词而变化。它们通过更加重视所查看文本中最相关的部分来做到这一点。因此,它们在帮助机器以我们人类可以理解的方式理解和生成文本方面非常重要。
正是这些法学硕士(和其他类似技术)推动了生成性人工智能的发展。
顾名思义,生成式人工智能具有生成新内容的能力。这确实是一项突破性的创新,我们才刚刚开始看到它如何在各个企业中得到应用。
正如开头提到的,人工智能并不是新鲜事物。它已经以各种形式投入使用多年。例如,当你在观看 Netflix 时,它会向你推荐电影。这就是人工智能。当你在亚马逊购物时看到推荐,这又是人工智能。
那么问题是:什么是生成式人工智能?为了理解生成式人工智能,让我们看一个场景:
传统人工智能的工作原理如下:你有一个模型,当它向你展示图片时,它能够区分猫和狗。你展示一张猫的图片,它就会将其归类为猫。
现在,您有一个可以生成内容的生成式 AI 模型。您给出一个提示,比如一张猫的图片,然后让它画出来。该模型会生成一张猫的图片。生成的图片可能与该模型曾经训练过的猫完全不同。所以,基本上,该模型会根据您提供的提示和它已经对猫的学习来生成猫。
总之,生成式人工智能代表了人工智能的巨大飞跃。这项突破性的技术不仅可以识别模式,还可以从中创建新的内容,它有可能彻底改变无数行业,从艺术和音乐到产品设计等等。随着我们继续探索生成式人工智能的可能性,技术的未来似乎比以往任何时候都更有希望。
但我们的探索并未就此结束。在接下来的几周里,我将深入研究生成式人工智能的世界,揭示其应用、挑战和对社会的影响。我邀请您加入我的旅程,分享您对生成式人工智能这一激动人心的前沿的想法、问题和观点。让我们一起释放这项变革性技术的全部潜力,塑造人工智能的未来。
RA/SD 衍生者AI训练营。发布者:chris,转载请注明出处:https://www.shxcj.com/archives/4416