生成式人工智能在商业领域的崭新时代
随着 OpenAI 的ChatGPT、Anthropic 的Claude和 Google 的Bard的推出,大规模文本分析和自然语言处理 (NLP) 的长期梦想瞬间成为现实。AI 不仅令人信服地通过了图灵测试,还催化了企业战略的范式转变。突然之间,AI 不仅仅是一个话题——它瞬间成为每家有远见的公司路线图不可或缺的一部分。原因何在?
在生成式人工智能出现之前,讨论的大多数用例都涉及数字(请参阅我的博客“生成式人工智能的商业应用”)。现在,有了类似人类的文本和易于使用的界面,可以用简单的语言聊天并获得真实的响应,人工智能现在可供全球所有人使用——无论他们的技能水平如何。生成式人工智能技术当然可以复现他们所学到的东西,但当你要求它创造一些独特的东西时会发生什么?在大多数情况下,它们都很挣扎。
OpenAI 的ChatGPT、Meta 的AudioCraft和Midjourney等技术能够以几乎人类般的流畅度创作文字、代码、旋律和视觉杰作。但必须记住,从本质上讲,它们的熟练程度和创新性取决于它们所输入的数据。如果您的竞争对手只是使用与您相同的公开模型,那么这如何成为竞争优势的基础?
对于精明的商业领袖来说,信息非常明确:组织的数据不仅仅是一种商品——它是你最强大的武器。我的整个职业生涯都在数据和分析领域度过,利用非结构化数据的潜力的梦想一直困扰着企业,但似乎总是有点遥不可及。事实上,去年夏天我和一位行业分析师朋友开玩笑说:“也许今年我们将破解文本分析的难题。”我当时并不知道 2022 年 11 月会发生什么。
然而,创造人工智能驱动的商业成功的旅程并不意味着采用通用模型,而是要调整和修改人工智能,以理解和运作组织独特的环境(由数据驱动)。
将公司的独特背景应用于生成式人工智能
对于任何企业来说,将所有拼图拼凑在一起可能有点令人生畏。然而,情况很清楚,要创造竞争优势,您需要创建一个了解组织独特需求、互动和运营方式的系统。从根本上讲,有几种不同的方法可以应用此上下文,概述如下。
为大語言模型 (LLM) 添加背景信息
让我们从您的大型语言模型(LLM)开始;您可以从头开始构建、进行微调或购买一个软件包。
- 从头开始构建:这肯定是一项艰巨的任务。构建自己的 AI 解决方案提供了无限的定制,但代价高昂。不仅是金钱方面,还有所需的时间、专业知识和资源。麦肯锡的一篇文章表明,初始构建的成本可能在 500 万至 2 亿美元之间,而定期费用为 100 万至 500 万美元。只有最大的组织才能负担得起这种方法。
- 微调现有模型:您可以调整或调整现有的生成式 AI 模型,而不是从零开始。这种方法在定制和成本之间实现了平衡,允许您使用已经预先训练过的基础来根据您的情况定制 AI。麦肯锡估计,这将花费 200 万至 1000 万美元,每年的经常性维护预算为 50 万至 100 万美元。
- 购买预包装解决方案:对于喜欢现成解决方案的公司,有现成的 AI 产品可供选择。这些产品可能缺乏相同程度的个性化,但它们提供更快的部署和更低的初始成本。这些产品通常用于简化业务运营但不会成为您的竞争优势的情况。麦肯锡计算出,这在 0.5 万美元到 200 万美元之间,每年需支付 0.5 万美元的经常性费用。
现在,我们如何增强您的模型?
通过 RAG 添加上下文
对于许多公司来说,安全和隐私是其运营的基础。将您的专有数据发送给可以使用您的数据为他人训练模型的服务提供商,这简直是不合情理的。事实上,我喜欢Hippocratic AI 的口头禅“不伤害”。医疗保健、保险、银行、制造、法律等许多领域对数据的使用方式、传输位置和存储方式都有严格的规定。因此,如果您的组织不打算使用您的数据来微调模型,请考虑检索增强生成 (RAG)。本质上,RAG 方法将您的组织数据连接到 LLM,而无需实际将您的数据提供给 LLM。RAG 允许您与 LLM 聊天的响应包含您的专有数据。换句话说,它提供了上下文!
- 利用矢量数据库的检索增强生成 (RAG):这种方法将大型语言模型的功能与数据库的特殊性和事实核查能力相结合,提供了一种细致入微的方法来确保准确和与公司相关的输出。
因此,既然我们已经通过构建您自己的数据、微调或采用 RAG 方法将您组织的数据连接到 LLM,现在是时候确保我们提出好的问题了。
通过提示工程添加背景信息
这就是快捷工程发挥作用的地方。
- 提示工程:提示工程本质上是一种结构化的方式,向您的 LLM 提出问题,以便它理解您希望它做什么。请记住,LLM 并不“知道”任何事情;它只是知道哪些单词在统计上和频率上彼此相邻出现。
提示有几种不同的类型,包括:
- 零次提示:这是你向 LLM 提出没有任何特定背景的问题。例如,你可以写这样的提示:
“为什么天空是蓝色的?”
- 少量提示:针对他的用例;你为模型提供示例,以便它提供与你提供的示例类似的输出。因此,你可以询问以下内容(ChatGPT 的输出):
例如:根据给出的提示写一副押韵的对句。
提示 1:月亮 对句 1:寂静的夜晚,最明亮的恩赐是银色的月亮,柔和地闪耀着光芒。
提示 2:雨 对句 2:天上落下的雨滴,清澈而朴实, 滋润大地的是温柔的雨水。
你的任务:提示:蓝天对联:?
回复:
提示:蓝天对句:在鸟儿和飞机翱翔的上空,延伸着广阔的蓝天。
- 分隔符的使用:使用分隔符时,您会放入特殊标记和短语来为模型提供结构。例如,您可以编写如下提示:
“我是 [[UVM 医疗中心,一家教学医院]] 的产品营销经理。我希望您阅读我们收到的以下用户评论,并向我总结一下。[[粘贴以下评论]]”
即时工程当然既是一门艺术,也是一门科学。但幸运的是,我们开始看到应用程序中内置了预建模板,这样普通用户(比如我自己)就可以在 Web 浏览器的框中输入内容,然后系统就会适当地构造对 LLM 的查询。
例如,如果你想建立一个案例研究怎么办?嗯,这些都是非常结构化的,所以有一些生成式人工智能软件解决方案有针对特定用例定制的模板。
对于案例研究模板,它包括以下字段:
- 公司名称:[在此处添加公司名称]
- 客户名称:[在此处添加客户名称]
- 挑战:[在此描述挑战]
- 解决方案:[在此处添加解决方案]
- 结果:[在此处添加结果]
因此,如果我只需在网络浏览器的文本框中输入这些回复,就会得到一个相当不错的案例研究。另一个例子是新闻稿,软件要求:
- 什么类型的新闻稿?[在此处添加类型,例如产品公告、事件、季度业绩]
- 应该提及哪些人或实体?[在此处添加人或实体]
- 新闻稿内容是什么?[在此处添加新闻稿]
- 附加背景信息 — 您希望添加哪些引言?[在此处添加引言和归属]
- 关于:[在此添加公司描述]
瞧!我们已经有了出色的新闻稿初稿!
以上是您使用提示工程逐个部分构建案例研究和新闻稿的示例。您看不到这一点,因为它在后台为您构建并单独运行每个提示。
摘要:生成式人工智能始于您的数据
如果您的组织要利用生成式 AI,您需要提供贵公司独特的背景。要提供正确的背景,您可以通过 LLM、RAG、提示工程或三种不同方法的混合来实现。请记住,背景是特定于用例的,因此请开始收集用例和数据示例列表,以便您可以开始测试生成式 AI 领域。
大多数企业都明白,将生成式人工智能融入业务并非一帆风顺。这将是一项挑战,但只要您能适应公司独特的环境,回报将是巨大的。
RA/SD 衍生者AI训练营。发布者:稻草人,转载请注明出处:https://www.shxcj.com/archives/4347