关于 AGI 或超级人工智能 (ASI) 以及各组织正在酝酿什么，一直存在着大量的炒作、恐慌和猜测。这不是我的主要兴趣，而是如何利用 LLM 和自主 AI 代理的力量在组织中实现特定领域的应用。

对话式用户界面的最大商业驱动力是银行、零售、金融服务等领域的公司，它们创建基于人工智能的用户界面，供用户与产品和服务进行交互。

任何能够感知其环境并执行动作的实体都可以被视为代理。

介绍

这是我非常喜欢研究的一个主题，我很期待写这篇文章。主要是因为我想揭开代理的概念以及代理的确切构成。

考虑到特定领域的实现，这一类别需要考虑可用的构建工具、成本、延迟以及实际和商业影响。我尝试在本文中涵盖所有这些内容。

我们目前在哪里？

考虑到窄域实现，我们目前处于第二级和第三级；很可能处于2.5 级。

LangChain 在创建代理开发框架方面处于领先地位。DSPy 在编程 LLM 方面领先，而 LLamaIndex 则采用代理 RAG 方法。

这些代理占熟练成年人的 50% 到 90%，具有战略任务自动化能力。根据用户输入，代理可以分解用户描述、规划子任务并以有序方式执行这些任务以得出结论。

这些代理能够迭代中间子任务，直到得出确切答案。

实例

考虑以下问题？

Who is regarded as the father of the iPhone and what is the square root of his year of birth?

这是一个相当模糊和复杂的问题，需要遵循几个步骤才能找到答案。有一个数学任务和结局，但也需要检索知识来回答问题。

对于这个实际的例子，代理可以采取一些行动：

法学硕士数学，
SerpApi，下面是SerpApi网站的截图。SerpApi使从搜索引擎结果中提取数据变得可操作。
GPT-4（gpt-4–0314）。

下面，考虑这个基于 LangChain 的代理的输出，并注意代理如何按顺序从思考到行动再到观察，直到得到最终答案并且链条完成。

下面是代理事件序列的图形描述。

在显示五个级别代理的表格中，您会注意到第一级代理是基于规则的……基于规则的代理可以具有一定的自主权，但在实践中，它们由基于预定义步骤执行的预定义步骤组成。

下图展示了一种基于规则的代理构建方法，其中包含生成式 AI 节点。在本文后面，我将深入探讨为什么基于规则的自动化和可衡量的自主性是企业实施的明智方法。与完全自主的代理方法相反。

窄域代理的基本结构

代理的核心是大型语言模型 (LLM)。代理还可以使用多种工具。工具可以具有特定功能，例如网络搜索、特定 API、RAG、数学等。

工具以自然语言描述，以便代理知道在流程的特定阶段使用哪种工具。工具的数量和工具的功能决定了代理的强大程度。

实际考虑

再次考虑代理的窄域实现，需要牢记一些实际注意事项。

感官

目前大多数代理都是虚拟的，可通过语音或文本输入进行访问。这些代理可以推理并得出结论，然后依次以语音或文本做出响应。可以添加多模式元素，代理可以接收图像或视频作为输入，或生成图像或视频作为输出。

然而，代理通常不具备其他感官能力，如视觉、触觉、运动等。随着机器人技术的不断发展，将代理与感官/物理能力相结合将开创一个新时代。

LLM主干

正如我之前提到的，代理的主干是 LLM，或者更具体地说是调用的 LLM API。代理会经历多次迭代和 API 调用。有一个需要满足的依赖关系，因此我认为任何生产代理实现冗余都必须内置到代理主干中。

自托管 LLM 或本地推理服务器是确保正常运行时间的最佳方式。

成本

使用商业 LLM API 的成本将非常高，因为对于向代理提出的每个问题，LLM 都会被查询多次。

想象一下，成千上万的用户只会加剧成本问题。

延迟

对话系统要求亚秒级响应，任何复杂系统（例如代理）都需要在每个对话回合中内部执行多个步骤，这会增加用户所经历的总延迟。

这可能成为一个需要克服的挑战。

未得出结论

值得注意的是，目前存在代理未得出结论或过早得出结论的情况。如果用户可以访问并查看代理的推理步骤，则代理推理的中间步骤可能会满足用户的查询。用户可以停止代理并告知它已提供足够的信息。

工具和成本

代理需要能够使用工具才能执行任务。可以有一个完整的市场，可以共享创建工具。制造商无需从头创建工具，而是选择现有工具。

这些工具可以是免费的，也可以是收费的；工具可以访问收费的 API。

代理术语

随着人工智能的发展，“代理”一词被用来描述表现出智能行为并具有以下能力的实体：

自治，
反应性，
积极主动，
社交互动。

20 世纪 50 年代，艾伦·图灵提出了标志性的图灵测试，这是人工智能的一个关键概念，旨在研究机器是否能够表现出与人类类似的智能行为。这些人工智能实体通常被称为代理，是人工智能系统的基础组件。

迁移学习

迁移学习涉及利用从一项任务获得的知识并将其应用于另一项任务。

基础模型通常遵循这种方法，其中模型最初在相关任务上进行训练，然后针对感兴趣的特定下游任务进行微调。

迁移学习是一个强大的概念，它增加了模型的多功能性，可以根据过去的学习来执行以前从未见过的任务。

结论

不知为何，我觉得它目前被忽视了，但自主人工智能代理（Autonomous AI Agents）代表着技术的一项关键进步。

配备人工智能的代理能够：

独立运作，
做决定＆
无需不断的人工干预即可采取行动。

未来，自主人工智能代理将彻底改变医疗保健、金融、制造业和运输业等各个行业。

然而，决策过程中需要考虑问责制、透明度、道德、责任和偏见。

尽管存在这些挑战，但自主人工智能代理的未来前景广阔。随着技术的不断发展，这些代理将越来越多地融入我们的日常生活。

Paragoger衍生者AI训练营。发布者：稻草人，转载请注明出处：https://www.shxcj.com/archives/2832

AI Agent 的五个级别

介绍

我们目前在哪里？

实例

窄域代理的基本结构

实际考虑

感官

LLM主干

成本

延迟

未得出结论

工具和成本

代理术语

迁移学习

结论

关于作者

稻草人

发表回复

AI Agent 的五个级别

介绍

我们目前在哪里？

实例

窄域代理的基本结构

实际考虑

感官

LLM主干

成本

延迟

未得出结论

工具和成本

代理术语

迁移学习

结论

关于作者

稻草人

相关推荐

Grok4和Grok3回答质量对比

24天学会ComfyUI-图片生成短视频工作流

24天学会ComfyUI-高清放大工艺和效果评价

LABUBU 商业综合分析：从潮流玩具到艺术收藏品

探秘J10CE：中国现代空中霸主的技术与能力

因心而动的AIGC小程序-字形绘梦

发表回复