人工智能炒作周期:正在竞赛中吗?
我最近在阅读《Money Stuff》(Matt Levine 在彭博社不可或缺的新闻通讯/博客)的往期杂志,其中有一篇有趣的文章,讲述了人工智能选股算法实际上并不青睐人工智能股票(而且它们在选股时的表现也并不那么好)。
但该分析还提出了一个观点,那就是整个经济领域的企业都陷入了对人工智能的错失恐惧症 (FOMO)。这导致了我们所谓的人工智能出现了一系列半滑稽的应用。
“有些公司声称他们在做人工智能,但实际上他们只是在尝试弄清自动化的基本原理。这些伪装者迟早会被揭穿,”他说。……
时尚服饰公司 Ralph Lauren 本月早些时候将人工智能描述为“我们收入增长之旅中真正重要的组成部分”。肯德基所有者 Yum Brands 和 Chipotle 等连锁餐厅都大力推广人工智能技术,以提高食材订购效率或帮助制作玉米片。
万豪酒店和挪威邮轮等多家旅游相关企业表示,他们正在开发人工智能系统,以使预订等流程更加高效和个性化。
尽管 Ralph Lauren 在 5 月份的年度报告中广泛地提到了一些举措,但上述例子均未在最近的季度文件中提及人工智能。
不过,我觉得讨论一下这一切是如何发生的可能会有所帮助。当有人决定他们的公司需要“人工智能创新”时,无论它是否真的是生成式人工智能,到底发生了什么?
对人工智能(和自动化)的理解
人工智能就是我们使用机器学习策略(通常但并不总是深度学习)来构建模型或模型组合,以完成通常需要人类能力的复杂任务。机器学习模型什么时候会变得足够复杂,以至于我们应该称之为人工智能?这是一个很难回答的问题,而且对此存在很多分歧。但我的框架是这样的:机器学习是我们用来创建人工智能的技术,机器学习是一个很大的范畴,包括深度学习和许多其他东西。数据科学领域是一个更大的范畴,它可以包括部分或全部机器学习,但也包括许多其他东西。
人工智能就是我们使用机器学习策略(通常是深度学习)来构建模型或模型组合,以完成通常需要人类能力的复杂任务。
还有另一个子类别,即生成式人工智能,我认为当今大多数外行人谈论人工智能时,他们实际上指的就是这个。这就是你的法学硕士、图像生成等等(有关所有这些内容的更多讨论,请参阅我之前的帖子)。如果说搜索引擎在技术上是人工智能,人们可能会争辩,但它肯定不是生成式人工智能,如果你今天在街上问某人一个简单的搜索引擎是否是人工智能,他们可能不会这么认为。
让我们讨论一个例子,也许有助于澄清一些关于自动化的知识,以及什么使它们不一定是人工智能。问答聊天机器人就是一个很好的例子。
一方面,我们拥有相当基本的自动化技术,这是我们已经存在很久的事情了。
- 客户在你网站的弹出框中输入问题或搜索词
- 一个应用程序查看这个问题或一组单词,并删除停用词(a、and、the 等等 – 一种简单的搜索和替换类型功能)
- 然后,应用程序将剩余的术语放入搜索框中,并将数据库/常见问题/wiki 的搜索结果返回到聊天弹出框
这是对旧方法的粗略近似。人们不喜欢它,如果你要求错误的东西,你就会被困住。它基本上是一个 LMGTFY*。这个工具甚至没有模仿人类可能使用的解决问题或响应策略。
另一方面,我们现在可以有一个 ChatGPT 等效产品:
- 客户在你网站的弹出框中输入问题或搜索词
- 幕后的 LLM 将客户的输入作为提示,对其进行解释,并根据单词、其句法嵌入和模型的训练返回文本响应,以产生极其“像人类”的响应。
这意味着几个重大好处。首先,LLM 不仅知道你发送给它的单词,还知道根据其学习到的 token 嵌入,哪些其他单词具有相似的含义和关联,因此它将能够超越响应时使用的确切单词。如果你问“买房”,它可以将其与“房地产”或“抵押贷款”或“房价”联系起来,大概是因为它接受过训练的文本显示这些词在相似的上下文中并且彼此接近。
此外,客户在网站上阅读和使用回复可能会更加愉快,从而让他们对贵公司的体验更加美观。这种模型的结果比老式聊天机器人的结果更加细致入微,也更加复杂。
但是,我们需要记住,LLM 并不了解或关心信息的准确性或时效性。记住我在之前的帖子中关于什么是 LLM 以及它是如何训练的评论——它不是学习事实准确性,而是学习生成非常像人类写作和人类喜欢接收的文本。事实可能是准确的,但很有可能不是。另一方面,在第一个示例中,您可以完全控制可能从数据库返回的所有内容。
对于您网站的普通用户来说,这在前端可能实际上并没有太大的不同——响应可能更令人愉快,可能会让他们感到“被理解”,但他们不知道 LLM 版本的答案不准确的风险更高。从技术上讲,如果我们深入研究,这两者都是为您自动回答客户问题的过程,但只有一个是用于这样做的生成式 AI 工具。
附注:我现在不打算讨论 AGI(通用人工智能)和专业人工智能之间的区别,我只想说,目前为止,AGI 还不存在,任何告诉你它存在的人都是错的。我可能会在以后的帖子中更多地讨论这个问题。
幕后黑手是谁?
那么,让我们继续我们最初的对话。是什么导致一家公司在新闻稿中抛出一些基本的自动化或 ChatGPT 包装,并将其称为他们的新 AI 产品?谁在推动这一进程,他们到底在想什么?我的理论是,有两条基本路径引领我们到这里。
- 我想要公关:一位高管看到了炒作周期的发生,他们希望自己的业务得到媒体的关注,所以他们让团队开发一些可以作为人工智能出售的东西。(或者,将他们已有的东西重新贴上人工智能的标签。)他们可能知道或不关心这个东西是否真的是生成式人工智能。
- 我想要魔法:一位高管在新闻或媒体上听到有关人工智能的消息,他们希望自己的企业能够获得他们认为竞争对手从人工智能中获得的任何优势。他们走进办公室,指挥团队打造能够提供人工智能优势的东西。如果这位高管真的知道生成式人工智能和更简单的自动化之间的区别,我会感到惊讶。
当然,所有这些都不一定会排除最终会出现一个好的生成式人工智能工具的想法,因为已经有很多这样的工具了!但是,当我们从“我们需要用这项技术做某事”的假设出发,而不是从“我们需要解决这个实际问题”出发时,我们就会以完全错误的方式进行开发过程。
但说真的,这有什么害处呢?这真的很重要吗?还是这只是数据科学家之间关于某家公司推出的最新疯狂“AI”功能的笑话素材?我认为这确实很重要(尽管它也经常成为笑话的素材)。
我们为什么要关心?
作为数据科学家,我认为我们实际上应该对这种现象感到有点不安,原因有两个。
首先,这种文化贬低了我们实际做出的贡献。数据科学曾经是最性感的职业,至少许多杂志封面都这么说过,但幸运的是,我们正适应一个更加平静、稳定、不那么浮华的职业。数据科学团队和部门通过确定如何高效、有效地运营业务,为企业提供坚实可靠的价值。我们决定向谁推销产品以及何时推销产品;我们告诉公司如何组织供应链和仓库;我们通过改变系统和流程来发现提高生产力的机会。我们不再认为“我们一直都是这样做的”,而是有能力找到在公司范围内使用数据实际做事的最佳方式。
我们所做的这些事情,即使不是生成式人工智能,也不会失去价值或重要性。我们做了很多机器学习工作,虽然可能没有达到人工智能本身神秘的复杂性边界,但所有这些工作仍然在帮助人们并产生影响。
其次,我们把一切都称为人工智能,这只会助长这种愚蠢的炒作周期。如果你将线性回归称为人工智能,那么你也支持了该短语含义的逐底竞争。如果我们用这个短语来指代一切,它就会被千刀万剐。也许这样很好,我知道我现在已经准备好不再听到“人工智能”这个词了。但原则上,我们数据科学领域的人更了解这一点。我认为我们至少有责任正确使用我们的行业术语,并抵制让含义变得混乱的压力。
第三,我认为可能最重要的是,我们花在满足领域外人士的需求上的时间,通过构建东西来制作 AI PR,占用了我们本可以创造的真正价值。我坚信数据科学家应该构建能够改善人们生活并帮助人们做他们需要做的事情的东西。如果我们构建的工具(无论是否使用 AI)没有人需要并且对任何人都没有帮助,那就是浪费时间。不要这样做。您的客户几乎肯定确实需要某些东西(看看您的票务积压!),而您应该这样做。不要仅仅因为“需要 AI 的东西”而做项目,而要因为它们满足需求并具有真正的目的而做项目。
当公司高管早上走进办公室并决定“我们需要 AI 功能”时,无论是为了公关还是为了 Magic,这都不是建立在战略上对您的业务实际需求的理解,也不是基于您真正要为客户解决的问题。现在,我知道作为数据科学家,我们并不总是能够反对高管的要求,即使这些要求有点愚蠢,但我真的希望看到更多公司退后一步,思考生成式 AI 工具是否真的是解决其业务中实际问题的正确方法。如果不是,也许就坐下来,等到问题真正出现。
现实中的例子
好吧,我对整个闹剧已经够烦躁了,现在让我们找点乐子。我一直在浏览各家公司发布的新闻稿,它们向全世界介绍它们新潮的人工智能功能,并反思这些功能看起来是多么荒谬、不必要和浪费,我挑选了一些有趣的内容来分享。
- 可口可乐利用生成式人工智能设计广告并发明新口味:这份新闻稿是一些一流的文字杂烩,但他们似乎正在使用 Dall-E 来生成广告视觉效果。。此外,他们坦率地承认这是炒作周期的短途旅行。“在去年倾向于增强现实之后,我们正在拥抱人工智能的力量,并继续在这个令人兴奋的领域构建我们公司的能力。” Metaverse 没有成功,所以我想这是下一个目标?
- Afterparty 希望让名人通过深度伪造来节省与粉丝交谈的时间,同时还能赚钱。有人想要这个吗?据我所知,考虑到其中的价值潜力,名人自然会犹豫是否要让人工智能复制他们的肖像。我也不清楚为什么任何粉丝会想要这个。
RA/SD 衍生者AI训练营。发布者:稻草人,转载请注明出处:https://www.shxcj.com/archives/5451