-
加密货币正在等待什么用例
最后,我们终于找到了:加密货币的人工智能用例并非毫无意义或骗局。 换句话说,区块链确实将在人工智能经济中发挥重要作用,甚至成为运转良好的社会的基本要求,但方式却并非你所期望的那样。…
-
LLM权重剪枝和知识提炼
本文是对 NVIDIA 团队发表的一篇精彩论文的总结/回顾,该论文提供了一种创建精炼模型的方法。论文链接。他们还在 Llama 3.1 上使用该方法创建了 Minitron 4B …
-
Meta 改变游戏规则的模型
Transfusion 是 Meta 团队开发的一种新模型,使用统一模型生成文本和图像。该模型在文本和图像数据的均等混合上进行预训练,应用不同的目标:文本的下一个标记预测和图像的扩…
-
在 CPU 上训练 AI 模型
人工智能最近的成功通常归功于 GPU 的出现和发展。GPU 的架构通常包括数千个多处理器、高速内存、专用张量核心等,特别适合满足人工智能/机器学习工作负载的密集需求。不幸的是,人工…
-
语义分块:改进人工智能信息检索
今天,我们将探讨语义分块 — 一种显著改善信息检索的技术。如果您一直在关注 AI 的发展,那么您可能对检索增强生成 (RAG) 很熟悉。让我们来看看语义分块如何增强 RAG 系统。…
-
LLM 成本优化
优化 LLM 成本对于可持续、大规模部署并最大化商业价值至关重要。 大型语言模型 (LLM) 的财务压力 LLM 的快速采用和对这些模型的日益依赖带来了一个重大挑战:不断上升的运营…
-
创业过程中残酷的事实和前进的道路
尽管抱负远大、技术设计扎实、资金充足、团队敬业,但许多个性化项目仍陷入困境。本文探讨了常见原因,并为项目所有者和技术人员提供了前进的道路。 感觉陷入困境“我们已经在这个个性化项目上…
-
LLM 驱动的合成数据生成、管理和评估
出现了三个关键要素:人类监督的必要性、用于训练数据创建的精心规划的数据拓扑和管道,以及旨在从语言模型中引出特定行为(例如高级推理)的数据。 介绍 在训练模型中,平衡数据数量和质量的…
-
企业中实现有效的人工智能治理
Gen AI 治理清单(Github 上的文档链接):https://github.com/debmalyabiswas1/GenAIGovernance/blob/main/Ge…
-
自主 LLM 代理解决固体力学和流体动力学问题
设想一个未来,人工智能可以通过简单的对话轻松解决工程问题。下一代人工智能和语言模型将彻底改变我们利用有限元分析 (FEA) 和计算流体动力学 (CFD) 等工程工具解决结构分析、热…
-
LangChain的更新和可能的替换方案
2022 年 10 月,LangChain 成为大型语言模型 (LLM) 应用框架领域的知名参与者。Harrison Chase 在 Robust Intelligence 工作期…
-
大语言模型的个性化
ChatGPT 或当今底层的大型语言模型 (LLM) 能够在给出提示的情况下生成情境化的响应。 作为 LLM 发展的下一步,我们希望响应能够根据最终用户的角色、对话历史、当前对话环…
-
RAG 增强视觉问答的简单框架
检索增强生成 (RAG) 是一种强大的技术,可以提高大型语言模型 (LLM) 生成的答案的准确性和可靠性。它还提供了检查模型在特定生成过程中使用的源的可能性,从而使人类用户更容易进…
-
有状态且负责任的 AI 代理
AI 代理简介 围绕 ChatGPT 的讨论现已演变为 AutoGPT。虽然 ChatGPT 主要是一个可以生成文本响应的聊天机器人,但 AutoGPT 是一个功能更强大、自主性更…
-
从原型设计到生产 — 您需要的 15 个 RAG 策略
将 LLM 原型转变为有弹性的生产级解决方案的蓝图,重新定义可能性。 超越原型设计 在 AI 领域,从原型到生产的过程往往充满挑战。虽然最初设计大型语言模型 (LLM)、小型语言模…
-
RAG Foundry 英特尔的RAG开源框架
RAG Foundry 是英特尔的一个开源框架。旨在简化检索增强生成 (RAG) 系统的实施和评估。它通过将数据创建、模型训练、推理和评估集成到单个工作流程中来简化流程。该框架已被…
-
RAG 架构如何改变 AI
自从大型语言模型 (LLM) 以人工智能聊天机器人的形式出现在世人面前后,它们在我们日常生活中的应用就越来越广泛。它们催生出了一个全新的经济领域,而推动力则来自全新的人工智能业务以…
-
创纪录的 1 亿上下文窗口模型
750 部小说。1000 万行代码。这就是您可以提供给 Magic Dev 的新长期记忆 (LTM) 模型的信息量,该模型打破了所有记录(而且无人能及)。 虽然每个人都认为人工智能…
-
什么是 Agentic 工作流?
传统的人工智能自动化主要侧重于基于规则的系统和用于处理特定任务的狭义人工智能应用。虽然这些方法在许多情况下都很有效,但它们通常难以应对需要适应性和情境理解的复杂、多面流程。 进入代…