-
14-40 剑和诗人14 – 为什么机器学习需要合成数据
数据是人工智能的命脉。如果没有高质量、有代表性的训练数据,我们的机器学习模型将毫无用处。但随着神经网络规模越来越大、人工智能项目越来越雄心勃勃,人们对数据的需求也越来越大,我们面临…
-
14-39 剑和诗人13 – 顶级大模型测试,分析和建议
随着对高级语言功能的需求不断飙升,市场上涌现出大量语言模型,每种模型都拥有独特的优势和功能。然而,驾驭这个错综复杂的生态系统可能是一项艰巨的任务,开发人员和研究人员经常面临选择最适…
-
14-38 剑和诗人12 – RAG+ 思维链 ⇒ 检索增强思维(RAT)
在快速发展的 NLP 和 LLM 领域,研究人员不断探索新技术来增强这些模型的功能。其中一种备受关注的技术是检索增强生成 (RAG) 方法,它将 LLM 的生成能力与从外部来源检索…
-
14-35 剑和诗人9 – 普及 Agentic RAG
好吧,让我们直接进入正题——了解 Agentic RAG(检索增强生成)方法以及它如何彻底改变我们处理信息的方式。系好安全带,因为这将变得疯狂! Agentic RAG 的核心在于…
-
14-34 剑和诗人8 – 微调 LLM 的分块策略
介绍 使用大规模 LLM 会带来巨大挑战,特别是在内存管理和模型微调方面。一项可以缓解这些挑战的强大技术是分块,这是一种将大量输入或输出分解为更小、更易于管理的部分的策略。 让我们…
-
14-32 剑和诗人6 – GenAI 重塑 SRE 和云工程实践
在不断发展的软件开发和运营领域,各种学科的融合催生了新的范式和实践,旨在简化流程、加强协作和推动创新。DevSecOps、站点可靠性工程 (SRE)、平台工程和云工程已成为支持现代…
-
14-31 剑和诗人5 – 使用 AirLLM 和分层推理在单个 4GB GPU 上运行 LLama 3 70B
利用分层推理实现大模型语言(LLM) 大型语言模型 (LLM) 领域最近取得了显著进展,LLaMa 3 70B 等模型突破了之前认为可能实现的极限。然而,这些模型的庞大规模给其部署…
-
14-30 剑和诗人4 – 具有长上下文窗口的微调 LLM 的数据设计
LLM 中的长上下文窗口的挑战 微调大型语言模型 (LLM) 面临的最大挑战之一在于处理较长的上下文窗口。LLM 经过大量文本数据训练,能够理解和生成类似人类的语言。然而,在推理过…
-
14-29 剑和诗人3 – 利用知识图谱增强 LLM 推理能力
知识图谱提供了一种结构化的方式来表示现实世界的事实及其关系。通过将知识图谱整合到大型语言模型中,我们可以增强它们的事实知识和推理能力。让我们探索如何实现这一点。 知识图谱构建 在利…
-
14-28 剑和诗人2 – 高性能编程Bend和Mojo
介绍: 在不断发展的计算世界中,软件和硬件之间的界限变得越来越模糊。随着我们不断突破技术可能性的界限,对能够利用现代硬件功能的高效、可扩展的编程语言的需求从未如此迫切。 Bend和…
-
14-20 Vision Transformer用AI的画笔描绘新世界
概述 毫无疑问,目前最受关注且不断发展的最重要的主题之一是使用人工智能生成图像、视频和文本。大型语言模型 (LLM) 已展示出其在文本生成方面的卓越能力。它们在文本生成方面的许多问…
-
2024 年如何构建 AI 软件
人工智能 (AI) 是当今 IT 行业最热门的话题,受到大型科技公司、大型企业和投资者的青睐。如果有人不参与 AI,他们就出局了。虽然“AI 泡沫”一词尚未公开使用,但街上的每个人…
-
12-26 人工智能不会取代人类,你还会信吗?
使用 DALL-E 3 拍摄的图像 到目前为止,我们已经看到许多公司推出的产品都打着流行的“人工智能驱动”的标语作为营销策略。然而,由于急于尽快发布人工智能产品,我们发现这些产品通…
-
如何用AGI赚钱
埃森哲本季度在生成式人工智能领域投资超过6 亿美元(年化24 亿美元) 为了更直观地了解这个数字,OpenAI 在 2023 年全年的收入为16 亿美元。 大多数企业都看到了 Ge…
-
12-24 A100 和 4090 傻傻分不清?看了就明白训练卡和推理卡的区别
最近读者问我们 如果想自己本地部署Stable Diffusion本地环境, 需要买哪种显卡?有些卡很贵,有什么区别 这个就要涉及到训练卡和推理卡的区别,它们在设计和性能上有着明显…
-
12-23 揭秘AI中的 PDF 解析
将非结构化文档(如 PDF 文件和扫描图像)转换为结构化或半结构化格式是人工智能的关键部分。这一过程是人工智能智能的关键。 本系列文章将对PDF解析的主流方法进行归类,并探讨一些具…
-
萨姆·奥特曼表示 GPT-5 会“没问题”
人工智能公司的首席执行官们总是在玩弄两面派,你不觉得这很烦人吗?他们大肆宣传人工智能以提高人们的期望,但一旦热情失控,他们又试图在事后平息情绪。 OpenAI 首席执行官 Sam …
-
12-17 2024 年开发人员需要掌握的AIGC 技能
您准备好进行人工智能开发了吗? 不,我说的不是 GitHub Co-Pilot 或其他 AI 代码助手。我说的是AI 集成,就像我们在过去几年的云开发中看到的那样。随着 AI 产品…
-
使用Prompt Compression即时压缩将 RAG 成本降低 80%
推理过程是使用大型语言模型时大幅增加金钱和时间成本的因素之一。对于较长的输入,此问题会显著增加。下面,您可以看到模型性能与推理时间之间的关系。 性能得分与推理吞吐量 每…
-
AI的下一步是什么:人工智能代理工作流程(AI agentic workflows)?
我相信你们大多数人最近都听说过 Devin AI,作为世界上第一个 AI 软件开发商,它吸引了大量关注。现在我们又有一位来自印度的开发者,名叫 Devika。 那么,这就是 AI …