您准备好进行人工智能开发了吗?
不,我说的不是 GitHub Co-Pilot 或其他 AI 代码助手。我说的是AI 集成,就像我们在过去几年的云开发中看到的那样。随着 AI 产品的发展和迭代,更多的开发人员需要了解如何将 AI 创新融入现有应用程序。
幸运的是,您可以通过优先考虑正确的技能开发来为这种情况做好准备。
今天我们来谈论:
- 开发人员技能进步框架
- 如何从零开始成为一名生成式人工智能开发者
- 2024 年每位开发人员都应该了解的关于 AI 集成的知识
- 数据分析师需要了解有关 2024 年 AI 集成的知识
让我们立即开始吧!
开发人员技能开发框架
作为开发人员,我们的技能在不断地构建或“堆叠”。
无论您使用哪种特定技术或工具,软件工程都是建立在解决问题的能力的基础之上的。这一共同基础不仅仅局限于解决问题的能力。不同专业的软件工程师使用相同的编程语言和框架,有时是为了实现截然不同的最终目标。
下面是开发人员技能的金字塔或“堆栈”,以说明我的意思。
这是技能堆叠的一般描述,适用于跨学科的软件开发人员。如您所见,对 AI 的理解位于金字塔的中间,与许多其他开发人员的 API 和云知识处于同一级别。
AI 集成建立在与之前相同的通用技能前提条件之上。因此,从零开始成为生成式 AI 开发人员是可能的。
在下一部分中,我将简要介绍一些常见技能,这些技能可以帮助您开始构建自己的 AI 应用程序,并最终让您为 2024 年及以后的工作做好准备。
如何从零开始成为生成式人工智能开发者
由于软件技能是相互依存的,因此对于新开发人员来说,坏消息是您必须先学习所有基础知识,然后才能真正开始认真使用 AI。但是,有了正确的资源和有针对性的学习计划,您就有可能掌握成为 Gen AI 开发人员所需的技能和经验。
下面让我们快速浏览一下从完全新手成长为成熟的 AI 开发人员的一条可能途径:
- 学习编码:解决问题的技巧和 Python 基础知识。
- Python 项目:试验简单的 Python 项目并构建真实世界的软件。
- 数据结构和算法:您第一次体验高级计算机科学概念。
- 面向对象编程 (OOP):OOP 是构建现代、可扩展应用程序的先决条件。
- 云和 API 设计:了解如何有效地利用和与云计算构建块交互。
- 数据科学基础:人工智能和机器学习很大程度上建立在数据科学基础之上。(稍后会详细介绍!)
- 机器学习和人工智能:学习这些技术背后的理论和基础知识可以使它们更容易理解。然后你需要进行实践。
虽然这看起来相对简单,但重要的是要意识到,要真正理解每个步骤都需要相当长的时间。匆忙完成任何一个步骤都可能损害你的理解力,最终让你退步。编程是一项终身的追求,需要你不断学习新事物——即使对于经验丰富的开发人员也是如此。
长话短说,始终不断增强你的技能!
2024 年每位开发人员都应该了解的 AI 知识
就像 2010 年代初期的云开发革命一样,我们今天正处于一场人工智能革命之中。因此,人工智能集成正迅速成为许多开发人员的必需品。正如云开发为创建可扩展的 Web 应用程序创建了一种新的混合模型一样,我预测,在不久的将来,我们将在人工智能开发中看到类似的变化。
这在实践中意味着什么?这意味着更多的开发人员必须习惯在现有的 AI 工具上构建应用程序。
值得庆幸的是,利用人工智能和构建实际的人工智能模型之间是有区别的。除非你真的在 OpenAI 或 Anthropic 等人工智能组织工作,或者在谷歌和 Facebook 等大型科技公司的人工智能特定团队工作,否则你不需要了解人工智能或机器学习的复杂性。
那么,您需要了解哪些有关人工智能的知识才能有效地利用它们呢?
大型语言模型 (LLM)
大型语言模型是支持 ChatGPT 和 Google Bard 等应用程序的 AI 模型类型。这些工具背后的 LLM 分别是 GPT4 和 Google Gemini。
作为一名开发人员,了解 LLM 的工作原理对于理解如何使用它们至关重要。而且,归根结底,AI 是一种非常高级的自动完成功能。因此,了解底层发生了什么非常重要,这样您就可以根据自己的特定用例对其进行自定义。
关于任何 LLM,需要了解的一些基本问题:
- 如何优化?
- 它是根据什么数据进行训练的?
- 它有什么特殊的用途吗?有什么缺点吗?
- 有哪些隐私或安全规定?这些规定足够吗?
朗链
LangChain 是一个由 LLM 驱动的应用程序开发框架。该框架分为几个部分:
- Python 和 JavaScript 库:这些库包含框架的基本核心功能。
- LangChain 模板:执行一系列任务的参考架构
- LangServe:用于将 LangChains 部署为 REST API 的库
- LangSmith:用于监控、调试和评估 LangChains 或其他 LLM 框架的平台
LangChain 只是一种工具,它允许开发人员将现有的 LLM 甚至整个 Gen AI 系统集成到定制的应用程序中。
如果您是当前的开发人员,上述步骤仍然适用,您可能只是在某些领域取得了更大的进步。
由于很多开发人员已经掌握了基础知识,我将深入探讨所有开发人员都应该了解的数据科学和机器学习概念。
机器学习与数据科学基础
说到机器学习,以下是所有开发人员都应该熟悉的几个主题。
- 机器学习算法告知三种类型的机器学习,如下所示。
- 监督学习:线性回归、逻辑回归和决策树。
- 无监督学习:K均值聚类和层次聚类
- 强化学习:基于记忆的高效探索(MEME)
- 神经网络和深度学习:LLM 的核心架构组件以及多面 AI 模型中出现的处理层。
- 模型评估和调整:人工智能组织测试和调整其模型所依据的基准和评估。
数据科学基础知识通常比人工智能基础知识更容易理解。让我们来看看一些需要了解的基本概念。
- 统计和概率:了解假设检验和数据分布背后的基本数学概念。
- 数据可视化:准备使用或参考数据可视化工具和库,如 Matplotlib、Seaborn 和 Bokeh。
- 数据预处理:了解如何在解析数据之前清理和确定数据范围。
- 线性代数:大多数没有自己构建或分析人工智能的开发人员不需要太多超出其常规范围的数学知识,但重新熟悉向量和矩阵等概念总是一个好主意。
现在您已经了解了作为开发人员需要了解的概念,让我们来介绍一下数据分析师可能需要的技能。
2024 年数据分析师需要了解的有关 AI 的知识
从高层次上讲,数据分析师需要了解 AI 模型在哪些数据上进行训练、它们的核心功能以及如何理解它们的输出。
对于 GPT-4 这样的模型来说,这种高层次的理解可能很困难。训练数据非常庞大,需要进行大量研究才能完全了解幕后发生的事情。
对于更小、更小众的模型,理解它们的功能——从训练数据到输出——变得更加容易。
数据分析师了解 LLM 的最佳方法之一是研究 LLM 产生的输出。记录提示及其输出,并最终预测 LLM 在提示时将返回的合理输出。通过标准化提示,您可以更好地了解如何利用 LLM。
数据分析师需要高度专注于及时工程。了解如何充分利用 Gen AI 是实现内部和外部工具的关键。相反,数据分析师还需要了解 LLM 的局限性以及如何解决 Gen AI 的弱点。
未来,负责任/合乎道德的 AI 开发实践将得到更多重视。因此,构建模型的工程师和利用模型的团队都需要对如何让生成式 AI 尽可能安全达成共识。
对于数据分析师来说,这意味着要在现有的 LLM 上构建一层实质性的保护层,以便它们能够满足预期的使用情况。当前的 AI 是海量统计模型,很容易被欺骗。当让生成式 AI 不泄露敏感信息、不产生幻觉或假设它不知道的事情时,就会出现挑战。
准备好学习了吗?从这里开始吧。
人工智能和机器学习是下一代软件应用程序的基础。因此,无论您的专业是什么,大多数开发人员都需要了解如何在未来几个月和几年内利用人工智能。
你对这些大型语言模型的理解和创新越充分,它对你的职业生涯的影响就越大。
如果您有兴趣提升自己特定职能领域的技能,为即将到来的人工智能新世界做好准备,我建议您深入了解 RA AI训练营的目录。
这些课程和项目是由行业专家开发的,旨在让您掌握这些必备技能,为您开启新的软件开发模式提供优势。
RA/SD 衍生者AI训练营。发布者:chris,转载请注明出处:https://www.shxcj.com/archives/3257