7 月份在柏林举行的 WeAreDeveloper 世界大会上,GitHub 宣布公司将利用人工智能和助手在极短的时间内将 10 亿人变成开发者。另一方面,亚马逊云首席执行官在内部炉边谈话中解释说,很快将不再需要开发软件,因为机器无论如何都能做得更好。两个截然不同的声明,你必须问自己谁是对的,这对开发者和那些想要进入这个市场的人意味着什么。所以让我们快速回顾一下,看看目前的情况以及可能发生的事情。
过去曾是一名软件开发人员
自 1995 年以来,我一直是一名专业、高薪且备受追捧的开发人员。我曾在雅虎、Mozilla 和微软工作多年,还曾与谷歌合作开发 Chromium 项目。在我职业生涯的初期,人们不赞成我在工作时间和公司电脑上编写的软件应该免费提供给其他人,而我编写的大部分软件仅供内部使用。
开源作为介绍
但很快开源就出现了,改变了一切。起初它只是极客们的工具和想法,但后来它证明了自己是一种明智的软件开发方法。云主要在 Linux 上运行,Android 在数字上优于 iOS,而很大一部分网络是基于 WordPress 的。
对我来说,开源和知识共享是有意义的。我不想成为唯一一个了解和编辑软件的人。我希望其他人能够看到我的作品,检查它,并在我不再有时间或灵感继续这个项目时接手。
开源让成千上万的开发人员得以开始他们的职业生涯。作为一名首席开发人员,这意味着我不必寻找新员工,而是可以从项目内部聘请他们。我可以看到谁使用或为项目做出了贡献。我不仅已经了解了这些新员工的技术能力,还了解了他们如何记录他们的工作、处理批评以及如何在团队中沟通。
当我开始接触开源时,微软还是一个邪恶帝国。2015 年,我离开 Mozilla 加入微软,主要原因是微软承诺帮助埋葬 Internet Explorer,这是我作为 Web 开发人员长期以来的梦想。与此同时,微软发布了Visual Studio Code。一款开源代码编辑器,将在很短的时间内彻底改变开发者世界。
当有传言称微软将收购 GitHub 时,开发者社区里一片抱怨,许多人预测这将是该平台的终结。但我却不这么认为。GitHub 是一个非常棒的平台,它简化了版本控制,允许任何人在很短的时间内围绕他们的软件产品创建一个社区。但它是一家来自旧金山的初创公司,许多传统的欧洲公司永远不会把他们的软件或数据放在那里。由于它背后有微软公司,情况就完全不同了。
我想说的是,开源早已使软件开发民主化,让任何人都可以开始新的开发者生涯。当然,网络是之前帮助实现这一目标的另一项重大发明,但现在你可以免费使用市场上大公司使用的专业工具,也可以与它们合作。
到目前为止,一切都很好。但随后出现了人工智能炒作,突然间我们又回到了繁荣之中,让人想起了千禧年初的互联网泡沫。
欢迎来到人工智能炒作的世界
人工智能的理念并不新鲜,但目前只有两个主要区别:
- 计算机的速度足够快,能够提供人工智能系统所需的能力
- ChatGPT、LLM 和 RAG 让每个人都能使用人工智能,而且无论是否有意义,人工智能目前都在各个地方使用。
与看似智能的机器交谈并以这种方式获取信息是任何看着《星际迷航》长大的人的梦想。这也是计算机和知识的一般方法的重大变化。虽然人们过去阅读书籍,然后通过门户网站和搜索引擎查找网站,但今天他们向机器提问并立即得到答案。如果答案不正确,他们可以询问更多信息。
软件是人工智能生成的大众产品吗?
每当用户行为发生变化时,大公司的首席执行官就会变成预测未来的算命师。当智能手机出现时,一切都必须是应用程序,因为只有这些才能为最终用户提供最好的服务。当 Siri、Cortana、Bixby、Alexa 等数字助理推出时,人们预测很快将不再有应用程序,但这些助理将能够满足我们的所有愿望。这里的典范是中国的微信,它确实是那里所有问题的解决方案。然而,这也是一个没有免费互联网的市场。
现在很多人预测每个软件解决方案都可能是 ChatGPT 的扩展。
每当这种情况发生时,就会立即出现一个市场,您可以在那里提供扩展程序或应用程序。这些市场很快就会变成数字垃圾堆,因为公司会自动创建数百个应用程序,数字攻击者会将病毒和木马当作合法产品,而且每个成功产品都会有数百个廉价的仿制品。
换句话说,软件正在成为一种大众产品,许多人被误导相信,凭借杀手级应用,他们明天也可以成为百万富翁。
然而,通常只有市场运营商才能从成功的提议中受益,在人工智能扩展方面,最近有很多成功的想法只是在系统本身中提供,企业家突然发现所有用户都消失了。然而,这并不是什么新鲜事,因为浏览器插件和开发者环境经常出现这种情况。
如果从外部来看,它类似于流媒体服务。过去,您需要购买 CD 或 DVD,但如今您可以立即访问所有内容。但您也无法拥有内容,如果您想再次观看,也不能依靠再次找到它。就像您从 ChatGPT 获得答案并不总是相同的,有时还会得到奇怪的答案。正确的东西不可用,所以,好吧,这是一些东西。
每当一项新技术有望征服市场时,你都会听到同样的说法。一种说法是,很快就能创建出色的软件解决方案,而无需编写一行代码。在 Visual Basic 时代或后来的 WYSIWYG(“所见即所得”)环境(如 Frontpage 或 Dreamweaver)时代,情况已经如此。如今,有许多“低代码”或“无代码”解决方案都具有相同的承诺,它们使创建产品变得更容易,但同时也带来了高度未优化的结果。
当然,这在 AI 领域是可以预见的,ChatGPT 的首批“哇”演示之一就是根据纸上潦草的设计创建了一个 Web 应用程序。后来,“Devin”成为第一个完全有效的AI 软件开发人员。两者都带来了大量头条新闻和掌声,但特别是对于 Devin 来说,很快就清楚的是,这是一个不错的演示,但并不是真正的解决方案。
谁需要开发人员?
我们是否还需要开发人员取决于我们想要创造什么。ChatGPT 的“从纸到代码”演示应用程序是一个只需按一下按钮即可显示笑话的网站。没有人需要这个应用程序,它更像是编程课程的一节课。即使作为面试问题,这个应用程序也晚了 15 年,无法测试应聘者的知识。
如果我们的工作是创建这样的解决方案,我们就不需要专业的开发人员。但我们也不需要人工智能,因为低代码和无代码产品可以做这些事情很多年。
确实,开发人员所做的很多工作都是基于现有产品。如果真的只是组装现有组件,那么人工智能也可以做到。
然而,还有很多问题需要更复杂的人工解决方案,而对于这些问题,我们需要训练有素的开发人员。在我的职业生涯中,我越来越注意到编写程序是工作中最小的部分。相反,它是关于开发人类可以理解和访问的软件,而这是人工智能无法为我们完成的任务。无论新软件的广告如何承诺,可访问性和可用性都无法自动化。
开发人员如何学习?
对于每项工作,您都需要合适的工具。就软件而言,这就是开发环境。它应该让我能够轻松地编写代码、查找错误、进行更改,并且(如果可能)立即看到结果。一个好的开发环境会在我写作时告诉我我犯了一个错误或如何使用一种方法。类似于文字处理器在我打字时为错误加下划线的方式。
如果我想了解语法、方法名称或如何解决问题,我可以查阅文档。书籍、在线文档、课程以及视频。而且有很多可用的文档。区分好坏几乎是一项全职工作。
这就是为什么有论坛和社交媒体来供大家交流想法。
当 GitHub 提出为 VS Code 推出 GitHub Copilot的想法时,我立即被迷住了,从第一天起我就成为了一名测试员,帮助查找错误并请求新功能。
最棒的是,我不必去 ChatGPT 这样的网站询问有关编程的问题。相反,它发生在我的开发环境中,作为关于如何继续我刚刚启动的功能的建议。我还可以突出显示部分源代码并询问 AI 这到底是什么。我以前在论坛上或在 GitHub 上发表评论时这样做。我在编程时学习,因此在更短的时间内创造了更多东西。我还可以告诉系统仅参考当前项目,而不是给我一些来自互联网的结果。此外,系统会从我身上学到我的期望。我使用 Copilot 的次数越多,它给我的建议就越多,而这些建议都是我本来就会写的。它开始模仿我的风格,而不是提供随机的建议。
换句话说,研究任务是自动化的,也是工作的一部分。这就是 GitHub 比其他公司有明显优势的地方,这也是他们有机会完成将十亿人变成开发者这一重大任务的原因。
GitHub 是我存储源代码的地方,我只需按一下键盘就可以在浏览器中编辑代码,而且我可以接触到大量在同一平台上交流的专家。所有学习步骤都在一个环境中完成。现在有更多参与者提供这种服务,但 GitHub 的优势在于它既是一个庞大的社区,又是一个平台。
但开发的技术部分只是任务的一小部分。作为一名开发人员,我的很大一部分工作是过滤和转换数据。你永远无法获得完美的数据,而好的软件都是防御性地编写的,会测试输入,预计会出现错误信息并过滤掉它。这就是人工智能在其当前营销形式中真正存在的问题。
人工智能创建简单的代码
如果你向世界展示一个很棒的新解决方案,它不能犯任何错误。而这正是目前人工智能炒作的一个问题。大多数系统都会返回一些东西,而不是聊天机器人不给我答案,或者只是承认需要更多信息。在聊天和创建图像或视频时,这些都是所谓的“幻觉”。在代码生成中,这些要么是来自官方文档的第一个结果,要么是被大多数开发人员选为最佳的结果。这不是最好的解决方案,而是最简单的解决方案。
很多AI代码生成器都是基于Stack Overflow、Reddit、官方文档、知名开发者个人博客等论坛的数据,问题在于大多数时候给出的解决方案都是最简单、最快的结果,而不是最安全或最优化的结果。
几十年来,我一直编写课程和书籍,每个出版商或平台都想要的正是这一点:通过展示一个简单的例子,让参与者获得快速、积极的体验,而不是立即指出所有的细微差别。
这些示例也是论坛上社区投票选出的最佳示例,因为它们简单且能立即给出结果。论坛参与者不想知道“为什么”,只想知道“如何”。这些是 AI 聊天机器人作为第一个结果显示的代码示例。即使用户告诉机器人这不是一个好结果,底层模型也不会改变,因为那样太昂贵且耗时。
缺乏透明度
最难的事情是找出机器人从哪里得到它提供的解决方案。人工智能行业目前正以隐身的方式蓬勃发展,而不是摊牌。当涉及数百万的投资时,人们喜欢隐藏他们的产品的特殊之处。它实际上开始得很好。OpenAI 是一个典型的例子,它最初是开放的,后来进行了更改以鼓励更高的投资。但最终用户的利益在于知道模型基于哪些数据,这样你作为原始开发人员就可以解释为什么它是一个坏例子,或者更新和修复已知的安全或性能问题。例如,我知道我的哪些开源 Github 存储库已被人工智能机器人读取和接管,其中一些非常成功,但只是因为它们是一种有趣的技巧或一种非常肮脏的捷径。
谁拥有源代码?
目前,互联网上正在上演一场关于如何保护您的开放内容不被人工智能机器人接管的军备竞赛。许多公司已经被起诉,例如,他们没有注意许可证或询问所有者就获取了 YouTube 内容。虽然许多将自己的作品作为开源发布的开发人员并不介意其他人在其上进行构建,但当一台机器出现并在没有背景或认证的情况下将您的代码作为付费服务的一部分用于聊天机器人答案时,情况就不同了。有很多拦截器列表应该可以保护您自己的博客或源代码存储库不被索引。然而,人工智能提供商不会识别他们的爬虫机器人,而是将自己伪装成普通浏览器。毕竟,这是为了能够提供最多的数据,而不是为了道德或遵守许可证。
在斯坦福大学的一次演讲中,谷歌前首席执行官最近直截了当地解释说,在创新和快速进入市场方面,窃取内容是完全可以的。企业家不应该担心这个问题,而是把这件事交给律师去处理。美丽新世界。
欧洲是二流市场吗?
欧洲有许多规则和法律可能对一些硅谷初创公司不利,在与美国公司合作的过程中,我花了很多时间向同事解释 GDPR 和类似的东西,并为无法显示用户信息而道歉,因为在德国,在用户不知情的情况下记录这些信息是违法的。这很好,用户的隐私和他们的安全是最重要的。但这不适合爆炸式增长和快速软件分发的世界。我们目前正处于一个十字路口,越来越多的人工智能系统和产品要么根本不提供,要么几个月后才在欧洲提供。
政治因素也于事无补。从历史上看,欧洲一直拥有许多开源公司和开发者,但随着欧盟削减开源软件资金,许多供应商将不得不寻找其他方式来支付账单。这将使它们在寻找投资者时难以与其他法律较少的国家的公司竞争。
总体而言,问题仍然是许多人认为开源是免费的。一句老话说,开源软件“像小狗一样免费”,所以如果你得到一只免费的小狗,那很好,但你也必须照顾它。你必须训练这只动物,而且地毯上可能会发生意外。
最近发生的一起事故震惊了 OSS 世界。几乎所有系统中的一个重要开源组件 xz 几乎被可能感染所有 Linux 机器的恶意软件所取代。问题是原始开发人员不再有时间维护产品,并将其交给了维护者。这在 OSS 世界中是完全正常的行为。但维护者原来是计划用恶意软件替换组件的人,并且花了时间掩盖他的意图。我们现在必须问自己,如何确保系统相关组件的维护,而不必担心将来出现类似的安全问题。如果没有资金支持,这将很难实现。
《欧洲人工智能法案》(AI Act)于 8 月 1 日生效,旨在规范人工智能世界,提高透明度,让欧洲公司在国际竞争中占据有利地位。然而,这也给开源产品带来了一个重大问题,因为这些产品是豁免的。原因之一是安全性,因为开放系统更容易受到攻击,并且可以用于邪恶目的以及合法目的,而无需任何反馈或请求许可。
通过隐蔽性实现安全?
在 IT 安全领域,有一句话一直都是谎言:通过模糊性实现安全。不能直接分析闭源系统并不意味着它们更安全。
最近,越来越多的报道称所有封闭的人工智能系统都遭到了攻击,数据丢失。许多代码生成器还通过即时注入的方式被利用,向最终用户提供不安全的代码,从而安装恶意软件。微软尤其成为媒体的焦点,现在甚至根据员工对公司安全的影响来发放奖金。有趣的是,就在几个月前,许多安全专家在 11,000 名员工的裁员浪潮中被解雇。
这些问题以及其他问题(例如Azure Masterkey 丢失和 Crowdstrike 中断)也损害了开发人员对云和大公司的信任,几乎所有关于人工智能的讲座或文章都警告不要只依赖一家提供商。这当然也意味着你要么花更多的钱,要么依赖本地安装的系统。这些必须是开源的。
现在会发生什么……
GitHub 为自己设定了一项雄心勃勃的任务,并有能力实现它。唯一的问题是,在人工智能时代,“开发人员”到底是什么。讨论这个问题需要一篇单独的文章,因为这涉及很多方面。
然而,大多数公司都隐瞒了一点,那就是 AI 商业模式目前行不通。大多数公司目前都在支付额外费用——各种 Copilot 和系统的收入不足以支付计算成本。技术成本高得离谱。在 GenAI 革命之前,几乎所有大公司都宣称他们很快就会实现“碳中和”或只依赖绿色能源,但事实并非如此,而且所有人都对这个话题保持了可疑的沉默。生成式 AI 目前是一种疯狂的能源浪费——每生成一张图像所需的电量与给手机充电一样多。
因此,设备上的 AI 理念将变得越来越有趣。所有开源 AI 模型都可以在本地使用,而不是将模型托管在云端,例如,谷歌已经在考虑将 Gemini 集成到 Chrome 中。还有一些开源项目提供不依赖云的 AI 聊天系统。
但总体而言,这是一个非常有趣的时代,市场总是需要更多的开发人员。我认为开发人员目前还无法被取代,而且我确实认为智能且易于访问的开发环境为许多新人提供了参与的机会。
问题是,我如何将这些新手变成也能为自己的工作感到自豪的开发人员,以及在 AI 说“接受这个,一切都会好起来”之后,我们能做些什么来让接下来的学习步骤对他们具有吸引力。
链接资源:
- GitHub 的 Thomas Dohmke 和 Demetris Cheatham 在 WeAreDevelopers 世界大会上发表主题演讲《迈向十亿开发者之路》
- 亚马逊云首席执行官预测,未来大多数软件工程师不再编写代码,而由人工智能来编写
- 在一份泄露的录音中,亚马逊云计算主管告诉员工,随着人工智能的接管,大多数开发人员可能很快就会停止编码
- Visual Studio 代码
- 微软押注聊天机器人作为与设备和应用程序交互的新方式
- 第一个 GPT-4 演示根据提示构建应用程序
- 人工智能工程师 Devin
- 德文是假的吗?
- 适用于 VS Code 的 GitHub Copilot
- Gemini AI 平台被指未经用户许可扫描 Google Drive 文件
- Nvidia 因在 404 媒体调查后抓取 YouTube 内容而被起诉
- 人工智能初创公司 Anthropic 因过度抓取网页数据而遭遇强烈反对
- 前谷歌首席执行官埃里克·施密特表示,成功的人工智能初创公司可以窃取知识产权,并聘请律师“收拾残局”
- 埃里克·施密特文字记录
- 需要阻止的 AI 网络爬虫列表
- 欧盟 2025 年 Horizon 计划取消对 FOSS 的资助
- 欧盟必须继续资助自由软件
- 开源人士称疑似 xz 式攻击继续针对维护者
- 评估 XZ Utils 事件的 Y 和 How
- 我们需要从 XZ 后门中学到什么
- 我是如何发现 ZeroMQ 中 9.8 严重安全漏洞的,主要是靠运气,以及我对 xz 后门的看法
- xz 开源攻击的时间线
- 我所知道的有关 XZ 后门的一切
- XZ 后门 CVE-2024–3094
- Xz 后门凸显了开源软件的弱点及其优势
- 深入探究 XZ Utils 后门 — 哥伦比亚工程学院高级系统编程客座讲座
- 欧盟人工智能法案:第一部人工智能法规
- Slack AI 可通过提示注入的方式被诱骗泄露私人频道的数据
- 通过间接提示注入从 Slack AI 窃取数据
- GitHub 评论被滥用,通过 Microsoft repo URL 推送恶意软件
- 微软将员工奖金和晋升与安全绩效挂钩
- 微软被盗密钥比想象中更强大
RA/SD 衍生者AI训练营。发布者:chris,转载请注明出处:https://www.shxcj.com/archives/6121