Github 2023年开源状况和人工智能的崛起

原文

Octoverse: The state of open source and rise of AI in 2023

前言

  2023 年,GitHub 数据凸显了另一种技术如何迅速开始重塑开发者体验:人工智能。越来越多的开发人员开始使用人工智能,同时也尝试构建人工智能驱动的应用程序

三大趋势:

  • 开发人员正在大量使用生成式人工智能进行构建,越来越多的开发人员尝试使用 OpenAI 和其他 AI的基础模型。根据开源生成式 AI 项目在 2023 年进入按贡献者数量计算的前 10 个最受欢迎的开源项目,几乎所有开发人员 (92%) 都在使用或试验借助 AI 编码工具。
  • 开发人员正在大规模运营云原生应用程序。使用基于 Git 的基础设施即代码 (IaC) 工作流程的声明性语言有所增加,云部署的标准化程度更高,开发人员使用 Dockerfile 和容器、IaC 和其他云原生的速度急剧增加。
  • 2023 年首次开源贡献者数量最多。商业支持的开源项目在首次贡献者和总体贡献中占据最大份额,但今年,生成式 AI 项目首次进入了贡献者最受欢迎的项目前 10。GitHub 上的私人项目显着增长,同比增长 38%,占 GitHub 上所有活动的 80% 以上。

开发者数量排名

  美国拥有 2020 万开发者,过去一年开发者增长 21%,继续拥有全球最大的开发者社区。亚太地区、非洲、南美洲和欧洲的开发者社区逐年扩大,其中印度、巴西和日本处于领先地位。

开发者TOP10

GitHub预测未来五年排名前 10 的开发者社区

开发者TOP10预测

亚太地区同比增长最快的开发社区

开发人员数量 同比增长
01 新加坡 >100 万开发者 39%
02 印度 >1320 万开发者 36%
03 香港(特别行政区) >160 万开发者 35%
04 越南 >150 万开发者 34%
05 印度尼西亚 >290 万开发者 31%
06 日本 >280 万开发者 31%
07 菲律宾 >130 万开发者 31%
08 泰国 >857K 开发者 25%
09 韩国 >190 万开发者 22%
10 澳大利亚 >140 万开发者 21%
  • 印度的开发者社区继续实现同比大幅增长。预计到 2027 年印度将取代美国成为 GitHub 上最大的开发者社区
  • 新加坡今年是亚太地区开发者人数增长最快的国家,并且以开发者占总人口的比例最高而位居全球第一。
    新加坡国立大学计算机学院将 GitHub 纳入其课程,高增长也可能归因于该国在东南亚的监管重要性。

非洲地区同比增长最快的开发社区

开发人员数量 同比增长
01 尼日利亚 >86.8 万名开发者 45%
02 加纳 >152K 开发人员 41%
03 肯尼亚 >29.6 万名开发人员 41%
04 摩洛哥 >446K 开发人员 35%
05 埃塞俄比亚 >94K 开发人员 32%
06 南非 >539K 开发者 30%
  • 肯尼亚,小学和中学必须教授编程

南美洲地区同比增长最快的开发社区

开发人员数量 同比增长
01 阿根廷 >925K 开发人员 33%
02 玻利维亚 >105K 开发人员 33%
03 哥伦比亚 >872K 开发者 31%
04 巴西 >430 万开发人员 30%
05 智利 >437K 开发人员 26%
  • 2023年,巴西的开发者人数是该地区最多的,并继续以两位数增长,同比增长30%

欧洲地区同比增长最快的开发社区

开发人员数量 同比增长
01 西班牙 >150 万开发者 25%
02 葡萄牙 >41 万开发人员 24%
03 波兰 >120 万开发者 24%
04 德国 >290 万开发者 22%
05 意大利 >110 万开发者 22%
06 法国 >230 万开发者 22%
07 英国 >340 万开发人员 21%

2023 年生成式 AI 爆发式增长

虽然生成式人工智能在 2023 年引起了轰动,但对于 GitHub 上的开发者来说,它并不是全新的。事实上,过去几年我们已经在 GitHub 上看到了几个生成式 AI 项目的出现,以及许多其他专注于 AI 的项目。但 2023 年的 GitHub 数据反映了这些人工智能项目如何从更面向专业的工作和研究发展到更主流的采用,开发人员越来越多地使用预先训练的模型和 API 来构建由人工智能驱动的生成应用程序。
就在去年过半的时候,2023 年的生成式 AI 项目数量是 2022 年全年的两倍多,这只是冰山一角。

  • 开发人员越来越多地尝试人工智能模型。在过去的几年里,开发人员使用tensorflow/tensorflow、pytorch/pytorch等机器学习库构建项目,而现在更多的开发人员尝试使用AI模型和LLM(例如ChatGPT API)。

  • 保持聪明:预计企业和组织也将利用预先训练的人工智能模型,特别是随着越来越多的开发人员熟悉如何使用它们进行构建。

  • 开源人工智能创新多种多样,顶级人工智能项目由个人开发者拥有。分析 GitHub 上排名前 20 的开源生成式 AI 项目,其中一些顶级项目归个人所有。这表明 GitHub 上的开源项目继续推动创新,并向我们所有人展示行业的未来发展,社区围绕最令人兴奋的进步而构建。

  • 生成式人工智能正在推动生成式人工智能项目的个人贡献者在全球范围内大幅增长,同比增长 148%,生成式人工智能项目总数也同比增长 248%。值得注意的是,美国、印度和日本在开发者社区中处于领先地位,其他地区(包括香港特别行政区)、英国和巴西紧随其后。

生成式人工智能项目

生成式人工智能会对开发者产生什么影响?

今年早些时候,我们与哈佛商学院和 Keystone.AI 合作,围绕人工智能对开发者环境产生的经济和生产力影响进行了一些研究。我们发现的一项更引人注目的关键发现是,到 2030 年,开发人员将从生成式 AI 中受益的生产力提升预计可为全球经济贡献 1.5 万亿美元,并为全球新增 1500 万“有效开发人员” 。

在过去的一年里,基于基础模型(例如 ChatGPT)构建的应用程序呈指数级增长,因为开发人员使用这些 LLM 来开发面向用户的工具,例如 API、机器人、助手、移动应用程序和插件。全球开发人员正在帮助为主流采用奠定基础,而实验正在帮助组织建立人才库。

最流行的编程语言

最流行的编程语言

JavaScript 再次夺得第一大最受欢迎语言的桂冠,并且我们继续看到 Python 和 Java 等熟悉的语言逐年保持在前五名语言之列。

TypeScript 越来越受欢迎。今年,TypeScript 首次取代 Java,成为 GitHub 上 OSS 项目中第三大最受欢迎的语言,其用户群增长了 37%。 TypeScript 是一种集语言、类型检查器、编译器和语言服务于一体的语言,它于 2012 年推出,标志着渐进类型的到来,它允许开发人员在代码中采用不同级别的静态和动态类型。

总结

  • GitHub 是生成式 AI 的开发者平台。生成式 AI 将于 2023 年从专业领域发展成为主流技术,开源活动的爆炸式增长反映了这一点。随着越来越多的开发人员构建和试验生成式 AI,他们正在使用 GitHub 进行协作和集体学习。
  • 开发人员正在 GitHub 上大规模运行云原生应用程序。 2019 年,我们开始看到开源中使用基于容器的技术的开发人员数量大幅增加,并且越来越多的开发人员使用基于 Git 的 IaC 工作流程、容器编排和其他云原生技术的速度急剧增加2023 年。如此大量的活动表明开发人员正在使用 GitHub 来标准化他们将软件部署到云的方式。
  • GitHub 是开源社区、开发人员和公司构建软件的地方。 2023 年,私有存储库的数量增加了 38%,占 GitHub 上所有活动的 81% 以上。但开源社区持续增长,他们使用 GitHub 来构建未来并推动行业向前发展。数据显示新的开源开发人员的增加以及开放社区可能实现的快速创新步伐,很明显开源从未如此强大。

Github 2023年开源状况和人工智能的崛起
http://example.com/2024/04/08/ai-git2023报告/
作者
Liu XinWei
发布于
2024年4月8日
许可协议