Anaconda 发布 2022 年数据科学现状报告:Log4j 事件导致 OSS 项目减少了 25%

2022 年 11 月 14 日 InfoQ

作者 | Anthony Alford
译者 | 平川
策划 | 丁晓昀

Anaconda(专注于数据分析的 Python 发行版创建者)最近发布了一份关于数据科学现状调查结果的报告。该报告总结了来自 133 个郡县的近 3500 名学生、学者和专业人士的回复,内容涵盖受访者人口统计征、工作以及社区趋势等话题。

该报告是在 Anaconda 官方博客上发布的。这项调查从今年 4 月 25 日持续到 5 月 14 日,受访者来自社交媒体、Anaconda 网站和 Anaconda 电子邮件数据库。该调查从人口统计问题开始,然后转到职场话题,包括工作任务、工具以及这项工作的未来。该调查还深入研究了开源软件(OSS)在企业中的应用,特别关注贡献和安全问题。报告得出了多个重要结论,比如业界对数据科学人才短缺的担忧。

据 Anaconda 介绍:

与几年前一样,我们进行了一项调查,收集了社区的人口统计信息,看看社区是如何工作的,并收集了人们对于社区内关注度最高的重大问题和趋势的见解。由于新冠疫情的影响持续存在,逐渐融入了我们的新常态,所以我们决定不在报告中涉及新冠疫情主题,而是把重点放在数据科学、机器学习(ML)和人工智能行业内一些更具操作性的问题上,如开源安全、人才短缺、伦理和偏见等。

本报告分为以下几节。

  • 数据科学的面孔:关于受访者的人口统计数据。

  • 工作中的数据专业人士:关于工作环境的数据。

  • 开源在企业中的应用:对 OSS 的采用和贡献,以及对 OSS“供应链”的担忧。

  • Python 的普及程度:受访者采用各种编程语言的数据。

  • 数据工作及其未来:关于工作满意度、人才短缺和未来劳动力的数据。

  • 重大问题和趋势:对创新和政府参与的看法。

开源在企业中的应用一节反映出人们对于 OSS 项目安全性的担忧。特别是,最近的 Log4j 事件是一个“很有破坏性且影响深远的例子”,它导致近四分之一的受访者减少了 OSS 项目的使用。尽管大多数参与调查的公司仍在使用开源软件,但有近 8% 的公司没有使用,而这其中有超过一半的公司表示这是出于安全考虑,这比去年增加了 13%。调查结果还显示,公司鼓励他们为 OSS 做贡献的受访者数量同比下降了 13%。

重大问题和趋势一节探讨了几个主题,其中包括阻碍创新的因素。大多数人表示,在企业中,在工程和工具方面的人才短缺和投资不足是创新的最大障碍。也许是与担心人才短缺有关,受访者表示,AutoML 最重要的作用是使非专业人士能够训练模型,近 70% 的受访者认为政府应该为 STEM 教育提供更多的资金。

对于政府在科技领域的作用,行业分析师 Lawrence Hecht 在 Twitter 上参与了调查结果的讨论,他指出:

[受访者] 大多希望政府为他们提供资金。只有 35% 的人希望对大型科技公司进行监管。从后面的图表中可以更清楚地看出,对于人工智能和科技监管,人们并不希望采取任何具体的行动——更多的是一种普遍的担忧。

今年早些时候,InfoQ 报道了斯坦福大学发布的 2022 年人工智能指数报告。报告了人工智能的主要趋势,包括技术成果的进步,私人投资的急剧增加,以及对道德问题的更多关注。最近,人工智能投资者 Nathan Benaich 和 Ian Hogarth 发布了他们的第五份年度人工智能报告,内容涵盖了与人工智能研究、行业、政治和安全相关的问题。在 2022 年谷歌 Cloud Next 大会上,Kaggle 展示了他们的数据科学和机器学习现状调查结果,涉及来自 173 个国家的 23997 名受访者,调查问题涵盖了与受访者人口统计特征、编程语言和工具、机器学习和云计算相关的领域。

Anaconda 在 Anaconda Nucleus 网站上提供了调查过程中收集到的原始数据。

原文链接:

https://www.infoq.com/news/2022/11/anaconda-report-2022/

相关阅读:

MIT 发布网络安全零信任调查报告:零信任不是你想开就能开(https://www.infoq.cn/article/yxRL3v4LfwTEGBBujpTI)

Python 3.11 正式版来了,比 3.10 快 10-60%(https://www.infoq.cn/article/XahMWSZLXwqYo6TWKDvg)

声明:本文为InfoQ翻译,未经许可禁止转载。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

硅谷技术新焦点:摆脱缝合怪的多云设计,才是云计算的归宿

马斯克称 Twitter 可能破产;Meta 暴裁 1.1 万人,小扎承认犯了错;GitHub 年度报告:印度开发者增速超中国 | Q 资讯

动动嘴就能写代码了!Copilot测试新功能“嘿,GitHub”,告别键盘编码

再不拥抱Serverless就晚了 | Q推荐

登录查看更多
0

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
【硬核书】数据科学,282页pdf
专知会员服务
90+阅读 · 2022年11月29日
【AI与工业】2022最新发布《工业物联网AI框架》59页PDF
专知会员服务
142+阅读 · 2022年3月30日
《人工智能在无人机中的应用》报告,60页pdf
专知会员服务
153+阅读 · 2022年3月30日
数据与机器学习,人工智能报告
专知会员服务
98+阅读 · 2022年2月21日
Flutter 开发人员在用什么 IDE?
CSDN
0+阅读 · 2022年9月27日
无服务器和 Kubernetes 原生 Java 部署实践
InfoQ
0+阅读 · 2022年6月28日
CNCF 2021 年度调查报告发布
InfoQ
0+阅读 · 2022年2月14日
Log4j 漏洞还没忙完,新的漏洞又出现了!
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年1月9日
Arxiv
0+阅读 · 2023年1月7日
Arxiv
0+阅读 · 2023年1月7日
Arxiv
0+阅读 · 2023年1月7日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员