关于数据科学和编程的 10 篇精彩文章!
1. 企业为何在机器学习方面失败
2. R 与 Python:有什么区别?
3. 自动机器学习:学习如何学习
4. 如何使用 GitHub Pages 轻松免费创建网站
5. 我如何训练人工智能玩雅达利太空侵略者
6. 为什么模型可解释性是下一个数据科学超级力量
7. 平台模式为何失效
8. 每位数据科学家都应该学习的 4 项必备技能
9. 如何使用 Dash 和 Plotly 构建报告仪表板
10. 一切皆自然:深入探究自然梯度优化
随着计算能力、知识库和最佳实践的不断改进,数据科学和编程这两个主题也不断扩展和发展。这使得跟上所有新文章和思想体系变得非常困难。因此,我们整理了一份清单,列出了过去一年左右我们或其他人喜欢的 10 篇关于编程、数据科学和机器学习的文章。希望它们能为您提供新的视角和实用的建议。
1. 企业为何在机器学习方面失败
作者: Cassie Kozyrkov
想象一下,雇佣一位厨师为你打造烤箱,或者雇佣一位电气工程师为你烤面包。说到机器学习,我看到企业一次又一次地犯下这样的错误。
如果您要开一家面包店,聘请一位经验丰富的面包师,精通制作美味面包和糕点的每一个细节,无疑是个好主意。您还需要一台烤箱。虽然烤箱至关重要,但我敢打赌,您不会让顶级糕点师负责制造烤箱;那么,您的公司为什么要专注于机器学习呢?
你是做面包的吗?还是做烤箱的?
2. R 与 Python:有什么区别?
穆阿迈尔·侯 赛因诺格鲁
随着大数据、机器学习和数据科学在软件行业或软件服务公司中的重要性日益增长,两种语言已成为开发人员最青睐的语言。R 和Python已成为数据科学家和数据分析师最喜爱的两种语言。这两种语言既相似又不同,这使得开发人员难以从中选择出最适合自己的语言。
3. 自动机器学习:学习如何学习
这篇论文介绍了 AlphaD3M,这是一个自动机器学习 (AutoML) 系统,其目标是学习如何通过自我对弈进行学习。AlphaD3M 名称中的“D3M”源自 DARPA 的数据驱动模型发现 (D3M) 项目,该项目推动机器学习朝着解决任何用户指定任务和给定任何数据集的方向发展。这超越了传统的 AutoML 的思维模式,即 AutoML 只需给定数据集、明确定义的任务和性能标准即可完成任务。
4. 如何使用 GitHub Pages 轻松免费创建网站
你是否需要一份在线作品集供潜在雇主查看,但却不知道如何创建网站?你是否想创建博客或商业网站,却不知从何入手?你是否只是不想处理(或支付)网站托管、域名以及其他一切费用?
5. 我如何训练人工智能玩雅达利太空侵略者
作者: Vedant Gupta
每个人都在谈论人工智能与人类智能之间的竞争。人工智能何时才能完全超越人类的能力,掌控我们日常生活的大部分事务?当人类每天都在上学、学习时,人工智能在做什么来获得竞争优势?人工智能需要加把劲!
6. 为什么模型可解释性是下一个数据科学超级力量
有些人认为机器学习模型就像黑匣子,可以用来做预测,但除此之外,它们难以理解;但最优秀的数据科学家知道如何从任何模型中提取现实世界的洞见。对于任何给定的模型,这些数据科学家都能轻松回答以下问题:
- 模型认为数据中的哪些特征最重要?
- 对于模型的任何单个预测,数据中的每个特征如何影响该特定预测
- 特征之间的哪些相互作用对模型的预测影响最大
7. 平台模式为何失效
莱昂内尔 ·马丁
几年前,一场疫情重创了我们。当时,每家初创公司都在为这个或那个打造Airbnb或Uber。科技行业坚信,初创公司只有看起来像一个平台,只有立志成为下一个Facebook,才有价值。
在Airbnb、Uber、亚马逊、Facebook和eBay等巨头取得成功的推动下,我们的行业将每个商业案例都强行塞入平台商业模式。这成了默认模式。不幸的是,这种神经质仍然根深蒂固地存在于我们的文化中。
8. 每位数据科学家都应该学习的 4 项必备技能
作者: Ben Rogojan
我们想延续上一篇关于如何 成长为数据科学家的文章 ,探讨高级数据科学家应具备的其他技能。我们希望通过为 高级数据科学家设定清晰的目标,弥合业务经理和技术数据科学家之间的差距 。这两个实体需要处理截然不同的问题。当他们达成共识时,双方都能从中受益。这就是为什么上一篇文章如此强调沟通的原因。这看似简单,但随着新技术每年不断涌现,技术和业务之间的差距也在不断扩大。因此,我们认为,让经理和数据科学家明确各自的期望至关重要。
9. 如何使用 Dash 和 Plotly 构建报告仪表板
大卫 ·康福特
我将报告仪表板构建为多页应用,以便将其拆分成不同的页面,从而减少繁琐,并以有序的方式呈现数据。每个仪表板页面上都有两个数据表、一个日期范围选择器、一个数据下载链接,以及两个仪表板下方的一组图表。在构建仪表板的过程中,我遇到了一些技术挑战,我将详细描述我是如何克服这些挑战的。
10. 一切皆自然:深入探究自然梯度优化
作者: Cody Marie Wild
就一阶近似而言,所有现代深度学习模型都使用梯度下降法进行训练。在梯度下降的每一步,你的参数值都从某个起始点开始,并朝着损失减少最大的方向移动。你可以通过对损失函数求导来实现这一点,这个导数也称为雅可比矩阵。然而,这只是损失函数的一阶导数……
鏂囩珷鏉ユ簮锛�https://dev.to/seattledataguy/10-great-articles-on-data-science-and-programming-1d95