Location
咨询电话

400 6890 958

强烈推荐的第三类工具

2021-12-29 15:31:27

浏览量

  数据挖掘技术越来越成熟和复杂。随着互联网的发展和大量数据的到来,传统的依靠spss、sas等可视化工具实现数据挖掘建模已经越来越不能满足日常需求。根据美国对数据科学家的要求,要成为真正的数据科学家,编程实现算法和编程实现建模是必要条件;目前,许多从事数据挖掘的人大多来自非计算机专业,编程基础相对较低。因此,找到快速高效的编程语言非常重要。好的工具和编程语言可以事半功倍,下面介绍一下数据分析师用的几种工具。

  目前数据挖掘算法中最常用的编程语言有:Java、C++、C、Python、R等。

  由于作者本人来自数学统计学,复杂而先进的语言对我来说并不划算,所以我想从Java、C++和C开始学习,浪费的时间和精力显然与收获不成正比。所以Python和R语言已经成为最好的选择。对于与我背景相似的数据从业者,我强烈建议从两者中选择一种。

  R和Python是我想讨论的第三类工具。虽然像Excel和BI工具这样的软件已经尽力考虑到大多数应用场景的数据分析,但它们基本上是定制的。如果软件没有设计功能或为功能开发按钮,你可能无法使用它们来完成工作。

  在这一点上,编程语言是不同的。它非常强大和灵活。您可以编写代码执行所需的任何操作。例如,R和Python是数据科学家必不可少的工具。从专业的角度来看,它们绝对比Excel和BI工具更强大。