统计学和应用统计学哪个好1与统计学和应用统计学哪个好3区别


本回答由上海司尔亚司数据信息囿限公司提供


经济统计学和应用统计学哪个好一般是经济学硕士

统计学和应用统计学哪个好一般是理学硕士就是数学

应用统计学和应用統计学哪个好是专硕,分方向经济的比较多,有的学校偏工业或者药物统计之类的

下载百度知道APP,抢鲜体验

使用百度知道APP立即抢鲜體验。你的手机镜头里或许有别人想知道的答案


该文章原文出自微信公众号:大數据文摘原文链接
编译:周家乐、狗小白、蒋宝尚
统计学和应用统计学哪个好和机器学习之间的界定一直很模糊。
无论是业界还是学界┅直认为机器学习只是统计学和应用统计学哪个好批了一层光鲜的外衣
而机器学习支撑的人工智能也被称为“统计学和应用统计学哪个恏的外延”
例如,诺奖得主托马斯·萨金特曾经说过人工智能其实就是统计学和应用统计学哪个好,只不过用了一个很华丽的辞藻。
萨金特在世界科技创新论坛上表示人工智能其实就是统计学和应用统计学哪个好
当然也有一些不同的声音。但是这一观点的正反双方在争吵Φ充斥着一堆看似高深实则含糊的论述着实让人摸不着头脑。
一位名叫Matthew Stewart的哈佛大学博士生从统计与机器学习的不同;统计模型与机器学習的不同这两个角度论证了机器学习和统计学和应用统计学哪个好并不是互为代名词。
机器学习和统计的主要区别在于它们的目的
与大蔀分人所想的正相反机器学习其实已经存在几十年了。当初只是因为那时的计算能力无法满足它对大量计算的需求而渐渐被人遗弃。嘫而近年来,由于信息爆炸所带来的数据和算力优势机器学习正快速复苏。
言归正传如果说机器学习和统计学和应用统计学哪个好昰互为代名词,那为什么我们没有看到每所大学的统计学和应用统计学哪个好系都关门大吉而转投'机器学习'系呢因为它们是不一样的!
我經常听到一些关于这个话题的含糊论述,最常见的是这样的说法:
"机器学习和统计的主要区别在于它们的目的机器学习模型旨在使最准确嘚预测成为可能。统计模型是为推断变量之间的关系而设计的
虽然技术上来说这是正确的,但这样的论述并没有给出特别清晰和令人满意的答案机器学习和统计之间的一个主要区别确实是它们的目的。
然而说机器学习是关于准确的预测,而统计模型是为推理而设计幾乎是毫无意义的说法,除非你真的精通这些概念
首先,我们必须明白统计和统计建模是不一样的。统计是对数据的数学研究除非囿数据,否则无法进行统计统计模型是数据的模型,主要用于推断数据中不同内容的关系或创建能够预测未来值的模型。通常情况下这两者是相辅相成的。
因此实际上我们需要从两方面来论述:第一,统计与机器学习有何不同;第二统计模型与机器学习有何不同?
说的更直白些就是有很多统计模型可以做出预测,但预测效果比较差强人意
而机器学习通常会牺牲可解释性以获得强大的预测能力。例如从线性回归到神经网络,尽管解释性变差但是预测能力却大幅提高。
从宏观角度来看这是一个很好的答案。至少对大多数人來说已经足够好然而,在有些情况下这种说法容易让我们对机器学习和统计建模之间的差异产生误解。让我们看一下线性回归的例子
统计模型与机器学习在线性回归上的差异
或许是因为统计建模和机器学习中使用方法的相似性,使人们认为它们是同一个东西对这我鈳以理解,但事实上不是这样
最明显的例子是线性回归,这可能是造成这种误解的主要原因线性回归是一种统计方法,通过这种方法峩们既可以训练一个线性回归器又可以通过最小二乘法拟合一个统计回归模型。
可以看到在这个案例中,前者做的事儿叫"训练"模型咜只用到了数据的一个子集,而训练得到的模型究竟表现如何需要通过数据的另一个子集测试集测试之后才能知道在这个例子中,机器學习的最终目的是在测试集上获得最佳性能
对于后者,我们则事先假设数据是一个具有高斯噪声的线性回归量然后试图找到一条线,朂大限度地减少了所有数据的均方误差不需要训练或测试集,在许多情况下特别是在研究中(如下面的传感器示例),建模的目的是描述數据与输出变量之间的关系, 而不是对未来数据进行预测我们称此过程为统计推断,而不是预测尽管我们可以使用此模型进行预测,这吔可能是你所想的但评估模型的方法不再是测试集,而是评估模型参数的显著性和健壮性
机器学习(这里特指有监督学习)的目的是獲得一个可反复预测的模型。我们通常不关心模型是否可以解释机器学习只在乎结果。就好比对公司而言你的价值只用你的表现来衡量。而统计建模更多的是为了寻找变量之间的关系和确定关系的显著性恰巧迎合了预测。
下面我举一个自己的例子来说明两者的区别。我是一名环境科学家工作的主要内容是和传感器数据打交道。如果我试图证明传感器能够对某种刺激(如气体浓度)做出反应, 那么我将使鼡统计模型来确定信号响应是否具有统计显著性我会尝试理解这种关系,并测试其可重复性以便能够准确地描述传感器的响应,并根據这些数据做出推断我还可能测试,响应是否是线性的响应是否归因于气体浓度而不是传感器中的随机噪声?等等
而同时,我也可鉯拿着从20个不同传感器得到的数据, 去尝试预测一个可由他们表征的传感器的响应如果你对传感器了解不多,这可能会显得有些奇怪但目前这确实是环境科学的一个重要研究领域。
用一个包含20个不同变量的模型来表征传感器的输出显然是一种预测而且我也没期待模型是鈳解释的。要知道由于化学动力学产生的非线性以及物理变量与气体浓度之间的关系等等因素,可能会使这个模型非常深奥就像神经網络那样难以解释。尽管我希望这个模型能让人看懂, 但其实只要它能做出准确的预测我就相当高兴了。
如果我试图证明数据变量之间的關系在某种程度上具有统计显著性以便我可以在科学论文中发表,我将使用统计模型而不是机器学习这是因为我更关心变量之间的关系,而不是做出预测做出预测可能仍然很重要,但是大多数机器学习算法缺乏可解释性这使得很难证明数据中存在的关系。
很明显這两种方法在目标上是不同的,尽管使用了相似的方法来达到目标机器学习算法的评估使用测试集来验证其准确性。然而对于统计模型,通过置信区间、显著性检验和其他检验对回归参数进行分析可以用来评估模型的合法性。因为这些方法产生相同的结果所以很容噫理解为什么人们会假设它们是相同的。
统计与机器学习在线性回归上的差异
有一个误解存在了10年:仅基于它们都利用相同的基本概率概念这一事实来混淆这两个术语是不合理的。
然而仅仅基于这两个术语都利用了概率里相同的基本概念这一事实而将他们混为一谈是不匼理的。就好比如果我们仅仅把机器学习当作皮了一层光鲜外衣的统计,我们也可以这样说:
  • 物理只是数学的一种更好听的说法

  • 动物學只是邮票收藏的一种更好听的说法。

  • 建筑学只是沙堡建筑的一种更好听的说法

这些说法(尤其是最后一个)非常荒谬,完全混淆了两個类似想法的术语

实际上,物理是建立在数学基础上的理解现实中的物理现象是数学的应用。物理学还包括统计学和应用统计学哪个恏的各个方面而现代统计学和应用统计学哪个好通常是建立在Zermelo-Frankel集合论与测量理论相结合的框架中,以产生概率空间它们有很多共同点,因为它们来自相似的起源并运用相似的思想得出一个逻辑结论。同样建筑学和沙堡建筑可能有很多共同点,但即使我不是一个建筑師也不能给出一个清晰的解释,但也看得出它们显然不一样

在我们进一步讨论之前,需要简要澄清另外两个与机器学习和统计有关的瑺见误解这就是人工智能不同于机器学习,数据科学不同于统计学和应用统计学哪个好这些都是没有争议的问题,所以很快就能说清楚

数据科学本质上是应用于数据的计算和统计方法,包括小数据集或大数据集它也包括诸如探索性数据分析之类的东西,例如对数据進行检查和可视化以帮助科学家更好地理解数据,并从中做出推论数据科学还包括诸如数据包装和预处理之类的东西,因此涉及到一萣程度的计算机科学因为它涉及编码和建立数据库、Web服务器之间的连接和流水线等等。

要进行统计你并不一定得依靠电脑,但如果是數据科学缺了电脑就没法操作了这就再次说明了虽然数据科学借助统计学和应用统计学哪个好,这两者不是一个概念

同理,机器学习吔并非人工智能;事实上机器学习是人工智能的一个分支。这一点挺明显的因为我们基于以往的数据“教”(训练)机器对特定类型嘚数据进行概括性的预测。

在我们讨论统计学和应用统计学哪个好和机器学习之间的区别前我们先来说说其相似性,其实文章的前半段巳经对此有过一些探讨了

机器学习基于统计的框架,因为机器学习涉及数据而数据必须基于统计学和应用统计学哪个好框架来进行描述,所以这点十分明显然而,扩展至针对大量粒子的热力学的统计机制同样也建立在统计学和应用统计学哪个好框架之下。

压力的概念其实是数据温度也是一种数据。你可能觉得这听起来不合理但这是真的。这就是为什么你不能描述一个分子的温度或压力这不合悝。温度是分子相撞产生的平均能量的显示而例如房屋或室外这种拥有大量分子的,我们能用温度来描述也就合理了

你会认为热力学囷统计学和应用统计学哪个好是一个东西吗?当然不会热力学借助统计学和应用统计学哪个好来帮助我们理解运动的相互作用以及转移現象中产生的热。

事实上热力学基于多种学科而非仅仅统计学和应用统计学哪个好。类似地机器学习基于许多其他领域的内容,比如數学和计算机科学举例来说:

机器学习的理论来源于数学和统计学和应用统计学哪个好

机器学习算法基于优化理论、矩阵代数和微积分

機器学习的实现来源于计算机科学和工程学概念,比如核映射、特征散列等

当一个人开始用Python开始编程,突然从Sklearn程序库里找出并使用这些算法许多上述的概念都比较抽象,因此很难看出其中的区别这样的情况下,这种抽象定义也就致使了对机器学习真正包含的内容一定程度上的无知

统计学和应用统计学哪个好习理论——机器学习的统计学和应用统计学哪个好基础

统计学和应用统计学哪个好和机器学习の间最主要的区别在于统计学和应用统计学哪个好完全基于概率空间。你可以从集合论中推导出全部的统计学和应用统计学哪个好内容集合论讨论了我们如何将数据归类(这些类被称为“集”),然后对这个集进行某种测量保证其总和为/the-actual-difference-between-statistics-and-machine-learning-64b49f07ea3?gi=412e8f93e22e

我要回帖

更多关于 统计学和应用统计学哪个好 的文章

 

随机推荐