入门机器学习需要会哪些编程语言

每天三分钟,知晓天下事,视频、语音、文字综合版任您挑!微信搜索fgzadmin关注或点击标题下方可以快速关注。
原创不易,认可价值,动手指点并转发,就是最好的支持与肯定。淘宝特约店址:http://goldengame.
深夜十点,陪你读书。
慢工出细活
由于中、美、俄三国自2008年后基本上长期上演“三国杀”(昨天文章《原创丨中美俄世纪三国杀,谁是百年长跑冠军
其实这是个有奖活动贴。n其实这是个有奖活动贴。n其实这是个有奖活动贴。
思考者正在阅读原创丨三次世界大战亚洲开打,美国推演靠谱吗?原创丨央行连出两大招,有何深意?微历史丨张学良为啥
美国总统奥巴马日在接受媒体采访时表示,2011年对利比亚局势的干涉,是其总统生涯中做出的最
我们都知道,美国软实力很厉害,在过去很多年都一直掌控者国际话语权,他们可以提着民主、自由、人权的大棒满世界乱
思考者正在阅读原创丨重大变革,我们的世界都将逃不过被TA重塑!原创丨中美黄岩岛较量,谁是最后赢家?原创丨你射7个步骤掌握使用python进行机器学习
7个步骤掌握使用python进行机器学习
7个步骤掌握使用python进行机器学习
有许多python机器学习资源在线免费提供.从哪开始?如何进行?从零到python机器学习大神只要7个步骤.
作者Matthew Mayo.发表于KDnuggests.
入门.在英语中最打击人的两个单词.第一部往往是最难的,当在这方面有太多选择,通常让人崩溃.
这篇文章旨在用7个不走带领python机器学习知识最少的新人成为知识渊博从业者,使用免费材料和资源.这个纲要主要目标是帮你选择可用的众多选项.可以确定有很多,但是哪个是最好的?它们之间是相辅相成?使用选择资源的最好顺序是什么?
进一步,我做出假设你不是下列的专家:
任何Python的机器学习,科学计算,或者数据分析库
他有可能帮助你对第一或第二或二者有一个基本的认识,但不是必需的.在前面的步骤花费一些额外的时间有可能弥补.
第一步 基本Python技能
如果我们打算利用Python进行机器学习,对Python有一些基本认识是至关重要的.幸运的是,由于其作为一种广泛普及的通用编程语言,并应用于科学计算和机器学习,发现初学者的教程并不困难.Python经验和编程水平一般是选择出发点的重点.
首先,你需要安装Python.因为在有些时候我们需要使用科学计算和机器学习库,我建议你安装Anaconda.这是一个具有工业强度用于Linux,OSX和Windows的Python实现,为机器学习安装需要的包,包括Numpy,scikit-learn和Matplotlib(这是作者的观点,我认为pandas,scipy这种包也是必不可少的).它同样包含Ipython notebook,一个交互式环境.我建议使用Python2.7(译者言:当全世界都是3.X的时候再说改Python3吧),它仍是占主导地位的安装版本没有其他原因.
如果你没有编程知识,我的建议是用下面免费的在线书开始,然后学习随后的材料.
by Zed A. Shaw
如果你有变成经验,但是不是Python,或者你刚学Python,我建议学习下面其中一个或全部:
(视觉学习者强烈推荐,五星好评)
by M. Scott Shell (神奇的Python科学介绍,60页)
对于那些寻求Python30分钟速成班的可以去(某宝):
当然,如果你有Python编程经验,你可以跳过这步.即使这样,我建议你继续阅读Python文档.
第二步 基础机器学习技能
KDnuggets’的创始人 Zachary Lipton指出人们对数据科学家的认识非常不同.实际上是机器学习领域的反映,因为数据科学家的工作包含使用机器学习算法多样化程度.是否有必要深刻了解算法,从而更有效的创建SVM机器模型并从中获取信息?当然不是,就像生活中几乎所有东西,理论理解的深度的要求相对与实际应用(这是作者的一家之言哈~,译者是不支持的,不了解你怎么调参,优化模型呢?哈~).获得机器学习算法的深刻理解已经超出了本书范围,一般需要大量的时间投资在学术中,或者通过高强度的自学.
好消息是你不需要拥有PhD水平的机器学习理论方面的理解,才能用于实践.并不是所有码农都为了有效的编码需要理论的计算机科学教育.这两点是相同的(所以我翻译的是码农.对,我就是在吐槽~自己. :( ).
Andrew Ng的Course课程经常获得五星好评.但是我的建议是,浏览在线课程以前学生编制的课程笔记.跳过关于Octave的笔记(类似Matlab语言,和我们追求的Python无关.译者注,从用词上我就能感到作者对Matlab弄弄的厌恶).但是要注意这些不是官方的笔记,但是似乎能捕获Andrew Ng课程材料的相关内容.当然,如果你有时间和兴趣,可以参加.
如果你喜欢各种视频讲座,可以看Tom Mitchell的演讲视频.下面是是他最近的演讲视频,我(不是我)感觉他非常平易近人,我是他的脑残粉(没搞错的话,网上流行的台湾国立大学的机器学习视频是模仿Tom Mitchell的,Logo都差不多就左下角右上角加了个东西.是的,我又在吐槽了).
在这里,你不需要所有笔记和视频.一个有效的策略包含实战演练,适当时候参考上面笔记和视频.例如,当你遇到回归模型是现实,阅读Ng笔记的回归部分或看Mtichell的回归视频.
第三步 科学Python库概率
好吧.有了一点Python编程经验和机器学习理解后.除了Python还有很多开源的库用于处理机器学习实践.通常,这些是执行基本机器学习任务主要使用的Python库.
- N维数组是非常有用的
- Python数据分析库,包括结构例如dataframes
- 2D 绘图库生成出版质量图片
- 用于数据分析和数据挖掘任务的机器学习算法.
学习这些的优秀资料如下:
by Ga?l Varoquaux, Emmanuelle Gouillart, and Olav Vahtras
这个pandas的教程非常棒:
在下面的教程中你可能看到一些其他的库,比如说 Seaborn,一个基于Matplotlib的数据可视化库.上述包是广泛Python机器学习任务的核心,然而,让你在下面引用时,理解这些适应更多相关的包而不会懵.
第四步 开始Python机器学习
Python. √
Machine learning fundamentals. √
Pandas. √
Matplotlib. √
吉时已到,我们开始使用python标准机器学习库–scikit-learn实现机器学习算法吧.
下面大多数教程和联系都在IPython(Jupyter)Notebook中实现.它是Python执行的一个交互式环境.这些IPython NOtebook可以选择在线预览或下载,并且在你电脑本地交互.
from Stanford
另外请注意,下面教程来源于许多在线资源.所有Notebooks 都归功于作业,你发现没有正确工作,请让我知道,这种情况会尽快纠正.我非常想向Jake VanderPlas, Randal Olson, Donne Martin, Kevin Markham, and Colin Raffel等人致敬.因为他们神奇免费可用的资源(50字好评已给,请返现).
第一个教程从scikit-learn开始,在开始下面步骤之前,我建议先做这些.
scikit-learn库的一般介绍,Python中最常用的机器学习库,涵盖了KNN算法:
by Jake VanderPlas
更深入的介绍,包括知名数据集开始到项目完成:
by Randal Olson
重点放在scikit-learn中不同模型的评估策略,涵盖了训练集/测试集拆分(后面这句话的点没get到呢):
by Kevin Markham
第五步 python机器学习主题
有了 scikit-learn基础后,我们可以对常见,实用的算法做进一步深入了解.我们从K-means聚类开始,一个广为人知的机器学习算法.解决无监督学习问题一个简单有效的方法:
by Jake VanderPlas
接下来,我们看看分类问题.了解历史上最流行分类算法之一:
via The Grimm Scientist
让我们看看连续数值预测:
by Jake VanderPlas
我们可以从过Logistic回归解决分类问题:
by Kevin Markham
第六步 深入python机器学习主题
我们已经开始scikit-learn,现在让我们将注意转向高级主题.首先SVM(支持向量机).一个将复杂数据映射到高维空间的not-necessarily-linear分类
by Jake VanderPlas
接下来,随机森林,一个组合分类,通过考察Kaggle Titanic竞赛逐步引导:
by Donne Martin
降维是减少正在考虑问题中变量数目的方法.PCA(Principal Component Analysis,主成分分析)是一种非监督的降维方法:
by Jake VanderPlas
在进入到最后一步之前,我们可以花时间考虑下,我们已经在相对较短的时间内走了很长一段路.
使用Python和它的机器学习库,我们已经介绍一些最常见和总所周知的机器学习算法(K-means,支持向量机,KNN),考察了强大的组合技术(随机森林),研究了支持任务的额外机器学习算法(降维,模型验证技术).随着这些基础的机器学习技巧的学习,我们已经拥有了一些使用的技能.
第七步 python深度学习
深度学习无处不在.深度学习构建与神经网络研究可以追溯到十几年前,但是追溯到过去几年的最新进展显著增加.如果你不熟悉深度学习,KDnuggets有很多文教详细介绍了众多最新创新,成就和令人赞誉的技术.
最后一步并不对深度学习软件分类,介绍2个引领当代Python深度学习库的几个简单的网络实现.对于有兴趣挖掘更深的深度学习者,我建议你先从一下免费书开始:
by Michael Nielsen
Theano是第一个Python深度学习库,按作者的话来说:
Theano是一个python的库,可以让你高效地定义,优化,评估包含多维数据的数学表达式.
下面Theano的机器学习入门教程是非常长的,但相当的棒,十分生动:
by Colin Raffel
另一个测试执行的库,caffe.同样的:
Caffe是一个带有表达式,速度和模块化的深度学习库.由 Berkeley Vision and Learning Center (BVLC) 和社区贡献者开发.
我们已经介绍了很多有趣的例子,这里再给出一个, 用Caffe实现.了解了这么多,自己动手放飞梦想吧(另外,关于深度学习的开源软件非常多,更多的可以看的翻译的).
我没不能保证这个过程会很快或很容易,但如果你把时间按照上面的7个步骤做,没有任何理由,你不能达到合理水平,理解一些机器学习算法并利用Python流行的库实现它,包括一些目前的深度学习研究前沿。
我的热门文章
即使是一小步也想与你分享利用Python,四步掌握机器学习 - Python - 伯乐在线
& 利用Python,四步掌握机器学习
为了理解和应用机器学习技术,你需要学习 Python 或者 R。这两者都是与 C、Java、PHP 相类似的编程语言。但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得简单一些。相对于R 只用于处理数据,使用例如机器学习、统计算法和漂亮的绘图分析数据, Pthon 的优势在于它适用于许多其他的问题。因为 Python 拥有更广阔的分布(使用 Jango 托管网站,自然语言处理 NLP,访问 Twitter、Linkedin 等网站的 API),同时类似于更多的传统语言,比如 C python 就比较流行。
在Python中学习机器学习的四个步骤
1、首先你要使用书籍、课程、视频来学习 Python 的基础知识
2、然后你必需掌握不同的模块,比如 Pandas、Numpy、Matplotlib、NLP (自然语言处理),来处理、清理、绘图和理解数据。
3、接着你必需能够从网页抓取数据,无论是通过网站API,还是网页抓取模块Beautiful Soap。通过网页抓取可以收集数据,应用于机器学习算法。
4、最后一步,你必需学习机器学习工具,比如 Scikit-Learn,或者在抓取的数据中执行机器学习算法(ML-algorithm)。
1.Python入门指南:
有一个简单而快速学习Python的方法,是在
注册,然后开始编程,并学习 Python 基础知识。另一个学习Python的经典方法是通过
,一个为广大 Python 编程者所推荐的网站。然后还有一个优秀的 PDF,
。python社团还为初学者准备了一个Python资源列表。同时,还有来自 O’Reilley 的书籍 《Think Python》,也可以从这里免费 。最后一个资源是 Python 用于计量经济学、统计学和数据分析的介绍:《 》,其中也包含了 Python 的基础知识。
2.机器学习的重要模块
关于机器学习最重要的模块是:, ,
。有一本书涵盖了其中一些模块:《》 。然后来自于1.的免费书籍《》,同时也包括 Numpy,Pandas,Matplotlib 和 IPython这几个模块。还有一个资源是 ,也包含了一些很重要的模块。以下是其他免费模块的相关链接: Numpy (, , ),
Pandas (,,)
3.从网站通过API挖掘和抓取数据
一旦理解了Python的基础知识和最重要的模块,你必需要学习如何从不同的源收集数据。这个技术也被称作网页抓取。传统的源是网站文本,通过API进入twitter或linkedin一类网站得到的文本数据。网页抓取方面的优秀书籍包括:《 》 (免费书籍),《》 和《 》。
最后这个文本数据必须要转换为数值数据,通过自然语言处理(NLP)技术完成,
上面有相应的资料。其它的数据包括图片和视频,可以使用计算机图像技术分析: ,
,这些是图片分析方面的典型资源。
以下例子中包括可以用基本的Python命令行实现,有教育意义,而且有趣的例子,以及网页抓取技术。
(微型教程:使用Python保存推文到数据库)
(网页抓取关键数据科学工作技巧)
(案例学习:电影评论中的情感分析)
(第一网页抓取)
(邮件的情感分析)
(简单文本分类)
(Python基础情感分析)
(使用Python和NLTK 做Twitter情感分析)
(第二个尝试:Python情感分析)
(电影评论相关Kaggle Competition中的NLP自然语言处理)
4. Python 中的机器学习
机器学习可以分为四组:分类,聚类,回归和降维。
“分类”也可以称作监督学习,有助于分类图片,用来识别图片中的特征或脸型,或者通过用户外形来分类用户,并给他赋不同的分数值。“聚类”发生在无监督学习的情况,允许用户在数据中识别组/集群。“回归”允许通过参数集估算一个值,可以应用于预测住宅、公寓或汽车的最优价格。
罗列了 Python、C、Scala、Java、Julia、MATLAB、Go、R 和 Ruby等语言中所有学习机器学习的重要模块、包和技巧。有关Python机器学习的书籍,我特别推荐《》。尽管有点短,但它很可能是机器学习中的经典,因为它提到了“集体智慧编程时代”:。这两本书帮助你通过抓取数据建立机器学习。最近关于机器学习的出版物大多都是基于模块 scikit-learn 。由于所有的算法在模块中都已实现,使得机器学习非常简单。你唯一要做的事就是告诉 Python ,应该使用哪一个机器学习技巧 (ML-technique) 来分析数据。
可以在 scikit-learn 官方网站上找到。其他的帖子可以通过以下链接获取:
(机器学习中 Python 和 Scikit-Learn 的介绍)
(Python 中的数据科学)
(用机器学习来预测坏账)
(通过机器学习来分类文本的通用架构)
(利用 Python 和 AI 人工智能来预测酒的品种)
(应用机器学习的建议)
(使用 scikit-learn 预测用户流失)
(映射你的音乐收藏)
(Python 中的数据科学)
(案例学习:电影评论中的情感分析)
(Python中的文档聚类)
(5 个最流行的Python相似度测量的实现)
(案例学习:电影评论中的情感分析)
(将会是 Python 么?)
(机器学习中的文本处理)
(使用色彩灯光秀和实时机器学习黑入史诗级 NHL(北美冰球联赛)进球庆祝)
(温哥华房间价格)
(探索和预测大学教师工资)
(预测航班延误)
关于机器学习和 Python 中模块 scikit-learn 的书籍:
新闻网站上的书籍)
(用 Python 建立机器学习系统)
(用 Python 建立机器学习系统,第二版)
(学习 scikit-learn:Python 中的机器学习)
(透视机器学习算法)
(抓取的数据科学——关于 Python 的首要原则)
(Python 中的机器学习)
接下来数月将要发行的书籍包括:
《》 (Python 机器学习的介绍)
《》 (思考 Python 机器学习:接近测试驱动)
机器学习相关的课程和博客
你想要得到一个学位,加入在线课程,或者参加线下讲习班、大本营或大学课程么?这里有一些关于逻辑分析、大数据、数据挖掘和数据科学的在线教育站点链接: 。另外推荐一些在线课程–来自Udacity的Coursera 课程:
和 。还有一些关于机器学习的博客列表:。
最后是来自 Jake Vanderplas 和 Olivier Grisel,关于探索机器学习的优秀 。
机器学习理论
想要学习机器学习的理论?那么,《》和《 》 是常常被引用的经典。然后还有另外两本书籍:《 》和《 》。这些链接包括免费的PDF,你不需要付费!如果不想阅读这些书籍,请观看视频:!
关于作者:
可能感兴趣的话题
关于 Python 频道
Python频道分享 Python 开发技术、相关的行业动态。
新浪微博:
推荐微信号
(加好友请注明来意)
– 好的话题、有启发的回复、值得信赖的圈子
– 分享和发现有价值的内容与观点
– 为IT单身男女服务的征婚传播平台
– 优秀的工具资源导航
– 翻译传播优秀的外文文章
– 国内外的精选文章
– UI,网页,交互和用户体验
– 专注iOS技术分享
– 专注Android技术分享
– JavaScript, HTML5, CSS
– 专注Java技术分享
– 专注Python技术分享
& 2017 伯乐在线机器学习小白,学了高等数学,线性代数,概率论,请教大神们还需要继续学习什么数学学科?
李航的《统计学习方法》、《概率论》、《矩阵论》、《离散数学》、《数学分析》,看完几本上不怂不怂。。。
已被提问者采纳
你还没有登录,请先登录或注册慕课网帐号
心性是取得成功的关键因素。
可以这么回答楼主,机器学习作为大数据科技重要的一环,数学理论基础自然是必不可少的。像楼主学的这些数学确实都是机器学习的基础课程,而且是必不可少的。本人再建议楼主不一定非要局限在数学资料上去学习机器学习,这样楼主只能看到其微观而忽略了宏观框架。建议楼主可以买一本数据挖掘相关的书籍和机器学习的书籍一起看,因为数据挖掘不一定用到机器学习,但是机器学习一定会用到数据挖掘的算法,这两者往往息息相关。边学楼主自然就知道还需要哪些数学知识来支撑。最后再建议楼主学学Java还有Python,这两门编程语言是机器学习的利器。加油!
你还没有登录,请先登录或注册慕课网帐号
李航的《统计学习方法》、《数学之美》、《概率论》
你还没有登录,请先登录或注册慕课网帐号
希望掌握更多的Tech Stack技术栈
离散数学,算法也看看吧
你还没有登录,请先登录或注册慕课网帐号
12958人关注
2925人关注
8654人关注
Copyright (C)
All Rights Reserved | 京ICP备 号-2

我要回帖

 

随机推荐