WordPress默认模板做的站,物联网工程是学什么,建设银行手机银行下载官方网站下载,搭建手机网站摘要#xff1a; 机器学习之旅必了解#xff1a;前20名Python人工智能和机器学习开源项目#xff01;
如今机器学习和人工智能已经变得家喻户晓#xff0c;有很多爱好者进入了该领域。但是#xff0c;什么才是能够进入该领域的正确路径呢#xff1f;如何保持自己跟上该领…摘要 机器学习之旅必了解前20名Python人工智能和机器学习开源项目
如今机器学习和人工智能已经变得家喻户晓有很多爱好者进入了该领域。但是什么才是能够进入该领域的正确路径呢如何保持自己跟上该领域的发展步伐呢
为了解决以上两个问题可以通过利用高级专业人员每天使用的众多开源项目和工具与社区进行接触。
如今Tensorflow的贡献者人数增长最快居首位。Scikit-learn下降到第二位但仍有非常大的贡献者群体。
与2016年相比贡献者人数增长最快的项目是
TensorFlow提高了169%从493个增加到1324个贡献者。Deap提高了86%从21个增加到39个贡献者。Chainer,提高了83%从84个增加到154个贡献者。Gensim,提高了81%从145个增加到262个贡献者。Neon提高了66%从47个增加到78个贡献者。Nilearn提高了50%从46个增加到69个贡献者。
2018年新晋的两个项目的贡献者人数
Keras,626名贡献者。Pytorch,399名贡献者。图1Github上的前20名Python人工智能和机器学习项目
上图雪花大小与贡献者的数量成正比颜色代表贡献者数量的变化-红色越高蓝色越低。雪花形状适用于深度学习项目适用于其他项目。
下面的列表根据Github上贡献者的数量将项目从高到低进行排列。贡献者人数的变化与2016年KDnuggets发布的前20名Python机器学习开源项目相对。
1.TensorFlow最初是由谷歌机器智能研究机构的Goole Brain Team的研究人员和工程师开发的。该系统旨在促进机器学习方面的研究并使其快速、容易的从研究原型过渡到生产系统。
贡献者1324上升168%提交28476Stars92359.Github网址:Tensorflow。
2.Scikit-learn是用于数据挖掘和数据分析的简单而高效的工具基于NumPySciPy和matplotlib,开源商业可用-BSD许可证可供所有人访问并且可在各种环境中重复使用。
贡献者1019上升39%提交22575Github网址Scikit-learn。
3.Keras是一种高级神经网络的API用Python编写能够在TensorFlow,CNTK或Theano上运行。
贡献者629(新提交4371Github网址Keras。
4.PyTorch、张量Tensor和动态神经网络(Dynamic neyral networks)在Python中具有强大的GPU加速。
贡献者399新提交6458Github 网址pytorch。
5.Theano允许你定义、优化和评估涉及多维数数组的数学表达式。
贡献者327上升24%提交27931Github网址Theano。
6.Gensim是一个免费的Python库具有可扩展的统计语义用于分析语义结构的纯文本文档检索语义相似的文档。
贡献者262上升81%提交3549Github网址Gensim
7.Caffe是一个深度学习框架它的表达、速度和模块化都是在头脑中形成的。它由伯克利视觉和学习中心BVLC和社区贡献者开发。
贡献者260上升21%提交4099Github网址Caffe。
8.Chainer是一个基于Python的深度学习模型的独立开源框架。Chainer提供灵活、直观和高性能的手段来实施全方位的深度学习模型包括最新的模型如递归神经网络和变分自动编码器。
贡献者154上升84%提交12613Github网址Chainer。
9.Statsmodels是一个Python模块允许用户探索数据估计统计模型并执行统计测试。描述统计、统计测试、绘图功能和结果统计的广泛列表适用于不同类型的数据和任意一个估算器。
贡献者144上升33%提交9729Github网址Statsmodels。
10.Shogun是机器学习工具箱它提供了广泛的统一和高效的机器学习ML方法。该工具箱可以无缝地组合多个数据表示、算法类和通用工具。
贡献者139上升32%提交16362Github网址Shogun。
11.Pylearn2是一个机器学习库。其大部分功能都建立在Theano之上。这意味着你可以使用数学表达式编写Pylearn2插件新模型、算法等Theano将为你优化和稳定这些表达式并将它们编译为你选择的后端CPU或GPU。
贡献者119(上升3.5%提交7119Github网址Pylearn2。
12.NuPIC是一个开源项目它基于被称为分层时间存储器HTM的新大脑皮层理论。部分HTM理论已经在应用中实施、测试和使用而HTM理论的其他部分仍在开发中。
贡献者85上升12%提交6588Github网址NuPIC。
13.Neon是Nervana基于Python的深度学习库。它提供易用性同时提供最高的性能。
贡献者78%上升66%,提交1112Github网址Neon。
14.Nilearn是一个Python模块用于快速简单的统计学习神经成像数据。它利用scikit-learn Python工具箱进行多变量统计并提供预测建模分类解码或连接分析等应用。
贡献者69上升50%提交6198Github网址Nilearn。
15.Orange3是新手和专家的开源机器学习和可视化数据。使用大型工具箱交互式数据分析工作流程。
贡献者53上升33%提交8915Github网址Orange3。
16.Pymc是一个python模块实现贝叶斯统计模型和拟合算法包括马尔可夫链蒙特卡罗Markov chain Monte Carlo。其灵活性和可扩展性使其适用大量问题。
贡献者39上升5.4%提交2721Github网址Pymc。
17.Deap是用于快速原型设计和测试思想的新型演化计算框架它试图使算法明确数据结构透明。它与多处理Multiprocessing和SCOOP等并行机制完美协调。
贡献者39上升86%提交1960年Github网址Deap。
18.Annoy(Approximate Nearest Neighbor Oh Yeah是一个C库它使用Python绑定来搜索接近给定查询点的空间点。它还创建了大量的基于只读文件的数据结构这些数据结构被映射到内存中以便许多进程可以共享相同的数据。
贡献者35上升46%提交527Github网址Annoy。
19.PyBrain是Python的模块化机器学习库。其目标是为机器学习任务提供灵活易于使用但仍然强大的算法以及各种预定义环境来测试和比较你的算法。
贡献者32上升3%提交992Github网址PyBrain。
20.Fuel是一个数据管道框架它为你的机器学习模型提供所需数据。它将被用于Blocks和Pylearn2神经网络库。
贡献者32上升10%提交1116Github 网址Fuel。
贡献者和提交数在2018年2月录得。
原文链接 干货好文请关注扫描以下二维码