目前,人工智能是科技界不断发展的领域之一,主要侧重于构建软硬件,以便在医疗、教育、安全、制造、银行及其他众多领域解决日常生活中的挑战。我们在本文中将介绍几款面向Linux生态系统的顶尖开源人工智能工具。
下面列出了为支持人工智能设计和开发的诸多平台,你可以在Linux及其他许多操作系统上使用。切记:介绍顺序不分先后。
1.Deep Learning For Java(Deeplearning4j)
Deeplearning4j是一种商用级、开源、即插即用的分布式深度学习库,面向Java和Scala编程语言。它是专门为商业相关应用设计的,并与分布式CPU和GPU上的Hadoop和Spark整合起来。
DL4J采用Apache 2.0许可证发布,它提供了GPU支持,以便在AWS上进行扩展,并且适用于微服务架构。
主页链接:http://deeplearning4j.org/
2.Caffe――深度学习框架
Caffe是一种模块化、表达式的深度学习框架,以速度见长。它采用BSD 2-Clause许可证发布,已经支持研究、初创公司原型以及视觉、速度和多媒体之类的工业应用等领域的几个社区项目。
主页链接:http://caffe.berkeleyvision.org/
3.H20――分布式机器学习框架
H20是一种开源、快速、可扩展的分布式机器学习框架,另外该框架还有各种各样的算法。它支持更智能化的应用,比如深度学习、梯度提升、随机森林、广义线性建模(比如逻辑回归和弹性网络)以及其他更多。
这是一种面向企业的人工智能工具,用于利用数据做决策,它让用户能够使用更快速、更准确的预测建模,从数据获取洞察力。
主页链接:http://www.h2o.ai/
4.MLlib――机器学习库
MLli是一种开源、易于使用、高性能的机器学习库,是作为Apache Spark的一部分开发的。它实际上易于部署,可以在现有的Hadoop集群和数据上运行。
MLlib还随带一系列算法,可用于分类、回归、推荐、聚类、生存分析及更多方面。重要的是,它可以用在Python、Java、Scala和R等编程语言中。
主页链接:https://spark.apache.org/mllib/
5.Apache Mahout
Mahout是一种开源框架设计工具,用于构建可扩展的机器学习应用程序,它拥有如下三大功能:
提供简单、可扩展的编程工作环境。
提供诸多预包装算法,支持Scala + Apache Spark、H20以及Apache Flink。
包括Samaras,这是一种向量数学试验型工作环境,拥有类似R的语法。
主页链接:http://mahout.apache.org/
6.开放神经网络库(OpenNN)
OpenNN也是一种用C++编写的开源类库,面向深度学习,它用于构建神经网络。然而,它最适合经验丰富的C++程序员以及机器学习技能出色的人员。它的特点就是拥有深度架构和高性能。
主页链接:http://www.opennn.net/
7.Oryx 2
Oryx 2是最初的Oryx项目的延续,它是在Apache Spark和Apache Kafka上开发的,重新设计了Lambda架构,不过专门面向实时机器学习。
这是个应用开发平台,还随带协作过滤、分类、回归和聚类等方面的某些应用程序。
主页链接:http://oryx.io/
8.OpenCyc
OpenCyc是一种开源门户网站,通向世界上最大、最全面的一般知识库和常识推理引擎。它包括大量的Cyc术语,这些术语用一种精确设计的本体来排列,支持这些领域的应用:
丰富领域建模
特定领域专家系统
文本理解
语言数据整合、人工智能游戏及其他
主页链接:http://www.cyc.com/platform/opencyc/
9.Apache SystemML
SystemML是一种面向机器学习的开源人工智能平台,最适合大数据。主要功能特性:支持类似R和Python的语法,专注于大数据,专门为高级数学设计。主页上详细解释了其工作原理,包括视频演示,作了明确的讲解。
有几个方法可以使用它,包括Apache Spark、Apache Hadoop、Jupyter和Apache Zeppelin。一些重要的使用场合包括汽车、机场交通和社群金融。
主页链接:http://systemml.apache.org/
10.NuPIC
NuPIC是一种机器学习开源框架,基于分层时间记忆(HTM),这是一种大脑皮层理论。用NuPIC集成的HTM程序是为分析实时流数据而实践的,它能学习数据中基于时间的模式,预测当前值,并且发现任何不规则的地方。
它的重要功能特性包括如下:
持续在线学习
时间和空间模式
实时流数据
预测和建模
强大的异常检测
分层时间记忆
主页链接:http://numenta.org/
由于人工智能领域的研究方兴未艾,我们势必会看到更多的工具涌现出来,有助于让这个技术领域大获成功,尤其是用于克服日常的科学挑战,并且满足教学用途。