AI资源

AI资源


参考资料

高盛:人工智能报告中文版

链接

开源项目

人工智能开源项目

链接

1. Synaptic.js:用于浏览器的神经网络库

Synaptic.js 是一个用于 node.js 和浏览器的 JavaScript 神经网络库,可以构建和训练基本上任何类型的一阶甚至二阶神经网络。

该项目内置了 4 种经典的神经网络算法:

  • 多层感知器(multilayer perceptrons)
  • 长短期记忆网络(multilayer long-short term memory networks)
  • 液体状态机(Liquid State Machine)
  • Hopfield神经网络

2. DeepLearn.js:加速硬件的机器学习JS库

DeepLearn.js 是谷歌推出的一个可用于机器智能并加速 WebGL 的开源 JavaScript 库,完全在浏览器中运行,不需要安装,不需要后端处理。

3. 数值计算库——TensorFire:浏览器端神经网络框架

TensorFire 是基于 WebGL 的,运行在浏览器中的神经网络框架。

TensorFlow由谷歌开源,是一个能够使用数据流图进行数据计算的库,有很好的灵活性、可移植性、自动微分贡呢,还支持Python和c++语言,可以运行在有单或者多个CPU和GPU的系统甚至是移动设备上。

4. Caffe2:一个轻量化的深度学习算法框架

Caffe2 主要为产品级别的深度学习算法设计:

  • 为移动端实时计算做了很多优化
  • 同时支持大规模的分布式计算
  • Caffe2是一个跨平台的框架
  • 支持移动端iOS, Android, 服务器端Linux, Mac, Windows, 甚至一些物联网设备如Raspberry Pi, NVIDIA Jetson TX2等平台部署

Caffe2 的主要特性:

  • 支持最新的计算模型
  • 分布式训练
  • 高模块化
  • 跨平台的支持
  • 高效率

应用场景:

  • 计算机视觉相关
  • 机器翻译
  • 语音识别
  • 推荐系统

5. scikit-learn

scikit拥有许多简单高效的数据挖掘和数据分析工具。

6. 预测引擎——PredictionIO

PredictionIO的主要目的是简化数据基础架构管理,程序员通过实现自己的机器学习模型,可以将它们无缝地整合到引擎中,它还通过系统化的流程和预先构建的评估措施来加速机器学习建模。

PredictionIO可以用在创建有机器学习功能的预测引擎,用于部署实时动态查询的Web服务。

7. Swift AI

8. GoLearn

9. 分布式机器学习工具——DMTK

DMTK是Distributed Machine Learning Toolkit的缩写,同样是微软开源的人工智能工具,用户大数据的应用程序。DMTK的的作用是能够加快对人工智能系统的训练,主要有DMTK框架、LightLDA主题模型算法和分布式字嵌入算法三个组件组成。

DMTK对人工智能系统的训练速度非常快,曾经微软用100万个主题和1000万个单词的词汇表训练一个主题模型,在文档中收集了1000亿个符号。

10. 智能分析工具——H20

H20有很多的公司客户,比如思科、PayPal、泛美等等,H20主要用户预测建模、风险欺诈分析、保险分析、广告技术、医疗保健和客户情报分析等。针对企业服务的版本需要付费,同时也有标准版,被集成在Apache Spark 中。

11. 机器学习框架——Mahout

Mahout是一个开源的机器学习框架,主要有三个特性:

  1. 构建可以扩展算法的编程环境
  2. 像H20一样预制算法工具
  3. 一个矢量数学实验环境,被叫做Samsara

现在Mahout被Adobe、英特尔、领英、Twitter、雅虎等很多公司使用。

12. 机器学习库——MLlib

提到MLlib就不得不提Apache Spark,Apache Spark因为速度快被誉为最流行的大数据处理工具,而MLlib是Spark的可扩展机器学习库。MLlib包括很多机器学习算法,像分类、决策树、功能转换、回归、生存分析、集群、主题建模、推荐、频繁项集、ML 管道架构、统计、分布式线性代数等等。MLlib的特点是集成了Hadoop 并可以与 NumPy 和 R 进行交互操作。

13. 分层暂时记忆——NuPIC

NuPIC 是一个基于分层暂时记忆Hierarchical Temporal Memory,也就是HTM理论的开源人工智能项目。HTM的目标是创造一个在许多认知任务上接近或者比人类的认知能力表现更好的机器,想要创建一个计算机系统来模仿人类大脑皮层活动。

14. 神经网络算法编程库——OpenNN

OpenNN是一个c++编程库,作用是实现神经网络算法。OpenNN的特点包括深度的架构和很高效的性能。在OpenNN的网站上有很多神经网络的文档,比如解释深情网络基本知识的入门教程,是一个具有高级理解力的人工智能工具。

15. 常识推理引擎——OpenCyc

OpenCyc由Cycorp开发,提供了对Cyc知识库的访问和常识推理引擎。OpenCyc有大约24万个条目,大约200万个三元组合大约7万个owl,OpenCyc是一个类似于链接到外部语义库的命名空间。

OpenCyc主要应用在:

  • 富领域模型
  • 语义数据集成
  • 文本理解
  • 特殊领域的专家系统
  • 游戏AI

16. 机器学习应用程序框架——Oryx 2

Oryx 2构建在Apache Spark 和 Kafka 的基础上,是专门针对大规模机器学习的应用程序开发框架。Oryx 2的架构是一个独特的三层 λ 架构,主要应用是可以创建新的应用程序,还有一些预先构建的程序用于常见的大数据任务。

17. 高等数学运算——SystemML

SystemML提供了一个高度可伸缩的平台,能够实现高等数学运算,现在是Apache的一个大数据项目。SystemML的算法用R或者类似但并不是python的语法写成,可以在Spark和Hadoop上运行,现在已经应用在跟踪客户、规划机场交通等方面。

18. 科学计算框架——Torch

Torch的特点是灵活度高和速度快,可以用户机器学习、计算机视觉、信号处理、并行处理、音视频及图像等方面。

19. 开源人脸识别引擎——SeetaFace