提供具体统计算法的工具。其算法可从数据中学习。
* [Apache Flink](https://flink.apache.org/):快速、可靠的大规模数据处理引擎。
* [Apache Hadoop](http://hadoop.apache.org/):在商用硬件集群上用来进行大规模数据存储的开源软件框架。
* [Apache Mahout](https://mahout.apache.org/):专注协同过滤、聚类和分类的可扩展算法。
* [Apache Spark](http://spark.apache.org/):开源数据分析集群计算框架。
* [DeepDive](http://deepdive.stanford.edu/):从非结构化数据建立结构化信息并集成到已有数据库的工具。
* [Deeplearning4j](http://deeplearning4j.org/):分布式多线程深度学习开发库。
* [H2O](http://0xdata.com/):用作大数据统计的分析引擎。
* [Weka](http://www.cs.waikato.ac.nz/ml/weka/):用作数据挖掘的算法集合,包括从预处理到可视化的各个层次。
- 前言
- 我们要做什么?
- 如何参与本项目?
- 本项目的参与者
- 古董级工具
- 构建工具
- 字节码操作
- 集群管理
- 代码分析
- 编译器生成工具
- 外部配置工具
- 约束满足问题求解程序
- 持续集成
- CSV解析
- 数据库
- 数据结构
- 时间日期工具库
- 依赖注入
- 开发流程增强工具
- 分布式应用
- 分布式数据库
- 发布
- 文档处理工具
- 函数式编程
- 游戏开发
- GUI
- 高性能计算
- IDE
- 图像处理
- JSON
- JVM与JDK
- 基于JVM的语言
- 日志
- 机器学习
- 消息传递
- 杂项
- 应用监控工具
- 原生开发库
- 自然语言处理
- 网络
- ORM
- 性能分析
- 响应式开发库
- REST框架
- 科学计算与分析
- 搜索引擎
- 安全
- 序列化
- 应用服务器
- 模板引擎
- 测试
- 通用工具库
- 网络爬虫
- Web框架
- 资源
- 社区
- 有影响力的书
- 播客
- 微博、微信公众号
- 知名网站