机器学习 · Java资源大全中文版

提供具体统计算法的工具。其算法可从数据中学习。 * [Apache Flink](https://flink.apache.org/)：快速、可靠的大规模数据处理引擎。 * [Apache Hadoop](http://hadoop.apache.org/)：在商用硬件集群上用来进行大规模数据存储的开源软件框架。 * [Apache Mahout](https://mahout.apache.org/)：专注协同过滤、聚类和分类的可扩展算法。 * [Apache Spark](http://spark.apache.org/)：开源数据分析集群计算框架。 * [DeepDive](http://deepdive.stanford.edu/)：从非结构化数据建立结构化信息并集成到已有数据库的工具。 * [Deeplearning4j](http://deeplearning4j.org/)：分布式多线程深度学习开发库。 * [H2O](http://0xdata.com/)：用作大数据统计的分析引擎。 * [Weka](http://www.cs.waikato.ac.nz/ml/weka/)：用作数据挖掘的算法集合，包括从预处理到可视化的各个层次。