1.2.0发布 支持高可用 Apache 并提供机器学习API 引入基于Netty的实现 Spark (120发票在哪里开)

1.2.0发布 支持高可用 Apache 并提供机器学习API 引入基于Netty的实现 Spark (120发票在哪里开)

Apache Spark 1.2.0 已经发布,Spark 核心引擎在性能和可用性方面都有很大改进。这是来自 60 多家研究机构和公司的 172 位贡献者的成果,包括了 1000 多个补丁。

Spark 1.2.0 与之前的 1.1 和 1.0 版本完全二进制兼容。该版本引入了一个基于Netty 的实现,此举带来了很大的效率提升。Spark 流支持Python,并通过预写式日志(Write Ahead Logs,WALs)支持高可用。此外还提供了一组称作_spark.ml_ 的机器学习API。

Spark SQL 是一个比较新的项目,改进了对外部数据源的支持。

Patrick Wendell 是 Spark 早期版本的发布经理,现在是 Spark 贡献者和 PMC 成员,目前就职于 target="_blank"> target="_blank"> Apache Spark 的下载页面下载 Spark 最新版本。

查看英文原文: Apache Spark 1.2.0 Supports Netty-based Implementation, High Availability and Machine Learning APIs

声明:本文来自用户分享和网络收集,仅供学习与参考,测试请备份。