[搜文档]Spark - 搜索结果

Tuning Spark

1364 2024-04-11 《Apache Spark 官方文档中文版》

Spark 调优数据序列化内存调优内存管理概论确定内存消耗优化数据结构序列化 RDD 存储 GC优化其它考虑并行级别 Reduce任务内存使用广播大变量数据局部性总结 Spark 调优由于大多数Spark计算都在内存中，所以集群中的任何资源(CPU、网络带宽或内存)都可能成为Spark程序的瓶颈。...

Cassandra CQL 解释器

1342 2024-04-11 《Zeppelin 0.7.2 中文文档》

Cassandra CQL 解释器启用Cassandra解释器使用Cassandra解释器解释器命令 CQL语句声明中的评论语法验证模式命令运行时参数支持准备声明 @prepare @bind @remove_prepare 使用动态表单共享状态解释器配置更改日志错误和联系人 Cassandr...

使用Flink和Spark Clusters安装Zeppelin教程

1308 2024-04-11 《Zeppelin 0.7.2 中文文档》

使用Flink和Spark Clusters安装Zeppelin教程在群集模式下使用Flink和Spark安装Zeppelin 所需程序安装Zeppelin 安装群集 Flink集群下载二进制文件从源码编译确保集群已启动 Spark 1.6集群下载二进制文件从源头构建启动Spark群集配置解释器下一步 ...

Running Spark on YARN

1307 2024-04-11 《Apache Spark 官方文档中文版》

Running Spark on YARN 启动 Spark on YARN 添加其他的 JARs 准备配置调试应用 Spark 属性重要提示在安全集群中运行配置外部的 Shuffle Service 用 Apache Oozie 来运行应用程序 Kerberos 故障排查使用 Spark History Server 来替...

硬件配置

1277 2024-04-11 《Apache Spark 官方文档中文版》

硬件配置存储系统本地磁盘内存网络 CPU Cores 硬件配置 Spark 开发者都会遇到一个常见问题，那就是如何为 Spark 配置硬件。然而正确的硬件配置取决于使用的场景，我们提出以下建议。存储系统因为大多数 Spark 作业都很可能必须从外部存储系统（例如 Hadoop 文件系统或者 HBase）读取输入的数据，所以...

Spark 解释器

1256 2024-04-11 《Zeppelin 0.7.2 中文文档》

Spark 解释器概述配置 1.导出SPARK_HOME 2.在“解释器”菜单中设置主机 SparkContext，SQLContext，SparkSession，ZeppelinContext 依赖管理 1.通过解释器设置设置依赖关系 2.加载Spark属性 3.通过％spark.dep解释器加载动态依赖关系 ZeppelinCont...

Spark Standalone Mode

1254 2024-04-11 《Apache Spark 官方文档中文版》

Spark Standalone Mode 安装 Spark Standalone 集群手动启动一个集群集群启动脚本提交应用程序到集群中启动 Spark 应用程序 Resource Scheduling（资源调度）监控和日志与 Hadoop 集成配置网络安全端口高可用性使用 ZooKeeper 备用 Masters 用...

解释器安装

1239 2024-04-11 《Zeppelin 0.7.2 中文文档》

解释器安装社区管理解释器安装所有社区管理的解释器安装特定的解释器安装Scala 2.10构建的解释器安装Scala 2.10构建的Spark解释器第三方解释器安装第三方解释器一次安装多个第三方解释器可用的社区管理解释器解释器安装原文链接 : http://zeppelin.apache.org/docs/0.7...

R 解释器

1235 2024-04-11 《Zeppelin 0.7.2 中文文档》

R 解释器概述配置使用R解释器使用SparkR＆语言间移动警告和故障排除 R 解释器原文链接 : http://zeppelin.apache.org/docs/0.7.2/interpreter/r.html 译文链接 : http://www.apache.wiki/pages/viewpage.action?pageI...

API 文档

1230 2024-04-11 《Apache Spark 官方文档中文版》

API 文档 API 文档 Spark Scala API (Scaladoc) Spark Java API (Javadoc) Spark Python API (Sphinx) Spark R API (Roxygen2)