AI时代 本次搜索耗时 1.578 秒,为您找到 69 个相关结果.
  • 构建 Spark

    构建 Spark 构建 Apache Spark Apache Maven 设置 Maven 的内存使用 build/mvn 构建一个可运行的 Distribution 版本 指定 Hadoop 版本并启用 YARN 使用 Hive 和 JDBC 支持构建 打包没有 Hadoop 依赖关系的 YARN 使用 Mesos 构建 使用 Scal...
  • Monitoring and Instrumentation

    Monitoring and Instrumentation Web 界面 事后查看 环境变量 Spark配置选项 REST API API 版本控制策略 Metrics 高级工具 Monitoring and Instrumentation 有几种方法来监视 Spark 应用程序:Web UI,metrics 和外部工具。 W...
  • 从源码编译

    从源码编译 构建配置文件 构建命令示例 构建要求 安装要求 安装maven 代理设置(可选) 包 运行端到端测试 从源码编译 原文链接 : http://zeppelin.apache.org/docs/0.7.2/install/build.html 译文链接 : http://www.apache.wiki/pages/vie...
  • Spark 编程指南

    Spark 编程指南 概述 Spark 依赖 初始化 Spark 使用 Shell 弹性分布式数据集(RDDs) 并行集合 外部 Datasets(数据集) RDD 操作 基础 传递 Functions(函数)给 Spark 理解闭包 示例 Local(本地)vs. cluster(集群)模式 打印 RDD 的 elements 与...
  • 后端Angular API

    后端Angular API 概观 基本用法 打印AngularJS视图 绑定/解除绑定变量 观察/不记事变数 让我们让它更简单和更直观 Import 显示元素 事件处理程序 绑定模型 与模型交互 示例:基本使用 显示元素 OnClick事件 绑定模型 与模型交互 示例:字符串转换器 后端Angular API 原文...
  • R 解释器

    R 解释器 概述 配置 使用R解释器 使用SparkR&语言间移动 警告和故障排除 R 解释器 原文链接 : http://zeppelin.apache.org/docs/0.7.2/interpreter/r.html 译文链接 : http://www.apache.wiki/pages/viewpage.action?pageI...
  • Spark SQL, DataFrames and Datasets Guide

    Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门 起始点:SparkSession 创建 DataFrames 无类型的 Dataset 操作(aka DataFrame 操作) Running SQL Queries Progr...
  • 配置

    配置 Zeppelin Properties SSL配置 创建和配置证书 配置服务器端SSL 启用客户端证书认证 使用Jetty密码工具模糊密码 配置 原文链接 : http://zeppelin.apache.org/docs/0.7.2/install/configuration.html 译文链接 : http://www.ap...
  • Tuning Spark

    Spark 调优 数据序列化 内存调优 内存管理概论 确定内存消耗 优化数据结构 序列化 RDD 存储 GC优化 其它考虑 并行级别 Reduce任务内存使用 广播大变量 数据局部性 总结 Spark 调优 由于大多数Spark计算都在内存中,所以集群中的任何资源(CPU、网络带宽或内存)都可能成为Spark程序的瓶颈。...
  • 其它

    其它 其它 Amazon EC2 :花费大约 5 分钟的时间让您在 EC2 上启动一个集群的脚本 Kubernetes (experimental) :在 Kubernetes 之上部署 Spark