摘要
在数据分析领域,大部分的技术都诞生在国外,特别是美国,从最初的数据库,到以Hadoop为首的大数据技术,再到今天各种DL(Deep Learning)、AI,等等。但我国拥有着世界上独一无二的“大”数据,最多的人口、最多的移动设备、最活跃的应用市场、最复杂的网络环境等,应对这些挑战,我们需要有自己的核心技术,特别是在基础领域的突破和研发方面。今天,以Apache Kylin为首的各种来自中国的先进技术不断涌现,甚至在很多方面都大大超越了国外的其他技术,这一点也彰显了中国的技术实力。
Apache Kylin权威指南 作者:Apache Kylin核心团队
Apache Kylin权威指南 出版社:机械工业出版社
Apache Kylin权威指南 内容简介
本书第1章介绍ApacheKylin的历史、技术原理和产品定位,帮助用户了解何时和为何使用Kylin。第2章通过一个具体的案例快速入门,讲解Kylin核心概念、Cube建模和SQL连接查询这些基本使用。第3、4章讲解增量构建和进一步的流式构建,是大多数案例典型配置。第5、6章是针对查询和可视化、Cube调优的两个专门章节,适合较高级的用户。第7章是一系列有行业特点的具体案例分析,贯穿之前的所有概念。第8、9章讲ApacheKylin的扩展和企业级高级功能,技术性较强,会有较多的代码示例。第10章讲运维管理,从安装配置、监控维护到常见的问题和修复。全书后两章谈ApacheKylin开源社区和项目发展规划。
Apache Kylin权威指南 目录
前言
第1章 Apache Kylin概述
1.1 背景和历史
1.2 Apache Kylin的使命
1.3 Apache Kylin的工作原理
1.4 Apache Kylin的技术架构
1.5 Apache Kylin的主要特点
1.6 与其他开源产品比较
1.7 小结
第2章 快速入门
2.1 核心概念
2.2 在Hive中准备数据
2.3 设计Cube
2.4 构建Cube
2.5 查询Cube
2.6 SQL参考
2.7 小结
第3章 增量构建
3.1 为什么要增量构建
3.2 设计增量Cube
3.3 触发增量构建
3.4 管理Cube碎片
3.5 小结
第4章 流式构建
4.1 为什么要流式构建
4.2 准备流式数据
4.3 设计流式Cube
4.4 流式构建原理
4.5 触发流式构建
4.6 小结
第5章 查询和可视化
5.1 Web GUI
5.2 Rest API
5.3 ODBC
5.4 JDBC
5.5 通过Tableau访问Kylin
5.6 Zeppelin集成
5.7 小结
第6章 Cube优化
6.1 Cuboid剪枝优化
6.2 剪枝优化的工具
6.3 并发粒度优化
6.4 Rowkeys优化
6.5 其他优化
6.6 小结
第7章 应用案例分析
7.1 基本多维分析
7.2 流式分析
7.3 小结
第8章 扩展Apache Kylin
8.1 可扩展式架构
8.2 计算引擎扩展
8.3 数据源扩展
8.4 存储扩展
8.5 聚合类型扩展
8.6 维度编码扩展
8.7 小结
第9章 Apache Kylin的企业级功能
9.1 身份验证
9.2 授权
9.3 小结
第10章 运维管理
10.1 安装和配置
10.2 监控和诊断
10.3 日常维护
10.4 常见问题和修复
10.5 获得社区帮助
10.6 小结
第11章 参与开源
11.1 Apache Kylin的开源历程
11.2 为什么参与开源
11.3 Apache开源社区简介
11.4 如何贡献到开源社区
11.5 礼仪与文化
11.6 如何参与Apache Kylin
11.7 小结
第12章 Apache Kylin的未来
12.1 大规模流式构建
12.2 拥抱Spark技术栈
12.3 更快的存储和查询
12.4 前端展现及与BI工具的整合
12.5 高级OLAP函数
12.6 展望
本文来自柠萌先森ζ投稿,不代表电子书资源网立场,如若转载,请联系原作者获取。