计算机视觉 模型、学习和推理 内容简介
《计算机视觉:模型、学习和推理/计算机科学丛书》是一本从机器学习视角讲解计算机视觉的非常好的教材。全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握。作者展示了如何使用训练数据来学习观察到的图像数据和我们希望预测的现实世界现象之间的联系,以及如何如何研究这些联系来从新的图像数据中作出新的推理。《计算机视觉:模型、学习和推理/计算机科学丛书》要求少的前导知识,从介绍概率和模型的基础知识开始,接着给出让学生能够实现和修改来构建有用的视觉系统的实际示例。适合作为计算机视觉和机器学习的高年级本科生或研究生的教材,书中详细的方法演示和示例对于计算机视觉领域的专业人员也非常有用。
计算机视觉 模型、学习和推理 目录
译者序
译者简介
序
前言
第1章 绪论
1.1 本书结构
1.2 其他书籍
第一部分 概率
第2章 概率概述
2.1 随机变量
2.2 联合概率
2.3 边缘化
2.4 条件概率
2.5 贝叶斯公式
2.6 独立性
2.7 期望
讨论
备注
习题
第3章 常用概率分布
3.1 伯努利分布
3.2 贝塔分布
3.3 分类分布
3.4 狄利克雷分布
3.5 一元正态分布
3.6 正态逆伽马分布
3.7 多元正态分布
3.8 正态逆维希特分布
3.9 共轭性
总结
备注
习题
第4章 拟合概率模型
4.1 最大似然法
4.2 最大后验法
4.3 贝叶斯方法
4.4 算例1:一元正态分布
4.4.1 最大似然估计
4.4.2 最大后验估计
4.4.3 贝叶斯方法
4.5 算例2:分类分布
4.5.1 最大似然法
4.5.2 最大后验法
4.5.3 贝叶斯方法
总结
备注
习题
第5章 正态分布
5.1 协方差矩阵的形式
5.2 协方差分解
5.3 变量的线性变换
5.4 边缘分布
5.5 条件分布
5.6 正态分布的乘积
5.7 变量改变
总结
备注
习题
第二部分 机器视觉的机器学习
第6章 视觉学习和推理
6.1 计算机视觉问题
6.2 模型的种类
6.2.1 判别模型
6.2.2 生成模型
6.3 示例1:回归
6.3.1 判别模型
6.3.2 生成模型
6.4 示例2:二值分类
6.4.1 判别模型
6.4.2 生成模型
6.5 应该用哪种模型
6.6 应用
6.6.1 皮肤检测
6.6.2 背景差分
总结
备注
习题
第7章 复杂数据密度建模
7.1 正态分类模型
7.2 隐变量
7.3 期望最大化
7.4 混合高斯模型
7.4.1 混合高斯边缘化
7.4.2 基于期望最大化的混合模型拟合
7.5 t分布
7.5.1 学生t分布边缘化
7.5.2 拟合t分布的期望最大化
7.6 因子分析
7.6.1 因子分析的边缘分布
7.6.2 因子分析学习的期望最大化
7.7 组合模型
7.8 期望最大化算法的细节
7.8.1 期望最大化算法的下界
7.8.2 E步
7.8.3 M步
7.9 应用
7.9.1 人脸检测
7.9.2 目标识别
7.9.3 分割
7.9.4 正脸识别
7.9.5 改变人脸姿态(回归)
7.9.6 作为隐变量的变换
总结
备注
习题
第8章 回归模型
8.1 线性回归
8.1.1 学习
8.1.2 线性回归模型的问题
8.2 贝叶斯线性回归
8.2.1 实际考虑
8.2.2 拟合方差
8.3 非线性回归
8.3.1 最大似然法
8.3.2 贝叶斯非线性回归
8.4 核与核技巧
8.5 高斯过程回归
8.6 稀疏线性回归
8.7 二元线性回归
8.8 相关向量回归
8.9 多变量数据回归
8.1 0应用
8.1 0.1 人体姿势估计
8.1 0.2 位移专家
讨论
备注
习题
第9章 分类模型
9.1 逻辑回归
9.1.1 学习:最大似然估计
9.1.2 逻辑回归模型的问题
9.2 贝叶斯逻辑回归
9.2.1 学习
9.2.2 推理
9.3 非线性逻辑回归
9.4 对偶逻辑回归模型
9.5 核逻辑回归
9.6 相关向量分类
9.7 增量拟合和boosting
9.8 分类树
9.9 多分类逻辑回归
9.1 0随机树、随机森林和随机蕨分类器
9.1 1与非概率模型的联系
9.1 2应用
9.1 2.1 性别分类
9.1 2.2 脸部和行人检测
9.1 2.3 语义分割
9.1 2.4 恢复表面布局
9.1 2.5 人体部位识别
讨论
备注
习题
第三部分连接局部模型
第10章 图模型
10.1 条件独立性
10.2 有向图模型
10.2.1 示例
10.2.2 示例
10.2.3 示例
10.2.4 总结
10.3 无向图模型
10.3.1 示例
10.3.2 示例
10.4 有向图模型与无向图模型的对比
10.5 计算机视觉中的图模型
10.6 含有多个未知量的模型推理
10.6.1 求最大后验概率的解
10.6.2 求后验概率分布的边缘分布
10.6.3 最大化边缘
10.6.4 后验分布的采样
10.7 样本采样
10.7.1 有向图模型的采样
10.7.2 无向图模型的采样
10.8 学习
10.8.1 有向图模型的学习
10.8.2 无向图模型的学习
讨论
备注
习题
第11章 链式模型和树模型
11.1 链式模型
11.1.1 有向链式模型
11.1.2 无向链式模型
11.1.3 模型的等价性
11.1.4 隐马尔可夫模型在手语中的应用
11.2 链式MAP推理
11.3 树的MAP推理
11.4 链式边缘后验推理
11.4.1 求解边缘分布
11.4.2 前向后向算法
11.4.3 置信传播
11.4.4 链式模型的和积算法
11.5 树的边缘后验推理
11.6 链式模型和树模型的学习
11.7 链式模型和树模型之外的东西
11.8 应用
11.8.1 手势跟踪
11.8.2 立体视觉
11.8.3 形象化结构
11.8.4 分割
讨论
备注
习题
第12章 网格模型
12.1 马尔可夫随机场
12.1.1 网格示例
12.1.2 离散成对MRF图像去噪
12.2 二值成对马尔可夫随机场的MAP推理
12.2.1 最大流/最小割
12.2.2 MAP推理:二值变量
12.3 多标签成对MRF的MAP推理
12.4 非凸势的多标签MRF
12.5 条件随机场
12.6 高阶模型
12.7 网格有向模型
12.8 应用
12.8.1 背景差分
12.8.2 交互式分割
12.8.3 立体视觉
12.8.4 图像重排
12.8.5 超分辨率
12.8.6 纹理合成
12.8.7 合成新面孔
讨论
备注
习题
第四部分预处理
第13章 图像预处理与特征提取
13.1 逐像素变换
13.1.1 白化
13.1.2 直方图均衡化
13.1.3 线性滤波
13.1.4 局部二值模式
13.1.5 纹理基元映射
13.2 边缘、角点和兴趣点
13.2.1 Canny边缘检测器
13.2.2 Harris角点检测器
13.2.3 SIFT检测器
13.3 描述子
13.3.1 直方图
13.3.2 SIFT描述子
13.3.3 方向梯度直方图
13.3.4 词袋描述子
13.3.5 形状内容描述子
13.4 降维
13.4.1 单数值近似
13.4.2 主成分分析
13.4.3 二元主成分分析
13.4.4 K均值算法
结论
备注
习题
第五部分 几何模型
第14章 针孔摄像机
14.1 针孔摄像机简介
14.1.1 归一化摄像机
14.1.2 焦距参数
14.1.3 偏移量和偏移参数
14.1.4 摄像机的位置与方向
14.1.5 全针孔摄像机模型
14.1.6 径向畸变
14.2 三个几何问题
14.2.1 问题1:学习外在参数
14.2.2 问题2:学习内在参数
14.2.3 问题3:推理3D世界点
14.2.4 解决问题
14.3 齐次坐标
14.4 学习外在参数
14.5 学习内在参数
14.6 推理3D世界点
14.7 应用
14.7.1 结构光的深度
14.7.2 剪影重构
讨论
备注
习题
第15章 变换模型
15.1 二维变换模型
15.1.1 欧氏变换模型
15.1.2 相似变换模型
15.1.3 仿射变换模型
15.1.4 投影变换模型
15.1.5 增加不确定性
15.2 变换模型中的学习
15.2.1 学习欧氏参数
15.2.2 学习相似参数
15.2.3 学习仿射参数
15.2.4 学习投影参数
15.3 变换模型中的推理
15.4 平面的三个几何问题
15.4.1 问题1:学习外在参数
15.4.2 问题2:学习内在参数
15.4.3 问题3:与摄像机相关的3D位置推理
15.5 图像间的变换
15.5.1 单应性的几何特征
15.5.2 计算图像间的变换
15.6 变换的鲁棒学习
15.6.1 RANSAC
15.6.2 连续RANSAC
15.6.3 PEaRL
15.7 应用
15.7.1 增强现实追踪
15.7.2 视觉全景
讨论
备注
习题
第16章 多摄像机系统
16.1 双视图几何学理论
16.1.1 极线约束
16.1.2 极点
16.2 实矩阵
16.2.1 实矩阵的属性
16.2.2 实矩阵的分解
16.3 基础矩阵
16.3.1 基础矩阵的估计
16.3.2 8点算法
16.4 双视图重构的流程
16.5 校正
16.5.1 平面校正
16.5.2 极面校正
16.5.3 校正后处理
16.6 多视图重构
16.7 应用
16.7.1 三维重构
16.7.2 图片浏览
16.7.3 立体图割
讨论
备注
习题
第六部分 视觉模型
第17章 形状模型
17.1 形状及其表示
17.2 snake模型
17.2.1 推理
17.2.2 snake模型中存在的问题
17.3 形状模板
17.3.1 推理
17.3.2 用迭代最近点算法进行推理
17.4 统计形状模型
17.4.1 学习
17.4.2 推理
17.5 子空间形状模型
17.5.1 概率主成分分析
17.5.2 学习
17.5.3 推理
17.6 三维形状模型
17.7 形状和外观的统计模型
17.7.1 学习
17.7.2 推理
17.8 非高斯统计形状模型
17.8.1 回归PPCA
17.8.2 高斯过程隐变量模型
17.9 铰接式模型
17.1 0应用
17.1 0.1 三维形变模型
17.1 0.2 三维人体模型
讨论
备注
习题
第18章 身份与方式模型
18.1 子空间身份模型
18.1.1 学习
18.1.2 推理
18.1.3 在其他识别任务中的推理
18.1.4 身份子空间模型的局限性
18.2 概率线性判别分析
18.2.1 学习
18.2.2 推理
18.3 非线性身份模型
18.4 非对称双线性模型
18.4.1 学习
18.4.2 推理
18.5 对称双线性和多线性模型
18.5.1 学习
18.5.2 推理
18.5.3 多线性模型
18.6 应用
18.6.1 人脸识别
18.6.2 纹理建模
18.6.3 动画合成
讨论
备注
习题
第19章 时序模型
19.1 时序估计框架
19.1.1 推理
19.1.2 学习
19.2 卡尔曼滤波器
19.2.1 推理
19.2.2 改写测量合并阶段
19.2.3 推理总结
19.2.4 示例
19.2.5 示例
19.2.6 滤波
19.2.7 时序和测量模型
19.2.8 卡尔曼滤波器的问题
19.3 扩展卡尔曼滤波器
19.4 无损卡尔曼滤波器
19.4.1 状态演化
19.4.2 测量合并过程
……
第七部分附录
计算机视觉 模型、学习和推理 精彩文摘
机器视觉旨在从图像中提取有用的信息,这已经被证实是一个极具挑战性的任务。在过去的四十年里,成千上万个聪慧和创造性的大脑致力于这一任务。尽管如此,我们还远远没有能够建立一个通用的“视觉机器”。
该问题的部分原因是可视数据复杂性所导致的。考虑图1-1中的图像。场景中有数百个物体。这些物体几乎都没有呈现出“特定”的姿态。几乎所有的物体都被部分遮挡。对于一个机器视觉算法,很难确定某个物体的结束和另一个物体开始的地方。譬如,背景中的天空和白色建筑物之问的边界上,图像在亮度上几乎没有变化。然而,即使没有物体的边界或材质的变化,前景中SUV后窗上的亮度也有明显的变化。
本文来自至尊狂魔┈投稿,不代表电子书资源网立场,如若转载,请联系原作者获取。