文本挖掘原理,PDF下载-书籍介绍-电子书资源网

名称：文本挖掘原理
作者:程显毅朱倩
出版社:科学出版社
格式：pdf,txt
本电子书只供学习参考，请更多地支持正版图书。

文本挖掘原理内容简介

txt图书下载:《文本挖掘原理》(pdf,txt格式),本书的作者是程显毅朱倩,于2010 年11月,由科学出版社出版。

文本挖掘原理部分内容

在信息时代，存储大量数据比较容易。通过web、企业内部网、电传新。闻获得的文本数量在急剧增加，这导致信息过载。然而，数据量虽然增加了，但可用的信息却在减少。文本挖掘是一个新的令人振奋的研究领域，其试图通过综合数据挖掘、机器学习、自然语言处理、信息检索和知识管理等技术来解决信息过载问题。
　　文本挖掘包括文本集合的预处理(文本分类、信息抽取)、中间结果存储、中间结果分析技术(分布分析、聚类、趋势分析、关联规则抽取)和最终结果的可视化。它与关联分析类似，为人们提供了分析海量文本数据的新工具，并且通过学习模式来指导抽取实体关系。
　　本书首先讨论了文本挖掘的总体结构以及文本挖掘预处理算法，然后深入地研究了文本挖掘核心操作，最后探讨真实世界中文本挖掘的主要应用和dial，弥补了理论和实践的脱节。
　　本书主要可供对文本挖掘感兴趣的本科高年级学生、研究生、研究人员和专业开发人员参考，对从事文本挖掘开发和使用文本挖掘系统的人也会有很大帮助。

　　大量文档集内容的预处理包括特征抽取、文本分类、文本聚类等。文本分类和文本聚类研究的成果比较多，本书只作简单介绍；而对特征生成、特征选择和特征抽取，本书进行深入地讨论。
信息抽取是文本挖掘的核心操作，目前的主要研究方向是命名实体识别、实体关系抽取和事件抽取。实体关系抽取是文本挖掘的关键任务，所以本书用大量篇幅讨论了实体关系发现技术。
由于文本挖掘强调用户交互到知识发现过程的集成性，因此，本书最后讨论了文本挖掘结果可视化方法，并介绍了一种文本挖掘语言――DIAL。

电子书下载网电子书库中的pdf电子书《文本挖掘原理》绝大部分是由网络收集整理而来的，著作权归属于本书作者程显毅朱倩。如果您喜欢这本书的话，请支持我们的正版纸质图书，让作者得到应有的经济回报，促进我们图书出版事业的进步。同时也要感谢科学出版社，感谢它为《文本挖掘原理》的出版所做的一切。同时也欢迎更多的读者来电子书下载网来分享更多好看的txt电子书，免费下载pdf电子书。最后，由衷感谢您下载《文本挖掘原理》pdf版电子书。

参考: txt图书下载文本挖掘原理

本文来自墨尔本·晴投稿，不代表电子书资源网立场，如若转载，请联系原作者获取。

文本挖掘原理,PDF下载

相关推荐

文本挖掘原理,PDF下载

评论列表

联系我们

分享到：