大数量挖掘

《New Internet:大数额挖掘》

主旨新闻

作者: 谭磊 [作译者介绍]

出版社:电子工业出版社

ISBN:9787121196706

上架时间:2013-3-8

出版日期:2013 年7月

开本:16开

页码:376

版次:1-1

所属分类:计算机 > 数据库 > 数据库存储与治本
图片 1

更加多关于 》》》《New
Internet:大数目挖掘

内容简介

处理器书籍

  《new
internet:大数目挖掘》周密地介绍了怎么使用数据挖掘技术从各个协会的(数据库)或非结构(web)的海量数据中领取和暴发业务知识。作者梳理了种种数据挖掘常用算法和信息征集技能,系统地描述了实际上利用时怎么样在网络日志分析、电子邮件营销、互连网广告和电子商务上进展多少挖掘,珍爱介绍了数额挖掘的规律和算法在网络海量数据挖掘中的应用。

   《new
internet:大数量挖掘》首要特点:周到介绍了数量挖掘和大数额的基本概念和技巧;多量行使了事实上案例,实用性强;详细介绍了大数量挖掘领域最新的小买卖利用。

   《new
internet:大数额挖掘》是专事数码挖掘钻探和支付,或者是网络相关行业从业数码运营的正儿八经人员可以的参考书,同时也可看成精通多少挖掘利用的入门指南。

目录

《new internet:大数目挖掘》

第1章 绪论——从淘金客到矿山主 1

1.1 大数目时代的“四v” 2

1.2 什么是大数量挖掘 5

1.2.1 从数额解析到多少挖掘 6

1.2.2 web挖掘 9

1.2.3 大数量挖掘之“大” 10

1.3 大数据挖掘的国内外发展 12

1.3.1 数据挖掘的运用发展 12

1.3.2 数据挖掘研商进步 17

1.4 本书内容 19

第2章 一时辰了然多少挖掘 23

2.1 数据挖掘是怎么化解难题的 23

2.1.1 尿不湿和洋酒 23

2.1.2 target和妊娠预测指数 24

2.1.3 电子商务网站流量分析 25

2.2 分类:从人脸识别系统说起 27

2.2.1 分类算法的应用 29

2.2.2 数据挖掘分类技术 33

2.2.3 分类算法的评估 37

.2.3 一切为了商业 40

2.3.1 什么是商业智能(business intelligence) 40

2.3.2 数据挖掘的九大定律 43

2.4 数据挖掘很纠结 44

2.5 数据挖掘的为主流程 45

2.5.1 数据挖掘的貌似步骤 45

2.5.2 多少个数据挖掘中常用的概念 47

2.5.3 crisp-dm 51

2.5.4 数据挖掘的评估 53

2.5.5 数据挖掘结果的学问表示 55

2.6 本章相关资源 59

第3章 数据仓库——数据挖掘的根本 60

3.1 存放数据的堆栈 60

3.1.1 数据仓库的定义 61

3.1.2 数据仓库和数据库 63

3.2 传统的数据仓库介绍 64

3.3 数据仓库基本结构 67

3.4 olap联机分析处理 69

3.5 云存储上的数据仓库 71

3.5.1 google公司的云架构 71

3.5.2 开源的分布式系统hadoop 77

3.5.3 facebook的数据仓库 85

3.5.4 nosql 86

3.6 本章相关资源 89

第4章 数据挖掘算法及原理 91

4.1 数据挖掘中的算法 91

4.2 数据挖掘十大经典算法 92

4.3 分类算法(classification) 96

4.4 聚类算法(clustering) 99

4.5 关联算法 102

4.5.1 关联算法中的概念 103

4.5.2 关联规则数据挖掘进程 105

4.5.3 关联规则的分类 106

4.5.4 apriori算法的推行实例 107

4.5.5 关联规则挖掘算法的研讨与优化 108

4.6 系列挖掘(sequence mining) 113

4.7 数据挖掘建模语言pmml 115

4.8 本章相关资源 117

第5章 在拓展数据挖掘之前 120

5.1 数据集成 121

5.2 为什么要做多少预处理 122

5.3 数据预处理 124

5.3.1 数据清理 124

5.3.2 数据转换 129

5.3.3 数据规约 132

5.4 本章相关资源 134

第6章 r语言和别的数据挖掘工具 136

6.1 r语言的历史 136

6.1.1 r语言的表征 142

6.1.2 r语言和多少挖掘 149

6.2 其余数据挖掘工具 152

6.2.1 matlab 153

6.2.2 其余商用数据挖掘工具 155

6.2.3 开源数据挖掘工具weka 159

6.3 数据挖掘和云 160

6.4 本章相关资源 162

第7章 网络上的日记分析 164

7.1 网站日志简介 165

7.2 网站日志处理 175

7.2.1 web日志预处理 175

7.2.2 web日志分析和数据挖掘 181

7.3 邮件日志 183

7.4 本章相关资源 184

第8章 数据挖掘和电子邮件 186

8.1 邮件营销与垃圾邮件过滤 186

8.2 数据挖掘和邮件营销 189

8.2.1 怎么样有效地展开邮件营销 189

8.2.2 邮件营销案例分享之一 195

8.2.3 邮件营销案例分享之二 200

8.2.4 运用数据挖掘rfm模型进步邮件营销

效果 203

8.3 数据挖掘和垃圾邮件过滤 208

8.3.1 垃圾邮件 209

8.3.2 垃圾邮件过滤技术 209

8.3.3 垃圾邮件过滤案例 215

8.4 本章相关资源 218

第9章 数据挖掘和互连网广告 219

9.1 网络广告 219

9.2 广告作弊行为 223

9.3 网站联盟广告 225

9.4 网站联盟广告上的数码挖掘 226

9.4.1 数据助力网盟广告 227

9.4.2 怎么样应对网盟广告作弊 236

9.5 本章相关资源 241

第10章 数据挖掘和电子商务 242

10.1 中国电子商务现状 242

10.2 在互连网上卖米 248

10.3 用多少来支配客户 250

10.3.1 客户曾几何时来,从哪来 253

10.3.2 客户最欣赏哪类商品 257

10.3.3 竞争与反竞争分析 260

10.3.4 客户还会买怎么 261

10.3.5 哪些客户是我们须要的 264

10.4 电子商务案例 265

10.4.1 电子商务公司案例一 266

10.4.2 电子商务集团案例二 279

10.5 本章相关资源 286

第11章 数据挖掘和web挖掘 288

11.1 网络上的个性化–like 289

11.1.1 like=像 289

11.1.2 like=喜欢 290

11.2 web挖掘和sns 295

11.2.1 sns上的多寡价值 295

11.2.2 sns上的数量涉嫌关系 297

11.2.3 sns上的用户关系 299

11.3 数据挖掘和隐衷 302

11.4 本章相关资源 307

第12章 数据挖掘和运动互连网 308

12.1 移动网络的更加性 308

12.1.1 锁定用户的数量价值 309

12.1.2 移动互联网上数据的款型 310

12.1.3 移动互连网地理地点新闻的价值 312

12.2 数据挖掘和lbs 314

12.2.1 用pu学习算法做文本挖掘 315

12.2.2 用相似匹配算法做地方挖掘 318

12.3 移动网络数据面临的题材 320

12.4 本章相关资源 322

附录a 技术词汇表 323

附录b 克罗地亚语参考文献表 335

附录c 中文参考文献表 347

附录d 微博 350

附录e 博客和其他网址 351

 

图书信息来自:中原互相出版网

发表评论

电子邮件地址不会被公开。 必填项已用*标注