欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 数据分析技术--使用SQL和Excel工具(第2版)/大数据应用与技术丛书
      • 作者:(美)戈登S.林那夫|译者:陶佰明
      • 出版社:清华大学
      • ISBN:9787302461395
      • 出版日期:2017/03/01
      • 页数:604
    • 售价:55.2
  • 内容大纲

        SQL是数据查询的基本语言,Excel是数据分析和展示的常见工具。两者结合,可以组成一个强大且易于理解的业务数据分析工具。很多类重要的数据分析并不需要复杂且昂贵的数据挖掘工具。答案就在你的电脑桌上。
        这是一本实用指南,作者Gordon S.Linoff是数据挖掘领域的专家。书中介绍了如何使用SQL和Excel来设计并完成复杂的数据分析。由戈登S.林那夫著的《数据分析技术--使用SQL和Excel工具(第2版)/大数据应用与技术丛书》的第1版被广泛认可,第2版涵盖了对SQL和Excel新功能的介绍,同时包括新的技术和实际业务示例。第2版介绍了业务经理和数据分析人员所需掌握的新信息。
        本书首先介绍数据挖掘所用的SQL基础知识,如何使用Excel展示结果,以及用于理解数据的简单的统计学概念。熟悉执行SQL和操作Excel后,本书介绍了核心分析技术。本书内容逐步从基础查询扩展到复杂的应用,使读者能够学习到某种数据分析的使用原因和时机,如何设计和实现,以及展示数据分析结果的强大方法。每一步都详细解释了业务环境、技术方法以及在所熟悉工具中的具体实现。     随着对本书的阅读,你会发现很多知识点,包括地理信息的重要性,图表中的数据随时间的变化方式,如何使用生存分析理解客户任期和变动,以及影响生存率的因素。同时,还会探索到一些方法,包括分析客户的购买模式、分析购物车以及计算关联规则。此外,本书还包含重要的SQL数据挖掘模型(线性回归模型、朴素贝叶斯模型等)、建立客户签名所需的信息、用于分析结果集的模型、包含累积增量图表和ROC图表、使用SQL的佳实践、提高查询性能的方法等。
  • 作者介绍

        戈登S.林那夫从事数据库工作数十年。在他的记忆中,他开始学习SQL时,还是SQL92标准版。当时他正领导一支开发团队(现已不存在的Thinking Machines公司),编写第一个侧重于复杂查询的高性能数据库,用于支持决策分析。     此后,Gordon在1998年合作创建了Data Miners公司,这是一家致力于数据挖掘、分析和大数据的咨询公司。在他的工作生涯中,数据仍然是永恒的主题——而且通常是存储于关系型数据库中的数据。他对SQL的理解和应用也变得越来越深刻和娴熟。在2014年,他是Stack Overflow的最多贡献者,Stack Overflow是行业内领先的技术问答网站。     Gordon编写的另外几本书也都是畅销书:《数据挖掘技术(第3版)——应用于市场营销、销售与客户关系管理》、Mastering Data Mining和Mining the Web——这些书籍都侧重于数据挖掘和数据分析。本书延续广受好评的第1版,侧重于如何实际地获取和解释数据结果,更具有实践性。
  • 目录

    第1章  数据挖掘者眼中的SQL
      1.1  数据库、SQL和大数据
        1.1.1  什么是大数据?
        1.1.2  关系型数据库
        1.1.3    Hadoop和Hive
        1.1.4  NoSQL和其他类型的数据库
        1.1.5  SQI.
      1.2   绘制数据结构
        1.2.1  什么是数据模型?
        1.2.2  什么是表?
        1.2.3  什么是实体一关系图表?
        1.2.4  邮政编码表
        1.2.5  订阅数据集
        1.2.6  订单数据集
        1.2.7  关于命名的提示
      1.3  使用数据流描述数据分析
        1.3.1  什么是数据流?
        1.3.2  数据流、SQL和关系代数
      1.4  SQL查询
        1.4.1  做什么,而不是怎么去做
        1.4.2    SELECT语句
        1.4.3  一个基础的SQL查询
        1.4.4  一个基本的SQL求和查询
        1.4.5  联接表的意义
        1.4.6  SQL的其他重要功能
      1.5  子查询和公用表表达式
        1.5.1  用于命名变量的子查询
        1.5.2  处理统计信息的子查询
        1.5.3  子查询和IN
        1.5.4  用于工JNIONALL的子查询
        1.6  小结
    第2章  表中有什么?开始数据探索
      2.1  什么是数据探索?
      2.2  Excel中的绘图
        2.2.1  基础图表:柱形图
        2.2.2  单元格中的条形图
        2.2.3  柱形图的有用变化形式
        2.2.4  其他类型的图表
      2.3  迷你图
      2.4  列中包含的值
        2.4.1  直方图
        2.4.2  计数的直方图
        2.4.3  计数的累积直方图
        2.4.4  数字值的直方图(频率)
      2.5  探索更多的值——最小值、最大值和模式
        2.5.1  最小值和最大值
        2.5.2  最常见的值(模式)
      2.6  探索字符串值
        2.6.1  长度的直方图
        2.6.2  起始或结尾包含空白字符的字符串

        2.6.3  处理大小写问题
        2.6.4  字符串中存储的字符是什么?
      2.7  探索两个列中的值
        ……
    第3章  不同之处是如何不同?
    第4章  发生的地点在何处?
    第5章  关于时间
    第6章  客户的持续时间有多久?使用生存分析理解客户和他们的价值
    第7章  影响生存率的因素:客户任期
    第8章  多次购买以及其他重复事件.
    第9章  购物车里有什么?购物车分析
    第10章  关联规则.
    第11章  SQL数据挖掘模型
    第12章  最佳拟合线:线性回归模型
    第13章  为进一步分析数据创建客户签名
    第14章  性能问题:高效使用SQL
    附录  数据库之间的等价结构

同类热销排行榜

推荐书目

  • 孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...

  • 时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...

  • 本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...

更多>>>