欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • R数据科学(影印版第2版)(英文版)
      • 作者:(新西兰)哈德利·威克姆//(美)米内·C.伦德尔//加勒特·格罗勒芒|责编:张烨
      • 出版社:东南大学
      • ISBN:9787576611892
      • 出版日期:2024/03/01
      • 页数:550
    • 售价:63.2
  • 内容大纲

        使用R将数据转化为洞见、知识和理解。通过这本实践用书,有志成为数据科学家的读者将掌握如何使用R和RStudio从事数据科学,同时还会学习tidyverse,这是一组R软件包的集合,旨在协同工作,使数据科学变得快速、流畅、有趣。即使你没有编程经验,这本更新版也能让你快速上手。
        你将学习如何导入、变换以及可视化你的数据,并传达结果。你将从宏观上全面了解数据科学周期以及管理细节所需的基本工具。全书根据最新的tidyverse特性和最佳实践进行了更新,新的章节向你展示了如何从电子表格、数据库和网站获取数据。书中提供的练习有助于你将理论应用于实践。
        你将理解如何:
        可视化:创建用于数据探索和结果传达的图表;
        变换:发现变量类型及其处理工具;
        导入:将数据以便于分析的形式传给R;
        编程:学习R工具,更清晰、更轻松地解决数据问题;
        交流:用Quart0整合普通文本、代码和结果。
  • 作者介绍

  • 目录

    Introduction
    Part Ⅰ.Whole Game
      1.Data Visualization
        Introduction
        First Steps
        ggplot2 Calls
        Visualizing Distributions
        Visualizing Relationships
        Saving Your Plots
        Common Problems
        Summary
      2.Workflow: Basics
        Coding Basics
        Comments
        What's in a Name?
        Calling Functions
        Exercises
        Summary
      3.Data Transformation
        Introduction
        Rows
        Columns
        The Pipe
         Groups
         Case Study: Aggregates and Sample Size
         Summary
      4.Workflow: Code Style
         Names
         Spaces
         Pipes
         ggplot2
         Sectioning Comments
         Exercises
         Summary
      5.Data Tidying
         Introduction
         Tidy Data
         Lengthening Data
         Widening Data
         Summary
      6.Workflow: Scripts and Projects
         Scripts
         Projects
         Exercises
         Summary
      7.Data Import
         Introduction
         Reading Data from a File
         Controlling Column Types
         Reading Data from Multiple Files

         Writing to a File
         Data Entry
         Summary
      8.Workflow: Getting Help
         Google Is Your Friend
         Making a reprex
         Investing in Yourself
         Summary
    ……
    Part Ⅱ.Visualize
      9.Layers
      10.Exploratory Data Analysis
      11.Communication
    Part Ⅲ.Transform
      12.Logical Vectors
      13.Numbers
      14.Strings
      15.Regular Expressions
      16.Factors
      17.Dates and Times
      18.Missing Values
      19.Joins
    Part Ⅳ.Import
      20.Spreadsheets
      21.Databases
      22.Arrow
      23.Hierarchical Data
      24.Web Scraping
    Part Ⅴ.Program
      25.Functions
      26.Iteration
      27.A Field Guide to Base R
    Part Ⅵ.Communicate
      28.Quarto
      29.Quarto Formats
    Index