欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据应用与实训教程(电子与信息类新编21世纪高等职业教育精品教材)
      • 作者:编者:于晓荷//辛向丽|责编:苏昌盛
      • 出版社:中国人民大学
      • ISBN:9787300318875
      • 出版日期:2023/07/01
      • 页数:137
    • 售价:14
  • 内容大纲

        在大数据和人工智能时代,海量的数据无处不在,人们可以通过对数据的收集、分析、统计和可视化,从海量的数据中挖掘有价值的信息,发现其中的规律,对事件进行预测,进而制定有针对性的决策。
        Python语言功能强大、可读性高,且在数据分析和数据可视化等方面有许多成熟的第三方库和活跃的社区,因此各行各业越来越多的人使用Python 进行数据分析。
        本书共分为6个项目,除了项目一讲解环境搭建外,其余5个项目均基于具有实用性和普适性的案例来编写,将数据的收集、获取、预处理、分析与可视化贯穿其中。
  • 作者介绍

  • 目录

    项目一 大数据分析开发环境的搭建
        知识链接
        一、数据分析的概念
        二、数据分析的应用
        三、数据分析的流程
        四、数据分析前的准备
      项目实施
        一、Python的下载及安装
        二、PyCharm的下载及安装
        三、Anaconda的下载及安装
        四、Jupyter Notebook的使用
      项目拓展
        一、插件的安装
        二、常用的插件
    项目二 Beautiful Soup库和Matplotlib库的使用
        知识链接
        一、Requests库
        二、Beautiful Soup库
        三、Pandas库的concat()函数
        四、数据的聚合与分组运算
        五、Matplotlib库
        六、bar0函数
        七、plotO函数
      项目实施
        一、新建项目
        二、安装Requests库
        三、使用Requests库获取页面HTML标签
        四、使用Beautiful Soup库对页面进行解析
        五、将获取的信息保存为csv格式文件
        六、在Jupyter中处理数据并进行可视化分析
      项目拓展
        一、find_all0方法速查表(见表2-2)
        二、find0方法速查表(见表2-3)
        三、selectO方法速查表(见表2-4)
        四、其他方法
        五、HTML速查表(见表2-6)
    项目三 Scrapy框架与Matplotlib库中bar函数的使用
        知识链接
        一、Scrapy框架
        二、jieba库
        三、Matplotlib库中pyplot模块的bar函数
      项目实施
        一、创建Scrapy项目
        二、创建爬虫文件
        三、参数配置
        四、编写爬虫文件,获取第1页的20条诗词信息
        五、分页信息的获取
        六、爬取信息的保存
        七、在Jupyter中处理文本并进行可视化分析
      项目拓展

        一、创建Scrapy项目和爬虫文件
        二、配置settings.py文件
        三、编写items.py文件
        四、编写pipelines.py文件
        五、编写爬虫文件
    项目四 Selenium库和Matplotlib库的使用
        知识链接
        一、Selenium库
        二、Selenium库的常用操作
        三、Pandas库的sort_values()函数
        四、Matplotlib库的pie()函数
        五、使用loc和iloc进行索引
      项目实施
        一、新建项目
        二、安装Selenium库
        三、下载Chrome浏览器和浏览器驱动
        四、使用Selenium库获取第1页的文本信息
        五、获取前3个页面的页面文本信息
        六、将获取的信息保存为csv格式文件
        七、在Jupyter中处理数据并进行可视化分析
    项目五 XPath和Matplotib库中barh函数的使用
        知识链接
        一、lxml库
        二、XPath
        三、Xpath的路径表达式
        四、Matplotlib库的barhO函数
      项目实施
        一、新建项目
        二、安装Ixml库和Requests库
        三、使用Requests库获取第1页的HTML标签信息
        四、用etree模块的HTMLO方法对获取的标签进行解析
        五、使用XPath提取解析后的HTML中的文本信息
        六、获取所有页面的信息
        七、将获取的信息保存为csv格式文件
        八、在Jupyter中处理数据并进行可视化分析
    项目六 pyecharts库的使用
        知识链接
        一、pyecharts概述
        二、柱状图的绘制
        三、折线图的绘制
        四、饼图和环形图的绘制
        五、多图叠加
      项目实施
        一、使用柱状图可视化“平均每股收益(元)”和“平均每股净资产(元)”
        二、使用柱状图与折线图对“营业收入(元)”“营业成本(元)”
        “营业利润(元)”进行数据可视化分析
        三、使用饼图可视化2018至2021年的毛利率
      项目拓展
        一、其他类型图表的绘制
        二、组合图的创建