-
内容大纲
本书从Excel处理大型数据的缺点开始讲起,逐步讲解了Excel和Power BI中的Power Query组件,并重点介绍了Power Query的底层M语言的应用知识。
本书分为10章,主要讲解了Power Query的入门知识和数据集成、Power Query的M语法规则系列知识,针对Power Query如何实现数据清洗和重构系列知识做了详细的讲解,还重点介绍了目前Power Query的各类内置函数的功能,最后介绍了如何利用自定义函数实现复杂的数据处理和重构过程。
本书内容通俗易懂,案例丰富,实用性强,特别适合入门级数据分析人员学习,也适合进阶阅读,相信通过阅读本书,读者对数据分析过程中的清洗和重构会有一个新的认识。 -
作者介绍
徐鹏,微软最有价值专家、微软最有价值售前专家,先后就职于宏碁(中国)有限公司、微软(中国)有限公司。为全球500强企业提供各类业务的优化服务及顾问咨询服务,精通数据分析方法论及Windows系统的自动化运维。 -
目录
第1章 走入Power Query的世界
1.1 Excel处理数据的缺点
1.2 Excel的Power数据处理组件
1.3 Power Query组件
1.3.1 Excel的Power Query组件
1.3.2 Power BI的Power Query数据导入界面
1.4 Power Query编辑器
1.4.1 Excel的Power Query编辑器界面
1.4.2 Power BI的Power Query编辑器界面
1.4.3 Excel在Power Query数据处理中的优势
1.4.4 Power BI在Power Query数据处理上的优势
1.5 Power Query的底层语言——M语言
1.6 本章总结
第2章 Power Query的数据集成
2.1 Power Query的CSV/TXT数据集成
2.1.1 Excel 导入CSV数据
2.1.2 Power BI导入CSV数据
2.2 Power Query的Excel数据集成
2.2.1 Excel中的Excel数据导入与集成
2.2.2 Power BI中的Excel数据导入与集成
2.3 Excel 导入当前表格中的数据
2.4 XML格式数据集成
2.4.1 Excel 实现XML数据的集成
2.4.2 Power BI导入XML格式数据
2.5 JSON格式数据集成
2.5.1 Excel实现JSON数据集成
2.5.2 Power BI实现JSON数据集成
2.6 文本格式数据集成
2.6.1 Excel以文本格式导入数据
2.6.2 Power BI以文本格式导入数据
2.7 Power Query的SQL Server数据集成
2.7.1 Excel获取SQL Server全部数据
2.7.2 Excel获取T-SQL 筛选后的数据
2.7.3 Power BI以导入方式获取SQL数据
2.7.4 Power BI采用Direct Query获取SQL数据
2.8 Power Query导入Web数据
2.8.1 Excel 实现Web的数据获取
2.8.2 Power BI实现Web的数据获取
2.9 Power Query 导入Web API数据
2.9.1 Excel 实现Web API数据获取
2.9.2 Power BI实现Web API数据获取
2.10 Power Query导入MySQL数据
2.10.1 Excel实现MySQL数据获取
2.10.2 Power BI实现MySQL数据获取
2.11 Power Query导入文件夹数据
2.11.1 Excel提取文件夹所有文件数据
2.11.2 Power BI提取文件夹的所有数据
2.12 Power BI中的数据流服务
2.12.1 Power BI Pro构建数据流服务
2.12.2 Power BI Desktop引用数据流服务
2.13 数据源访问的权限管理
2.14 本章总结
第3章 Power Query和M语言
3.1 什么是M语言
3.2 M语言支持的基本数据类型
3.3 M语言支持的组合数据类型
3.4 Power Query的M语言结构
3.5 Power Query中M语言的智能提示
3.6 Power Query的M语言变量
3.7 Power Query的M语言参数
3.8 Power Query的M语言流程处理
3.9 Power Query的M语言的错误处理
3.10 Power Query的M语言嵌套
3.11 Power Query的M语言操作符
3.12 M语言的注释
3.13 本章总结
第4章 Power Query实现数据的清洗和重构
4.1 数据清洗遵从的原则
4.2 数据清洗后的操作
4.3 数据清洗和重构具体操作
4.4 Power Query实现数据类型的转换
4.4.1 Excel中数据类型转换
4.4.2 Power BI数据类型转换
4.5 Power Query实现列的删除
4.6 Power Query实现行的删除
4.7 Power Query保留行操作
4.8 Power Query的数据筛选
4.9 Power Query添加数据列
4.10 Power Query按列分列
4.11 Power Query按列分行
4.12 Power Query的数据转置
4.13 Power Query数据替换
4.14 Power Query数据列交换
4.15 Power Query的数据排序
4.16 Power Query时间表的构建
4.17 本章总结
第5章 Power Query实现数据合并操作
5.1 Power Query数据多重合并操作
5.2 Power Query数据追加合并操作
5.3 Power Query数据横向合并
5.4 数据合并连接关系说明
5.5 Power Query处理缺失值
5.6 Power Query实现数据的分组
5.7 Power Query实现数据的透视
5.8 Power Query实现数据的逆透视
5.9 本章总结
第6章 Power Query查询连接的分享与刷新
6.1 Power Query数据连接的分享与重用
6.2 Excel中的Power Query连接与复制
6.3 Power Query连接的导出与导入
6.4 Power Query的数据刷新
6.4.1 Excel的刷新功能
6.4.2 Power BI的刷新功能
6.5 本章总结
第7章 Power Query的函数
7.1 Power Query函数的获取与使用
7.2 Power Query文件系列访问函数
7.2.1 CSV文件解析
7.2.2 Excel文件内表解析
7.2.3 引用第三方Excel数据
7.2.4 XML文件解析
7.2.5 JSON文件解析
7.3 数据库访问函数
7.3.1 Access数据库访问
7.3.2 SQL Server数据库访问
7.3.3 MySQL数据库访问
7.4 Web访问函数
7.4.1 Web.Contents函数
7.4.2 Web.Page函数
7.4.3 Web.BrowserContents函数
7.4.4 Html.Table函数
7.5 Power Query文本处理函数
7.5.1 Text.Length计算字符串长度
7.5.2 Text.Insert插入字符串
7.5.3 Text.From将其他数据类型转换为文本类型
7.5.4 Text.Format设置文本输出格式
7.5.5 Text.Tolist将文本转换为列表
7.5.6 Text.Start截取字符串中前面的字符
7.5.7 Text.Select删除不需要的字符串
7.5.8 Text.Middle截取中间部分字符
7.5.9 Text.End截取从设定位置到结尾的字符
7.5.10 Text.Range获取字符串范围数据
7.5.11 Text.Replace替换特定数据
7.5.12 Text.ReplaceRange替换区域数据
7.5.13 Text.Repeat重复文本
7.5.14 Text.Combine合并文本
7.5.15 Text.Trim删除前后特定字符
7.5.16 Text.Padstart占位符填充
7.5.17 Text.Split字符串分隔
7.5.18 Text.BeforeDelimiter获取分隔符前的数据
7.5.19 Text.AfterDelimiter获取分隔符后的数据
7.5.20 Text.BetweenDelimiters获取分隔符中间值
7.6 Power Query列表处理函数
7.6.1 List.Accumulate列表累加器计算
7.6.2 List.Range获取列表区域
7.6.3 List.Average计算列表平均数
7.6.4 List.Sum对列表求和
7.6.5 List.Combine合并列表
7.6.6 List.Count统计列表元素
7.6.7 List.Dates创建日期列表
7.6.8 List.LastN获取列表最后N个元素
7.6.9 List.MaxN获取最大数据
7.6.10 List.Numbers生成数值列表
7.6.11 List.Product列表元素乘积
7.6.12 List.Random生成随机数列表
7.6.13 List.RemoveFirstN删除列表前面N个数值
7.6.14 List.RemoveItems删除列表项
7.6.15 List.RemoveRange删除列表区间数值
7.6.16 List.Repeat重复列表数据
7.6.17 List.ReplaceRange替换列表区间
7.6.18 List.Select筛选列表
7.6.19 List.Skip实现列表行跳跃
7.6.20 List.Sort列表排序
7.6.21 List.Split列表分割
7.6.22 List.Union对列表非重复数据进行合并
7.6.23 List.Generate生成列表
7.6.24 List.Zip列表提取与组合
7.7 Power Query记录处理函数
7.7.1 Record.AddField添加记录字段功能
7.7.2 Record.Combine记录连接
7.7.3 Record.FromList将列表转换记录
7.7.4 Record.RemoveFields删除字段
7.7.5 Record.SelectFields选择记录
7.7.6 Record.Tolist将记录转换为列表
7.8 Power Query表处理函数
7.8.1 Table.AddColumn在表中添加并计算列
7.8.2 Table.AddIndexColumn为表添加索引列
7.8.3 Table.AddJoinColumn添加嵌套表
7.8.4 Table.AlternateRows行跳跃
7.8.5 Table.Combine合并数据表
7.8.6 Table.DemoteHeaders实现表标题降级
7.8.7 Table.Distinct获取表唯一值
7.8.8 Table.ExpandListColumn扩展列表
7.8.9 Table.ExpandRecordColumn扩展记录列
7.8.10 Table.ExpandTableColumn扩展表数据
7.8.11 Table.FindText查找内容
7.8.12 Table.FirstN获取前面的表数据
7.8.13 Table.Group对表数据聚合
7.8.14 Table.Join进行表连接
7.8.15 Table.LastN获取表最后几行数据
7.8.16 Table.MaxN求表中最大的N个数据
7.8.17 Table.MinN求表中最小的N个数据
7.8.18 Table.PromoteHeaders将第一行提升为标题行
7.8.19 Table.Range选择区域行
7.8.20 Table.RemoveColumns删除列
7.8.21 Table.RemoveFirstN删除表前面的行
7.8.22 Table.RemoveLastN删除表后面的行
7.8.23 Table.Repeat实现表行重复
7.8.24 Table.ReplaceRows替换数据行
7.8.25 Table.ReplaceValue替换数据值
7.8.26 Table.SelectRows筛选数据
7.8.27 Table.Skip实现表的行跳跃
7.8.28 Table.Sort对表排序
7.8.29 Table.Transpose互换行列
7.9 Power Query URL处理函数
7.9.1 Uri.BuildQueryString构建URL访问地址参数
7.9.2 Uri.Combine合并URL访问地址
7.10 Power Query数据合并函数
7.10.1 Combiner.CombineTextByDelimiter以分隔符方式合并字符
7.10.2 Combiner.CombineTextByEachDe-limiter按顺序分隔符合并文本
7.11 Power Query数据分割函数
7.11.1 Splitter.SplitTextByDelimiter按分隔符拆分数据
7.11.2 Splitter.SplitTextByEachDelimiter按分隔符列表拆分数据
7.11.3 Splitter.SplitTextByLengths按照长度拆分数据
7.11.4 Splitter.SplitTextByRepeatedLength按字符长度重复拆分
7.11.5 SplitTextByPositions按位置拆分
7.12 Power Query日期时间函数
7.12.1 Date.Day获取日期部分
7.12.2 Date.DayOfWeek求取日期位于一周中的第几天
7.12.3 Date.DayOfYear求取日期位于一年中的第几天
7.12.4 Date.DaysInMonth求取日期所在月份的天数
7.12.5 Date.FromText将文本生成日期
7.12.6 Date.AddDays日期的加减
7.12.7 Date.AddMonths月度加减运算
7.12.8 Date.AddYears年度加减运算
7.12.9 Date.ToText将日期转换为文本
7.12.10 Date.ToRecord将日期转换为记录
7.12.11 DateTime.LocalNow获取当前时间
7.13 本章总结
第8章 Power Query的自定义函数
8.1 从零开始构建自定义函数
8.1.1 无参数自定义函数构建
8.1.2 有参数自定义函数构建
8.2 基于数据结果建立函数
8.3 执行并获取自定义函数结果
8.4 自定义函数提取文件夹内所有请假数据
8.5 自定义函数获取基金即时净值
8.6 本章总结
第9章 Power Query与Python
9.1 Power Query调用Python的前置条件
9.2 Python环境的安装与部署
9.3 Power BI启用Python支持
9.3.1 Power Query执行Python验证
9.3.2 Power Query结合Python生成中文词云
9.4 本章总结
第10章 Power Query数据综合应用案例
10.1 身份证信息的初步导入
10.2 身份证号码数据初步清洗
10.3 身份证数据二次清洗
10.4 非中文姓名数据清洗
10.5 本章总结
附录 Power Query简单案例处理
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...