-
内容大纲
本书是国内系统性介绍Stata正则表达式的书籍。本书是我们在数据分析和编程教学过程中积累的案例和经验的结晶,案例和内容都是原创的,介绍的命令中也有自己开发的。书中的案例都是以中文读者为背景,比如我们关于元字符的介绍,特别要告诉读者如何通过正则表达式提取中文字符,比如网络数据采集的部分,我们介绍的都是基于中国网站数据采集的例子。对每一项技术的介绍,我们都试图用例子加以佐证,让晦涩的正则表达式变得更加有趣味性。书中的数据和程序放在本书配套的网站上,并提供了通过Stata下载的完备程序。 -
作者介绍
-
目录
第1章 正则表达式入门
1.1 通配符
1.2 正则表达式
1.3 正则表达式的用途
1.4 如何使用正则表达式
1.5 Stata版本选择
1.6 字符、字节与Stata编码
1.7 本章小结
第2章 正则表达式字符串函数
2.1 匹配函数:regexm()和ustrregexm()
2.2 提取函数:regexs()和ustrregexs()
2.3 替换函数:regexr()、ustrregexrf()和ustrregexra()
2.4 本章小结
第3章 元字符
3.1 基本元字符
3.2 数量元字符
3.3 特殊字符元字符
3.4 位置元字符
3.5 前后查找
3.6 空白元字符
3.7 回溯引用:前后一致匹配
3.8 Unicode转义字符
3.9 POSIX字符类元字符
3.10 本章小结
第4章 正则表达式综合运用
4.1 英文地址提取邮编(三)
4.2 提取性别、年龄、种族
4.3 中文地址中城市名称的提取
4.4 英文姓名拆分(二)
4.5 提取生产日期
4.6 本章小结
第5章 与正则表达式相关的命令
5.1 moss命令
5.2 subinfile命令
5.3 filesearch命令
5.4 fromroman命令
5.5 toroman命令
5.6 varsearch命令
5.7 screening命令
5.8 jregex命令
5.9 本章小结
第6章 正则表达式与网络爬虫
6.1 网络爬虫概述
6.2 基于网络爬虫编写的命令
6.3 网络爬虫实例
6.4 本章小结
附录A 基础ASCII字符表
附录B 生成基础ASCII表的Stata程序
后记
同类热销排行榜
[an error occurred while processing this directive]推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
