2017年2月17日,由爬虫俱乐部(微信号)携友万科技举办的爬虫俱乐部第四届Stata编程技术训练营-2017年武汉专场,于中南财经政法大学如期举行。本次培训邀请到中南财经政法大学金融学院李春涛教授、武汉大学罗知教授及爬虫俱乐部薛原为主讲人。现场有来自北京大学、中山大学、武汉大学、复旦大学、社科院、暨南大学、华东师大、湖南大学、中国矿大、中国地大、南审、合肥工大、武汉理工大学、对外经贸大学、贵州财经、西南财经、中南财经、江西财经等高校的教师和学生大约50位学员参加了此次为期三天的Stata技术培训。培训内容涵盖了复杂数据的读取、数据整理的法宝、处理文本的利器、以及各种网络爬虫工具等实用技术。
第一天,数据的读入与循环
(1) Stata基础与DOS命令介绍
(2) Stata格式数据的读入
(3)文本文件的读入
(4)读入Excel数据(single sheet vs multiple sheets)
(5)读入固定宽度数据(文本文档及网页数据读入)
(6)局部宏与全局宏的定义
(7)系统常量的访问
(8)循环格式
(9)if, continue &break
(10)return code
(11)copy命令
(12)NBER工作论文的下载
(13)上市公司年报下载
(14)宏扩展函数应用(如何获得文件名列表)
第二天,post命令、字符串函数与正则表达式、网络数据抓取
(1)post命令简介
(2)事件研究法(基于网络数据)
(3)股价同步性计算(基于网络数据)
(4)股本变更数据之整理
(5)字符串函数
(6)正则表达式初步
(7)名和姓的提取(UCLA例子)
(8)地址中邮政编码的提取(UCLA例子)
(9)期刊名称的提取
(10)百度新闻搜索结果数量的提取
(11)中文地址中城市的提取
(12)提取日期
(13)moss命令
(14)subinfile命令
(15)网络数据抓取初步
第三天,回归结果输出、DID及RDD
(1)基本统计特征及其结果输出
(2)分组比较之ttable2
(3)相关系数矩阵及其输出
(4)各种回归命令介绍
(5)回归结果输出之esttab
(6)双重差分DID
(7)断点回归设计RDD
(8)分析师与盈余管理研究案例
本次培训的内容秉承由简入深、删繁就简的原则,课程主要包括网络数据整理方法、正则表达式、结果输出方法、双重差分技术和断点回归技术。培训课程经过李教授团队多年的精心开发,通过选择合理的内容,合适的顺序,引用大量的例子,旨在帮助大家在较短的时间内掌握Stata软件与金融计算的核心技术和方法。在内容讲解期间,研讨会一如既往地安排了参会嘉宾现场操作与交流答疑环节及茶歇饮品,爬虫俱乐部及友万科技服务团队以最好的服务帮助大家对讲解的内容进行理解。
请继续关注友万科技;继续关注爬虫俱乐部。今后我们将携手定期举办Stata软件在编程及数据统计分析方面技能等培训、以及分行业的专题研讨会。