北京友万信息科技携爬虫俱乐部将于2017年7月15-18日在武汉举行一期Stata编程技术定制培训。本期培训为应邀培训,人数控制在20名以内,我们已经有10位学员,因此只余10个名额,我们诚邀您的参加。此次培训是第一次采用四日培训模式,我们希望降低培训的强度,通过更多的练习,让学员能真正地掌握Stata数据分析的技巧,并能独立撰写简单的程序。本次课程内容覆盖了多种复杂数据的读取和输出、数据的合并、各种数据整理的技巧、源代码脚本的快速处理、简单网络爬虫工具、利用正则表达式的文本处理技术和利用正则表达式的网络爬虫技术等实用技术。这次课程我们专门还增加了Stata绘制各种图形的内容、工具变量回归、PSM-DiD和RD的估计方法。
全部课程采用案例教学的模式,经过爬虫俱乐部团队多年的精心策划,我们选择了合理的内容和合适的顺序,通过近20个教学案例,旨在帮助大家在较短的时间内掌握Stata软件与金融计算的核心技术和方法。
“爬虫俱乐部”(微信公众号)是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。爬虫俱乐部团队是stata技术控,专注于分享使用stata的技术,解决stata相关问题。提供编程技术咨询,编程和实证培训。“爬虫俱乐部”为提高爬虫君们的技术需求,以每天至少更新一个Stata技术的速度在为爬虫君们服务。
当前是信息社会高速发展的时代,信息无处不在,信息的价值和数量决定着一个人、一个企业以至于一个国家的未来,信息最常见的形式是数据,我们每天都要面对大量的数据,我们看到的仅仅是数据还是数据的背后,这直接决定着我们决策的正确与否。因此,数据分析、数据管理、数据呈现成为现代社会最具现实意义和最热门的工作。Stata是国际上最流行的数据分析、数据管理、数据呈现以及绘制专业图表的完整及整合性统计软件,该软件以其友好的人机界面,简单的编程语言和强大的功能,赢得了越来越多专业人士的关注和认可,其市场占有率也越来越高,STATA正逐渐成为许多研究都进行各门类社会科学学习和研究的首先软件。
演讲嘉宾
李春涛教授 —— 爬虫俱乐部创始人,香港大学博士,中南财经政法大学金融学教授,博士生导师。李春涛教授有15年的stata编程经验,编写过ttable2、chinafin、cntrade、eventstudy、psemail等stata命令,这些命令让中国的股票日交易数据、日内分时数据和上市公司财务数据免费且唾手可得,让Stata可以发送电子邮件,让中文地址和经纬度轻松转换等。李教授主要的研究方向为公司治理和企业创新,在Journal of Comparative Economics、International Journal of Auditing、Stata Journal、《经济研究》和《金融研究》等期刊发表论文近30篇。
周鹏 —— 香港大学中国金融研究中心助理研究员,长期在香港大学工作,具有多年的Stata编程经验,具有丰富的程序设计经验,参与多个实证研究项目,熟练掌握Mata技术、PSM-DiD技术,多次参与爬虫俱乐部的培训工作,有论文发表在《金融研究》,另有多篇论文在知名期刊审稿中。
薛原 —— 爬虫俱乐部资深Stata编程“砖家”,具有丰富的程序设计经验,参与多个实证研究项目,熟练掌握正则表达式,curl技术和各种爬虫技术,多次参与爬虫俱乐部的培训工作,积累了丰富的经验。
培训内容
第一部分:熟悉Stata | 第二部分:数据读入与读出 |
1)熟悉界面 2)读入Stata格式的数据 3)寻求帮助 4)DOS命令 5)Winexec调用windows系统 6)Copy 命令 7)常用命令 8)日期定义 9)函数 10)egen函数 |
1)stata数据文件 2)读入TXT、CSV文件 3)Excel文件 4)固定宽度的txt文件 5)分行显示的txt文件 6)基金经理变更案例 7)Music案例 8)CSSCI案例 |
第三部分:宏与循环 | 第四部分:数据标签 |
1)Local 2)Global 3)Macro extended function 4)While 循环 5)Forvalue 循环 6)跳出循环的continue 和continue, break 7) NBER案例 8) 年报案例 9) Foreach 循环 10) Wind2007案例 11) 多个Excel和多个Sheet案例 12) Levels of 13) Fs |
1)文件Label 2)变量label 3)数值label 4)通过label整理数据 (国家统计局企业调查数据) |
第五部分:字符串处理 | 第六部分:交易数据 |
1)中国上市公司审计数据库 2)审计意见 3)会计师事务所 4)中国上市公司高管数据库 5)找到总经理 6)找到董事长 7)找到独立董事 8)董事会的独立性 9)找到董事 10)找到董秘 11)两职合一 12)高校校友上市公司任职排行榜案例 |
1)万德或同花顺的系统 2)CSMAR系统 3)大量文件的纵向合并 4)如何获得文件名信息 5)CSMAR对缺失数据的编码 6)Wind系统可能会把有些数据录成字符型 7)重复录入的删除 8)变量的命名(万德) 9)变量的标签 10)日数据转换成月度、季度和年度数据 11)日数据转换成周数据(周三收盘) |
第七部分:财务数据 | 第八部分:Post |
1)通过CSMAR获取上市公司财务数据及清理过程 2)通过Wind获取上市公司财务数据及清理过程 3)财务数据的横向合并 4)给数据贴标签 5)ROA, ROE, Tobin’s Q等各种财务指标的计算 6)与行业数据横向合并 7)Jones Model和盈余管理 |
1)post 原理 2)定义post 3)计算同步性和Beta |
第九部分:回归分析 | 第十部分:内生性问题初步 |
1)基本统计信息 tabstat与tabstatmat 2)ttable2 3)相关系数矩阵 pwcorr 4)简单线性回归 regress 5)面板数据分析xtreg 6)interaction term 7)logit、Probit and Tobit 8)xtfmb 9)esttab与格式化输出结果 10)rtf系列命令 |
1)工具变量回归(IV) a)IV的基本原理 b)执行工具变量回归 c)回归后检验 i.弱工具变量检验 ii.过度识别检验 d)经典文献和常用的IV 2)双重差分(DID) a)DID的基本原理 b)单一时点DID c)多时点DID d)平行性假定的检验 i.回归分析法 ii.绘图法 e)PSM-DID介绍 |
第十一部分:正则表达式初步 | 第十二部分:基于正则表达式的网络爬虫 |
1)基本函数 2)元字符 a)英文字母(大写、小写) b)数字 c)符号 d)汉字 e)位置 f)向前向后 3)百分号编码 |
1)审计 2)邮编提取 3)姓名 4)城市名称 5)百度新闻搜索结果数量 6)Cssci 7)日期 8)Moss 9)subinfile 10)新浪高管 11)NBER |
培训目的
本次培训通过具体的案例对每部分技术进行讲解,力图使大家掌握Stata的基本命令、编程、数据处理以及抓取网络数据的方法。专题式的讲解使你能在短时间内掌握Stata的精髓,精选的实例和翔实的配套资料能让你在课后快速拓展所学,并能够编写一些实用的Stata程序,为进一步学习和科研打下扎实的基础。希望通过本次培训,使培训人员对Stata软件有更深入的认识,并在其工作岗位上发挥其强大的功能;同时,也希望通过本次会议,为所有喜爱Stata软件的专业人士搭建起沟通的桥梁。
培训时间及地点
2017年7月15日至18日(周六-周二),共四天。
中南财经政法大学
培训对象
国内高校教师、硕士生、博士生、科研院所科研人员、社会团体及Stata爱好者。
报名方式
请填写表格后于8月9日前,发送“报名回执表+支付截图”至邮箱:info@uone-tech.cn或传真至(010)56451128,邮件或传真主题为:“Stata20170715武汉+姓名+单位”。
培训费用
培训费:4600元/人,学生3600元/人(学生需出示有效学生证件)。
支付方式
对公转账:
开户名:北京友万信息科技有限公司
开户行:中国建设银行北京昌平支行
帐号:11050181360009366857
备注:姓名、发票抬头、纳税人识别号、开票内容
相关单位
主办方:北京友万信息科技有限公司、爬虫俱乐部
其它事项及培训安排
1、请学员自带笔记本电脑,我司将提供Stata原厂软件试用程序。
2、本次培训住宿及往返交通费用学员自理,会务组安排培训期间的午餐及课间茶歇饮品供学员享用。
3、为了保证培训质量,本次培训限额人数20人,即日起开始正式报名和收费,按交费先后顺序,招满即停止报名。
专享礼遇:
1、参会学员签到当天可领取精美笔记本及资料一份。
2、凡参加本次培训,一年内购买Stata IC/SE/MP软件单机版本,给予10%价格优惠。
3、凡参加本次培训,一年内购买Stata IC/SE/MP软件实验室版本,给予10%价格优惠,并免费
赠送Stata视频培训DVD学习课程一套。
4、构建包括Stata软件在内的大数据实验室软件,项目完成后免费奉送现场Stata为期三天培训
券1张。邀请免费参加年度Stata用户大会。
会务组联系方式
联系人:陈老师
手机/WeChat:18600528290
QQ :2196837879
电话:010-56451126、010-56451129
传真:010-56451128
邮箱:info@uone-tech.cn