2019 Stata夏季训练营暨机器学习与Stata、R应用研讨会于2019年8月17-19日在上海财经大学火热开营并取得圆满成功!近年来人工智能迅速进入大众视野,并在全球范围内迎来了行业的快速发育期。机器学习作为人工智能的组成部分,无疑是人工智能科学研究和应用领域的重要驱动力,将带来一系列传统决策机制的根本性变革,势必推动社会科学研究范式的重大转型。 机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。在本课程中主要介绍机器学习的基本思想与算法,并结合具体案例,介绍Stata和R语言实践操作。
“计量男神”陈强老师开办过多次计量相关的现场班,反响都非常好,好评度也非常高,本次训练营是陈老师首期讲机器学习相关内容的现场班,参加课程的学者们充满了期待。来自全国60所高校和科研单位的近百名学者齐聚上海财经大学,跟着陈强老师一起走进机器学习。参加本次培训班的学者既有刚刚入学的硕士生,也有年逾六十的资深教授;既有普通院校的学子,也不乏北大复旦上财的精英,名校的海归教师,甚至暑期在国内的海外学者与留学生。从涵盖专业来看,除了经管社科外,也吸引了不少医学卫生领域的专家。感谢学者们热情参与,感谢上海财经大学承办本次夏令营并为学者们提供了一个设备先进、配置齐全的教学环境,感谢校方的大力支持。
8月16日下午开始, 学者们陆续签到、领取资料,会务组专门为学者们准备了“新版Stata 16 MP2软件”试用现场安装,确保每位老师都能正常、安全的运行数据资源,保证上课质量。
在三天的授课过程中,教室的空气里似乎始终弥漫着一种令人激动的氛围。陈强教授开宗明义地祝贺大家,作出了正确的决定,成为最早一批学习与应用机器学习的探索者。
课上座无虚席
陈老师随后将机器学习的精髓知识,由浅入深,如数家珍,娓娓道来,丝丝入扣,环环相连,再结合Stata与R语言的经典案例,不时让学员们豁然开朗,感受顿悟的喜悦。用陈老师自己的话来说,“三天可以得到两个宝,即机器学习与R语言,这门课实在是太值了”。
在课间与课后,陈强老师还耐心地解答了学员们的所有问题,当场释疑解惑。
课 程 大 纲
第一讲 机器学习引论 | 什么是机器学习 、机器学习的分类与术语 、案例:垃圾邮件过滤;手写体数字识别;图像识别;自动驾驶 |
第二讲 惩罚回归 | OLS、 Ridge Regression 、 Lasso 、Elastic Net 、交叉验证 (Cross-validation) 、 Post Double Lasso and IV Lasso 、 Stata案例 |
第三讲 线性分类 | Logit 、多项Logit 、 贝叶斯决策理论 、 线性判别分析 、二次判别分析 、 ROC/AUC 、Stata案例 |
第四讲 R语言快速入门 | Why R? 、 安装R与RStudio 、R的对象(vector, matrix, data frame, list) 、 面向对象的函数式语言 、 R语言画图 |
第五讲 朴素贝叶斯 | 朴素贝叶斯、 拉普拉斯修正、R案例 |
第六讲 K近邻法 | KNN for Regression 、 KNN for Classification 、偏差与方差的权衡 、 维度灾难 、 R案例 |
第七讲 决策树 (Decision Tree) | 分类树、 分裂准则(错分率、基尼指数、信息熵)、 修枝与交叉验证、 回归树、 R案例 |
第八讲 装袋法与随机森林 | 集成学习(Ensemble Learning) 、装袋法(Bagging) 、随机森林(Random Forest) 、变量重要性(Variable Importance) 、偏依赖图(Partial Dependence Plot) 、R案例 |
第九讲 提升法 | 自适应提升法 (AdaBoost) 、 AdaBoost的统计解释 、 梯度提升法 (Gradient Boosting Machine) 、 R案例 |
第十讲 支持向量机 | Maximal Margin Classifier 、 Soft Margin 、 Support Vector Machine 、 Kernel Trick 、 R案例 |
第十一讲 支持向量机 | 前馈神经网络 、反向传播算法(Back-propagation Algorithm) 、随机梯度下降(Stochastic Gradient Descent) 、神经网络的过拟合 、深度学习的发展 、R案例 |
第十二讲 机器学习在经济学的应用 | 精读几篇在经济学顶刊发表的经典机器学习论文 |
过短短三天的学习与操作,学员们纷纷表示,收获巨大,陈老师的课程揭开了机器学习的神秘面纱,原本觉得很难的机器学习经过陈老师的讲解变得如此简单(以下为学员反馈):
● 今天听了您的课,收获很多!
● 谢谢陈老师!听您讲课受益良多!
● 陈强老师的高维空间景色宜人……
● 感谢陈老师!每次听课都收益匪浅!
● 谢谢陈老师,这几天学了不少新的东西,辛苦了!
● 近几日听您讲课收获很大,今后还要向您多多学习!
● 很荣幸这次在上财能够聆听您的课。您的计量书籍对我的学习帮助很大,谢谢您!
● 今天上课干货满满……这两天参加您的培训,收获很大,希望未来有机会也请您到我们学校交流。
● 陈老师好,以前都是读你的书,给学生推荐你的书和公众号,这几天听你讲课,信手拈来,深入浅出,果然是高手中的高手!
● 之前一直听您的视频课,看公众号收获特别大。都打印装订成册了,老师你公众号写的特别生动,有的不好理解的地方一看您的比喻就豁然开朗了,都是原创的内容,特别有吸引力,真的可以再可以出一本书呢。今天听机器学习,还是用R和Stata,耳目一新呢,原来比较多的学的Python,上了您的课收获特别大。
三天的课程内容充实而丰富,机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。 本课程主要介绍了机器学习的基本思想与算法,并结合具体案例,介绍Stata和R语言实践操作。关于机器学习在未来的路上还有更多值得我们去探索和学习的空间,期待陈老师的新书,也欢迎随时关我们的Stata校园行活动,未来还将继续推出更多定制和非定制课程。
Stata校园行活动
“Stata校园行活动”是为了促进Stata软件的应用、提高学员的学习质量和学习效率、推进大数据分析人才培养的宽度和广度,而开展的高校线下学习活动。内容覆盖经济学、金融学、会计学、计算语言学、新闻学、政治学、历史学、医药卫生等微观和宏观计量分析的热门应用领域。主旨顺应大数据时代要求,通过活动路演、创新讲座等系列活动的举办,深度推进国内青年学者学习热情,提升高校学术交流氛围,整合学界及业内的大量资源,进一步提高数据分析能力和科学决策的水平。
诚邀国内高校参与“Stata校园行活动”,各高校可定制校内Stata实训班,根据课程内容、知识点、培训时间、学生水平、培训对象、授课讲师等需求自由定制,届时敬请各界学者踊跃报名。