北京理工大学“大数据创新学习中心”迎合了广大师生、科研工作者研究与学习需要,与高校、科研机构和科技信息企业展开了合作,最大限度地共享校内外大数据研究与分析资源,开辟了“学中用、用中学”的创新学习新模式。“大数据创新学习中心”指导教师团队来自学界(如东南大学、北京大学、清华大学、中科院)和业界(如雪晴数据网、上海海翼知公司、清华大数据联合研究院、深圳狗尾草科技公司、北京友万信息科技有限公司)目前已经开展了Python基础理论学习、Python实战学习和知识图谱理论学习活动,有350余名师生及业界爱好者参与了学习活动。
我中心将于2017年5月27日至28日在北京理工大学研究生院,举办“Python学习汇报暨人工智能与计算”的交流学习活动,包括三个环节:1. 学员们以案例驱动的方式讲解“Python基础理论知识及在大数据分析、商业数据挖掘、机器学习和人工智能中的应用”;2. 邀请学界、业界知名学者做“人工智能与计算”系列主题报告;3. 业界精英研发经验分享。
时间地点:
2017年5月27日至28日
北京理工大学研究生院103教室北京市海淀区中关村南大街5号
食宿安排:
会议免收会议费,提供茶歇,参会人员食宿与交通费用自理
一、主题报告环节简介
报告1:基于图计算的高性能大数据分析系统Gemini
报告人:陈文光清华大学教授
摘要:现有大数据分析系统,如MapReduce和Spark,主要以编程的简易性、可扩展性和容错能力为设计原则,牺牲了平台的处理性能。我们将讨论容错与性能的关系,指出性能与容错并非是相互排斥的设计理念,并介绍高性能分布式图计算系统的实例Gemini。Gemini在图的划分方法、数据结构、局部性优化、细粒度负载平衡和通信与计算重叠方面提出了一系列优化技术。在典型的图处理应用中,该系统需要的内存是约为GraphX的十分之一,性能是Spark GraphX的100倍以上。
报告人简介:陈文光,清华大学计算机系教授,主要研究领域为并行与分布式系统的编程系统。现为中国机算机学会杰出会员和杰出讲者,副秘书长;ACM中国理事会副主席,ACM中国操作系统分会ChinaSys主席。
报告2:智能一切:时代-机器-产业
报告人:马宏宾北京理工大学教授
摘要:您是否感受到智能时代?您是否使用着智能机器?您是否受益于智能产业?您是否关注着人工智能?您是否浸入于商业智能?您是否听说过工业智能?您是否对未来有所焦虑?您是否对未来有所期待?他将与您分享他的思考,他将向您介绍他的行动!
报告人简介:马宏宾北京理工大学教授、博士生导师。所做研究以适应—学习——认知为中心,探索无人车、机器人及无人机的应用,研究兴趣包括自适应估计与控制,组合导航与智能导航,人机智能交互,机器视觉及机器学习,多智能体及无线传感器网络应用,嵌入式系统及软件开发,工业大数据。2001年毕业于郑州大学系统科学与数学系,获学士学位;2006年毕业于中科院数学与系统科学研究院,获理学博士学位;2006年3月至2006年6 月在贝尔实验室工作;2006年8月至2009年7月在新加坡国立大学淡马锡研究所任研究员;2009年8月至今为北京理工大学教授。入选教育部新世纪优秀人才支持计划,获霍英东高等院校青年教师奖、北京理工大学教学成果奖,获北京市优秀人才培养资助计划支持。发表 SCI/EI检索论文近百篇,与合作者出版英文专著《Advanced Technologies in Modern Robotic Applications》与中文专著《矩阵代数、控制与博弈》,以及英文章节三篇。受邀撰写中国控制理论战略报告自适应控制部分。曾获中国自动化学会优秀论文、国际机器人与应用大会成就认可奖等国内外学术会议荣誉或奖励。所指导学生多人次在科技竞赛中获得国际、国家或省部级奖励。
报告3:人工智能、大数据和人才的未来
报告人:单艺猎聘网首席数据官
摘要:大数据时代已然到来,人工智能应用热潮再次兴起。这些新思想和新技术对人才的求职和企业的招聘过程带来了哪些颠覆性的创新?将带来哪些重大的变革和影响?更进一步,大数据和人工智能技术会对个人的职业发展和整个社会的就业问题可能会产生哪些深远的影响?从2014年起,猎聘大数据研究院在3400万用户、五十万企业和近千万企业职位的基础上综合运用大数据、机器学习、NLP和统计分析的方法对求职招聘相关的主要问题进行了研究,开发出了智能职位推荐、人才推荐和职业社交推荐,并且在中国人才与经济发展关系方面做了较为深入的量化分析。我将分享我们的一些重要成果和经验,并对人工智能对就业的可能影响做初步探讨。
报告人简介:单艺,毕业于清华大学和美国University of Arizona,获得了管理信息系统专业的学士和硕士学位。目前担任猎聘网首席数据官,负责机器学习技术和产品研发、商业数据分析以及大数据基础设施建设。他具有17年的数据挖掘和系统研发经验,曾经入选“影响中国大数据产业进程100人”。之前,他担任Omni-Dimension Inc(毕肯互动)和WPP Group/奥美ITOP 24/7 Networks的CTO职务,负责数据驱动的互联网广告优化技术和精准广告网络的研发;还曾经担任空中网悟空搜索副总裁和美国Yahoo!网页搜索资深工程师,从事大规模搜索技术和文本挖掘技术的研发。
报告4、迁移学习在金融大数据风控中的应用
报告人:殷磊融360天机风控技术总监
摘要:风控是金融领域研究的核心之一,也是大数据应用的经典场景。金融产品丰富多样,受众群体分布广泛,不可能为其设计一个大而全且通用的风控模型。因此,为不同的金融产品设计针对性的风控模型是非常必要的,这正是迁移学习的用武之地。迁移学习不仅可以解决单一产品数据过少,特征单一的问题,还可以捕获产品间相关性,有效的识别个性化风险与系统化风险。
报告人简介:现任360天机风控tech leader。曾任去哪儿技术总监,百度资深架构师。北京理工大学计算机科学技术博士。专注大数据与人工智能方面的研究。
二、学员Python汇报环节简介
汇报1:在处理淘宝数据实战中熟悉python机器学习工作流程
成员:石运来李志文田婧董小楠等
主要内容:pandas和matplotlib的基本使用,爬虫技术的简介,数据浏览与清洗的实例显示,scikit learn机器学习方法的初步使用。
汇报2:基于python的人脸识别简单实现
成员:罗江龙邱浩轩姚承唐张馨予等
主要内容:1.人脸识别的背景研究简介2.目前研究算法介绍3.基于港中文大学的deepid算法实现4.项目实现过程体会。
汇报3:链家网房价数据分析的Python实现
成员:陈英王业东傅杰熊坤谢玉龙等
主要内容:1.爬虫技术简介(链家网北京二手房房价数据爬虫实例)2.数据分析(熟悉Python的一些模块,并使用其他的数据处理工具进行数据分析)3.找出影响房价的影响因子。
汇报4:基于Python的信用卡评分方法
成员:杨秋霞董二娃唐章红赵晟江马宏道等
主要内容:信用评分的原理与现实意义;信用评分数据缺失值与异常值的常见处理方法;机器学习中随机森林等回归算法原理、参数调优及应用;基于实际数据集的信用评分预测及Python实现。
汇报5:推荐系统python实践
成员:杨念乔晓磊王子轩宋佳李蓉蓉廖青云吕志浩赵晓磊等
主要内容:1、推荐系统简介:介绍推荐系统的来源,定义与应用 2、分析介绍推荐系统主要推荐算法及 python相关模块:3、项目成员工作内容展示:针对同一个数据集,项目成员利用已知算法基于python的评分预测,并展示不同算法的对比分析结果。
三、经验分享专家简介
陈堰平
陈堰平,雪晴数据网创始人,北京理工大学中心导师团成员。主要从事统计咨询、数据分析、开发基于R语言的商业解决方案。2017年1月获得“微软最有价值专家”称号。毕业于中国人民大学统计学院,曾获CQF国际数量金融认证,先后担任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为微软、联想、丰田、惠普、招商银行、花旗银行、东方航空、中国电信、中国移动、中国联通等单位做有关数据科学方面的培训和咨询。曾开发贝叶斯动态线性规划模型的R包ssDLM,译作有《R语言编程艺术》、《实用数据分析》和《R语言临床数据分析》,主讲在线课程《R语言数据分析入门》、《R语言大规模数据分析实战》,并在多个平台上发布。
王安
王安布本智能联合创始人及首席分析官,北京大学光华管理学院MBA,北京大学商务智能中心专家组成员。专注数据化决策,互联网金融风险管理与精准营销。在数据决策领域拥有十多年的实践经验,曾服务多家大中型银行、保险公司及互联网金融公司。同时也积极参与数据决策教育领域,为北京大学、人民大学、北京航空航天大学、北京理工大学等院校机构提供相关课程和教育辅导。
四、27-28日的日程安排
五、参会方式
本次会议免费,如有兴趣,请关注友万科技公众号填写报名信息。由于座位有限,请您及时到达会场。
智慧教育,创新科研