Stata 课程|Stata 爬取和讯网上市公司社会责任数据

本次的课程将由萌萌老师来讲解。萌萌老师是中国注册会计师(CICPA)、美国注册管理会计师(CMA)、金融风险管理师(FRM),专注经济金融、财务管理等领域,熟练使用 Stata 和 R 语言,擅长数据清洗、数据分析、网络爬虫等。

上次 Tidy 老师已经给大家分享了如何用 R 语言爬取和讯网上市公司社会责任数据:http://stockdata.stock.hexun.com/zrbg/  使用 Stata 的小伙伴是不是已经急坏了!其实,大多数数据用 Stata 也可以轻松爬取,可别小看了 Stata 的爬虫功能噢!今天子萌给大家分享一下这套数据如何用 Stata 爬取。除此之外,通过本次课程的学习,小伙伴们还可以掌握一些数据处理的技巧和思路,进一步实战应用 Tidy 老师在 Stata 编程导论系统课程中讲解的各种命令。

首先我们来看一下和讯网上市公司社会责任数据(下图以2019年为例):从时间跨度来看,这套数据包含 2010 至 2019 共 10 年的数据,每一年度都有不同数量的观测值(上市公司);从数据内容来看,分为仅包括一级指标和总得分的非明细数据和包含一级、二级指标的明细数据。我的思路是先爬取非明细数据,再爬取明细数据。这样做至少有两点好处,稍后介绍!

本次课程将包含如下内容:

  • 爬取上市公司社会责任报告排行数据:http://stockdata.stock.hexun.com/zrbg/
  • 爬取各个公司社会责任报名明细数据,例如澜起科技2019年的数据在这里:http://stockdata.stock.hexun.com/zrbg/stock_bg.aspx?code=688008&date=2019-12-31
  • 主要就是如何使用 Stata 进行复杂网页的爬取,特别是使用循环进行多网页的数据爬取;

  • 作业:尝试爬取一下和讯网1990-2019年上市公司高管的个人特征和简历。例如,http://stockdata.stock.hexun.com/gszl/ggml-000002.shtml

数据爬取是数据处理学习的很好切入点和练习方法,因此本课程推荐所有对 Stata 感兴趣的小伙伴学习。

直播信息

  • 直播时间:2020 年 12 月 29 日晚 8 点;
  • 直播地址:腾讯会议,扫描下方二维码即可查看(需要报名 RStata 培训班方可参加)
  • 讲义材料下载:需要报名 RStata 培训班,详情可阅读:欢迎报名 RStata 线上培训班学习 R 语言和 Stata!

生物医学科研方法

上海市提名2021年度国家科学技术奖候选者开始征集!

2020-12-30 8:15:00

生物医学科研方法

重磅,国自然基金委发布科研不端行为调查处理办法!

2020-12-30 8:34:47