• 数据科学素养系列课程第四讲 数据采集
  • 关注:142 发布部门:图书馆 课程时间:2020年06月29日14时
    微信二维码选课

    微信扫描二维码,快速报名。

    请扫描二维码,报名活动: 数据科学素养系列课程第四讲 数据采集

    主讲人:张晨峰,经济学博士,现为华东理工大学商学院教师。1997年、2003年及2012年分别于南京大学、伦敦大学学院和复旦大学获得物理学学士、计算机硕士和经济学博士学位。主要研究领域是区域经济学、空间计量经济学以及机器学习和大数据在经济领域的应用。主持和参与多项省部级基金课题,在财经科学、南京社会科学等期刊发表多篇相关的学术论文。长期从事统计学和计量经济学相关的本科和研究生层次的教学工作,擅长基于Python和R的大数据及机器学习分析。


    1. 爬虫原理简介

    2. 网页数据抓取、解析

    2.1 网页解析

    2.2 使用requests 库抓取网页数据

    2.3 使用Beautiful Soup 解析网页

    2.4 数据清洗与组织

    操作及练习

    更多信息关注公众号:对外经济贸易大学图书馆