本书以通用大数据采集技术为基础,聚焦网络大数据采集工具的应用。 本书内容选取适用性强,紧扣“大数据与会计”专业(群)教学实践,以程序设计语言(Python)为学习支架,让学生利用信息技术手段完成财务大数据采集、整理的同时初步掌握脚本语言的语法逻辑,自定义函数的设计和库功能函数的调用等。内容以大量丰富的财务工作场景作为实践对象,融入必要的课程思政元素,使学生能够从真实岗位工作情境出发,认知工作流程规范和可能的复杂问题,提高学生进行财务大数据采集的综合能力。 全书共包括七个项目,即:大数据与Python网络爬虫概述—Requests库—正则表达式—XPath语言—采集静态网页数据—采集动态网页数据—反爬技术应对策略共七个项目。 本书每个项目的子任务设有“知识准备”环节,帮助学生建立任务实施的知识集合,“任务小结”环节可以帮助学生加深对教学内容的理解和掌握。 |
|
|
|
|
|
|
|
|
|
|
|