爬虫课程考试方式说明

爬虫课程考试方式说明

一、开课情况

考查课 082116415
50人,0864211,1-15单周 理论学时16 实验学时0
上课地点:周一 3-4节 十号教学楼A303
51人,0864212,1-15单周 理论学时16 实验学时0
上课地点:周四 3-4节 十号教学楼A303

二、考试方式

本学期的课程围绕python爬虫的相关内容,因此采用以“python爬虫”为主题的大作业作为本学期考核。

1)选题说明

大作业分为三个主题,学生任选其一:

主题一:数据采集存储与分析
1.确定一个网站,进行数据的获取,有嵌套数据获取
2.体现友好爬虫设置 最大的爬取次数以及页面停止等待时间
3.有多种反反爬措施的体现 UserAgent proxyip cookie 深入分析请求头的信息
4.把数据写入到mongodb中,参考如下:
http://172.16.16.164:8000/courses/81/assignments/728?module_item_id=3806
5.进行一些分析,结合数据导入与预处理
6.注意代码的可读性

主题二:网站自动化测试
1.确定一个网站,完成自动化操作测试 selenium的使用
2.要求自动化的测试不能低于如下的案例难度,并且有较为实用
https://blog.csdn.net/m0_38139250/article/details/127701694
3.可以设置浏览器伪装,可以参考:
https://blog.csdn.net/m0_38139250/article/details/134227638
4.实现方向举例,如:csdn自动点赞回复机器人、自动登录校园网、把excel中的数据自动录入某系统等

主题三:三方服务实现
1.进行第3方api的服务调用,如百度API,华为API,
2.或批量分析,如果你的服务是图片识别,可以把一个文件夹下的所有图片都识别出来
3.或嵌入自己的系统 如果你的服务是图片识别,可以把这个功能加到你的系统中

2)大作业报告要求:

下文以选题一方向要求:

报告内容涵盖:
(1)选题意义
(2)技术实现描述
(3)数据来源分析
(4)数据获取与清洗过程
(5)数据存储过程
(6)数据分析设计与实现
(7)个人总结

下文以选题二方向要求:

报告内容涵盖:
(1)选题意义
(2)技术实现描述
(3)确定目标网站目标网站分析
(4)自动化功能实现
(5)个人总结

下文以选题三方向要求:

报告内容涵盖:
(1)选题意义
(2)技术实现描述
(3)确定调用的三方接口以及接口使用案例分析
(4)批量功能实现或功能嵌入系统实现
(5)效果展示
(6)部署文档
(7)个人总结

3)报告格式要求:

(1)正文小四字号,中文为宋体字体,英文数字均为Times New Roman字体。行间距18磅。每个段落首行缩进2字符。
(2)各级标题四号黑体。
(3)每个图要有标号和图名(例:图1 实现数据爬取的程序流程图),标号和图名在图下标识。每个表要有标号和表名(例:表1 Table表结构),标号和表名在表上方标注。
(4)报告页数不能少于12页

三、考试说明

第15周为考试审核周,共留两周时间给学生完成。论文的最终评判将参考以下标准进行:
在这里插入图片描述

四、资料保存方式

每人上交一份电子档,同时上交一份打印档。
第16周周末把报告打印出来交给学委或班长,然后把报告的电子档和代码达成压缩包发到学习通。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/292037.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu 常用命令之 date 命令用法介绍

📑Linux/Ubuntu 常用命令归类整理 date命令在Ubuntu系统中用于显示或设置系统的日期和时间。 date常见的参数 -d, --dateSTRING:显示STRING指定的时间,而不是当前时间。-u, --utc, --universal:显示或设置协调世界时间。-R, --…

协作机器人(Collaborative-Robot)安全碰撞的速度与接触力

协作机器人(Collaborative-Robot)的安全碰撞速度和接触力是一个非常重要的安全指标。在设计和使用协作机器人时,必须确保其与人类或其他物体的碰撞不会对人员造成伤害。 对于协作机器人的安全碰撞速度,一般会设定一个上限值&…

057:vue组件方法中加载匿名函数

第057个 查看专栏目录: VUE ------ element UI 专栏目标 在vue和element UI联合技术栈的操控下,本专栏提供行之有效的源代码示例和信息点介绍,做到灵活运用。 (1)提供vue2的一些基本操作:安装、引用,模板使…

mysql主从复制(在虚拟机centos的docker下)

1.安装docker Docker安装(CentOS)简单使用-CSDN博客 2.部署2个mysql docker run --name some-mysql1 -p 33061:3306 -e MYSQL_ROOT_PASSWORD123456 -d mysql:5.7 --character-set-serverutf8mb4 --collation-serverutf8mb4_unicode_cidocker run --name some-mysql2 -p 330…

YACS(上海计算机学会竞赛平台)三星级挑战——牛奶供应(一)

题目描述 有一家牧场每天都会产出牛奶,在第 i 天,牛奶的产量为p[i]​。生产的牛奶可以卖到市场上,在第 i 天,市场需求为 c[i]​。如果市场需求不大,卖不掉牛奶,则多余的牛奶就会放进冷库保存。牛奶有一个保…

PyGame实现打砖块游戏

文章目录 砖块实现小车小球初始化和主循环 打砖块也是一个非常经典的小游戏,玩法大致如下,用一个小车接一个小球,然后反射小球,使之打在砖块上,当小球碰到砖块之后,则砖块被消掉,逻辑十分清晰。…

EDA实验-----直流电机驱动设计(Quartus II )

目录 一、实验目的 二、实验仪器设备 三、实验的重点和难点 四、实验原理 五、实验步骤 六、实验报告 七、实验过程 1.分频器代码 2.方向选择器 3.直流电动机工作原理 4.电路连接图 5.文件烧录 一、实验目的 了解直流电机控制的工作原理和实现的方法。掌握PWM波控…

linux下的进程组与会话的区别

进程组(Process Group)和会话(Session)是Unix/Linux操作系统中的两个概念,它们之间有一些关键区别: 定义和范围:一个进程组是一组相关进程的集合,它们具有相同的进程组ID&#xff08…

使用【OpenI启智平台】进行模型训练

前言 启智平台OpenI是一个人工智能开源开放平台,提供免费GPU算力可以进行模型训练。模式是git进行项目管理,可以创建调试任务调试代码以及保存镜像,创建训练任务训练模型,也提供推理和评测,我没用过就不讲述了。后来我…

Day67力扣打卡

打卡记录 美丽塔 II(前缀和 单调栈) 链接 class Solution:def maximumSumOfHeights(self, maxHeights: List[int]) -> int:n len(maxHeights)stack collections.deque()pre, suf [0] * n, [0] * nfor i in range(n):while stack and maxHeights…

嵌入式中断理解

一、概念 中断: 在主程序运行过程中,出现了特定的中断触发条件(中断源),使得CPU暂停当前正在运行的程序,转而去处理中断程序,处理完成后又返回原来被暂停的位置继续运行。 中断优先级&#x…

微信小程序-textarea组件字数实时更新

一、前言 本文实现的是在小程序中&#xff0c;textarea文本框输入文字后&#xff0c;实时显示文字的字数&#xff0c;获取更好的用户输入体验以及提示。 下图是实现的效果 二、代码实现 2-1、wxml代码 <view style"padding: 30rpx;"><view style"…