软工寒假日报（一）-编程知识

软工寒假日报（一）

news/2025/1/10 11:13:50/文章来源:https://www.cnblogs.com/gotosleep/p/18663632

今天开始简单了解了python爬虫，并安装了相关依赖

import requests
from bs4 import BeautifulSoup
import pandas as pd


# 爬取一个页面的数据
def scrape_page(url):
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"}
    response = requests.get(url, headers=headers)
    soup = BeautifulSoup(response.text, "html.parser")

    movies = []
    for item in soup.find_all("div", class_="item"):
        title = item.find("span", class_="title").text
        rating = item.find("span", class_="rating_num").text
        quote = item.find("span", class_="inq").text if item.find("span", class_="inq") else "N/A"
        movies.append({"Title": title, "Rating": rating, "Quote": quote})

    return movies


# 主程序：爬取多页
def main():
    base_url = "https://movie.douban.com/top250?start={}"
    all_movies = []

    for i in range(0, 250, 25):  # 每页 25 部电影
        url = base_url.format(i)
        print(f"Scraping: {url}")
        movies = scrape_page(url)
        all_movies.extend(movies)

    # 保存为 CSV 文件
    df = pd.DataFrame(all_movies)
    df.to_csv("douban_top250.csv", index=False)
    print("Scraping complete! Data saved to douban_top250.csv")


if __name__ == "__main__":
    main()

结果展示：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/867068.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

RapidTable release v1.0.3

引言经过几日来的不懈努力，RapidTable 库终于迎来了 1.0 系列。 RapidTable 库是专门用来文档类图像的表格结构还原，表格结构模型均属于序列预测方法，结合 RapidOCR，将给定图像中的表格转化对应的 HTML 格式。效果展示模型列表model_type 模型名称推理框架模型大小推理…

ur3+robotiq ft sensor+robotiq 2f 140配置rviz仿真环境-

原文地址: ur3+robotiq ft sensor+robotiq 2f 140配置rviz仿真环境 ur3+robotiq ft sensor+robotiq 2f 140配置rviz仿真环境搭建环境： ubuntu: 20.04ros: Noneticsensor: robotiq_ft300gripper: robotiq_2f_140_gripperUR: UR3 在安装sensor和gripper之前，先简单配置一下UR机…

【Python】简单实现Http网络请求功能

1.安装uvicorn和FastAPI pip3 install uvicorn pip3 install FastAPI2.python代码实现 import uvicorn from fastapi import FastAPIapp = FastAPI() @app.post("/ShowNum") async def ShowNum(x:int=1,y:int=2):print(和为：%d % (x+y))return x+yif __name__ == &q…

JMeter自动执行生成报告，批处理脚本

1、新建文件后缀.bat: 字符集使用 ANSI 编码，不然有中文会乱码，执行失败2、输入内容如下，根据实际情况修改路径：@echo off REM 设置 JMeter 的安装目录，根据实际情况修改路径 set JMETER_HOME=C:\apache-jmeter-5.4.1 REM 设置测试计划的路径，根据实际情况修改路径 set T…

奇迹mu1.03单机版安装教程+无需虚拟机+GM工具

今天为大家带来一款怀旧网单《奇迹mu1.03》的游戏架设，适用于单机娱乐，仅供怀旧，本人已经安装游戏成功，特此带来详细安装教程。适用环境单机视频演示 https://githubs.xyz/show/330.mp4亲测截图架设步骤关闭默认杀毒软件和其它自己下的杀毒软件，一定要检查关闭！！…

Toeplitz矩阵

具有下面形式的矩阵称为 Toeplitz 矩阵 (即在同一条对角线上的元素都相等) • Toeplitz 矩阵只有 2n − 1 个独立元素, 因此在存储一个 Toepliz 矩阵时, 只需存储第一列和第一行 (或第一列和最后一列);• 如果 T 对称, 则只需存储第一列. 用途：

【转载】【cursor】解决 cursor IDE 不能正常给 python 代码高亮的问题

原文链接：How to use python with the Cursor IDE首先参照上面的解决方法进行配置，配置完成后若不生效，请检查：1. 在 cursor 中把本地和远程的 python 扩展设置都进行以下修改 2. 若修改后不生效，重启 python 插件（看不明白的话请留言）

2025 年，程序员如何找准技术“掘金点”？

大家好，我是 V 哥，最近有很多小伙伴来问V哥，悲催的2024终于过去了，有的早早就给自己放假等春节了，有的也没逃过临了被约喝咖啡☕️，都想着先过完年再考虑怎么办，躺平可不行，又有谁会跟钱过不支呢。2025 年，V 哥也跟一些行业大佬聊过，共同的一个点就是市场经济依然不会…

基于ODX的工程诊断仪 - DST.Tester

INTEWORK-DST(Tester Option，以下简称DST.Tester)是经纬恒润自主研发的工程诊断仪，适用于新车型和ECU的诊断和刷写。DST.Tester不仅支持多种ISO协议，也可以按照客户需求开发刷写流程，满足整车厂和零部件供应商的诊断工程师使用需求。概述INTEWORK-DST(Tester Option，以下简…

本月底截止：“面向未来通信场景的安全技术”专题征稿

JS-25 字符串方法_indexOF()

indexOf方法用于确定一个字符串再另一个字符串中第一次出现的位置，返回结果是匹配开始的位置。如果返回-1，就表示不匹配 hello world.indexOf(o)//4 hello world.indexOf(a)//4-1 床前明月光，疑是地上霜。一去二三里，举头望明月，低头思故乡。.indexOf("一去二三里&qu…

点特征直方图

对点特征的描述常见的描述手段有，曲率、法线等，由于点云散乱无序形态各异，即使人眼是判别特征与非特征点都极其困难，所以仅仅凭借曲率、法线来对点云特征进行描述，显然是不够的。那如何准确或者全面的去描述点的特征呢，这也是很多算法的基石，特征描述准确与否直接会影响…

软工寒假日报（一）

相关文章