Python通过私信消息提取博主的赠书活动地址

文章目录

  • 前言
  • 背景
  • 设计
  • 开发
    • 1.引入模块
    • 2.获取私信内容
    • 3.根据文本提取url的方法
    • 4.获取包含‘书’的url
    • 5.程序入口
  • 效果
  • 总结
  • 最后

前言

博主空空star
主页空空star的主页

大家好,我是空空star,本篇给大家分享一下《通过私信消息提取博主的赠书活动地址》

背景

关注的博主中有一些赠书活动私信,如何从大量私信中提取出来我们想参与赠书活动的博客地址。

设计

  1. 获取私信列表;
  2. 提取内容包含‘书’的私信内容;
  3. 从内容中提取url。

开发

1.引入模块

import pprint
import re
import requests

2.获取私信内容

获取每个用户最新一条私信内容

def get_msg(username,usertoken,page):url = f'https://msg.csdn.net/v1/im/query/historySession3?page={page}&pageSize=40'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/18.17763','Cookie': f'UserName={username}; UserToken={usertoken};'}res = requests.get(url, headers=headers)return res.json()

3.根据文本提取url的方法

def get_urls(text):urls = re.findall(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', text)return urls

4.获取包含‘书’的url

def get_about_book(msg):about_book_list = []datas = msg['data']for data in datas:if '书' in data['content']:username = data['username']nickname = data['nickname']content = data['content'].replace('\n', '')urls = get_urls(content)msg_dict = {'username': username,'nickname': nickname,'content': content,'urls': urls}about_book_list.append(msg_dict)return about_book_list

5.程序入口

if __name__ == '__main__':# 遍历前3页的私信消息for page in range(1, 4):msg = get_msg('你的username', '你的usertoken', page)about_book_list = get_about_book(msg)print(f'第{page}页的赠书活动:')pprint.pprint(about_book_list)

效果

第1页的赠书活动:
[{‘content’: ‘『赠书活动 | 第十三期』《算力经济:从超级计算到云计算》http://t.csdn.cn/p2xwU’,
‘nickname’: ‘wei_shuo’,
‘urls’: [‘http://t.csdn.cn/p2xwU’],
‘username’: ‘weixin_62765017’},
{‘content’: ‘算力经济:从超级计算到云计算——(文末送书)http://t.csdn.cn/NfTcw本期赠书三本:《算力经济:从超级计算到云计算》获得方式:高质量的评论+赞数的前两名各获得一本!评论区随机挑选一位好兄弟送书一本!截止时间:6月29日—7月1日中午12时公布时间:7月1日下午1点’,
‘nickname’: ‘网络豆’,
‘urls’: [‘http://t.csdn.cn/NfTcw’],
‘username’: ‘yj11290301’},
{‘content’: ‘三连文章抽3人送人工智能书,AI学习之路分享:https://blog.csdn.net/m0_63947499/article/details/131371175’,
‘nickname’: ‘陈橘又青’,
‘urls’: [‘https://blog.csdn.net/m0_63947499/article/details/131371175’],
‘username’: ‘m0_63947499’},
{‘content’: ‘【派森送书-第二十六期】《企业性能测试》送书5人http://t.csdn.cn/IVIB9上方文章链接进去点赞收藏,评论区留言“人生苦短,拒绝内卷!”每人最多评论三次!大数据分析新文《基于LightGBM算法构建公司破产预测模型》https://blog.csdn.net/m0_64336780/article/details/131343629,期待家人们的三连支持!评论区回访!’,
‘nickname’: ‘艾派森’,
‘urls’: [‘http://t.csdn.cn/IVIB9’,
‘https://blog.csdn.net/m0_64336780/article/details/131343629’],
‘username’: ‘m0_64336780’}]

总结

最后

如果您不知道如何支持我,
InsCode AI列了一些支持博主的句子供您参考:

博主写的文章很有深度,收获了很多知识。
博主的写作风格幽默风趣。
博主勇于分享自己的经验和教训,让初学者从中受益匪浅。
博主的思想独到,文章读起来让人格外振奋。
博主为人很好,乐于助人,回复读者的问题也非常及时。
博主的专业知识非常全面,无论是哪个领域的问题都能给出详细的解答。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/420.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Spring】基于注解方式存取JavaBean:Spring有几种注入方式?有什么区别?

前言 Hello,我是小黄。众所周知,Spring是一个开源的Java应用程序框架,其中包括许多通过注解实现依赖注入的功能。Spring提供了多种注入方式,可以满足不同的需求和场景。常见的注入方式包括构造函数注入、Setter方法注入和属性注入…

Qt控件(按钮、单选、复选、list、tree、table)

一、布局 工具栏图标文字一起显示&#xff0c;背景透明。 二、代码 widget.ui <?xml version"1.0" encoding"UTF-8"?> <ui version"4.0"><class>Widget</class><widget class"QWidget" name"Widg…

RabbitMQ应用场景和集群搭建复习

RabbitMQ应用场景和集群搭建 1. MQ的应用场景1.1 异步处理1.2 应用解耦1.3 流量削峰 2、RabbitMQ集群搭建2.1 普通集群(副本集群)2.1.1 架构图2.1.2 集群搭建1、集群规划&#xff1a;这里用三台虚拟机测试2、克隆三台机器主机名和ip映射3、 在其他两台节点上安装rabbitmq4、后台…

模型实战(13)之YOLOv8实现手语字母检测与识别+权重分享

YOLOv8实现手语字母检测与识别+权重分享 本文借助yolov8 实现手语字母的检测与识别:先检测手的ROI,进而对手语表达的字母含义进行识别全文将从环境搭建、模型训练及预测来展开对整个算法流程进行讲解文中给出了开源数据集链接及从 Roboflow 上的下载教程实现效果如下: 1. 环…

目标检测基础

MTCNN 人脸检测 MTCNN&#xff0c;Multi-task convolutional neural network&#xff08;多任务卷积神经网络&#xff09;&#xff0c;将人脸区域检测与人脸关键点检测放在了一起&#xff0c;它的主题框架类似于cascade。总体可分为P-Net、R-Net、和O-Net三层网络结构。这三个…

如何用ChatGPT使开发效率提高50%以上?

简介 ChatGPT是一个大型语言模型&#xff0c;由OpenAI开发。它被训练用于进行对话式交互&#xff0c;能够理解和生成自然语言文本。ChatGPT可以用于多种任务和场景&#xff0c;包括但不限于&#xff1a;智能助手、创意生成、语言学习、编程辅助等。ChatGPT的优势在于它的广泛知…

【图像处理】基于双目视觉的物体体积测量算法研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

C语言:打印用 * 组成的X形图案

题目&#xff1a; 多组输入一个整数&#xff08;2~20&#xff09;&#xff0c;表示输出的行数&#xff0c;也表示组成“X”的反斜线和正斜线的长度。 思路&#xff1a; 总体思路&#xff1a; 实际打印的是 n*n 的图案&#xff0c; 只不过是当 行等于列(正斜线) 、行列行数-1(反…

io.netty学习(十一)Reactor 模型

目录 前言 传统服务的设计模型 NIO 分发模型 Reactor 模型 1、Reactor 处理请求的流程 2、Reactor 三种角色 单Reactor 单线程模型 1、消息处理流程 2、缺点 单Reactor 多线程模型 1、消息处理流程 2、缺点 主从Reactor 多线程模型 主从Reactor 多线程模型示例 1…

Web自动化元素定位之xpath定位详解

Web自动化常见的定位方式 为什么要学习定位 1.让程序操作指定元素&#xff0c;就必须先找到此元素 2.程序不像人类用眼睛直接定位到元素 webDriver提供了八种定位元素的方式 定位方式总结 1.id、name、class_name、tag_name:根据元素的标签或元素的属性来进行定位 2.link_t…

flask搭建在线音乐网系统

1.使用虚拟环境Virtualenv来创建项目 2. Flask框架介绍 Flask框架是一个用Python编写的轻量级Web应用程序框架&#xff0c;依赖于Werkzeug和Jinja2两个外部库。Werkzeug是一个WSGI工具包&#xff0c;用于接收和处理HTTP请求&#xff0c;匹配视图函数&#xff0c;支持Cookie和会…

Linux :LNMP(源码包安装)

Linux 虚拟机 VMware&#xff1a;安装centos7_鲍海超-GNUBHCkalitarro的博客-CSDN博客 物理机 linux&#xff1a;真机安装centos linux&#xff08;突发事件&#xff1a;解决卡在安装界面&#xff09;{寻找镜像--u启制作--引导u盘--解决卡在安装界面--安装配置}_安装centos7卡…