微博百度热搜收集

背景

      大家都有使用微博、百度吧,而每天的热搜想必大家也用的不少。微博、百度的热搜有7、8种分类,每个单独查看比较耗费时间,效率极低,大概要花费3,4分钟左右。最近闲来无事,冒出个想法,是不是有啥工具能全部下载下来呢?

      通过强大的百度,找到了一个RPA自动化工作,可以满足我的需求,节省了3倍以上的时间

      接下来就以微博/百度为例,初步了解下这块RPA工具

      我目前采用的是“粒元数字员工”,官网地址:https://www.cxplan.cn/实际操作步骤

1、实际操作步骤

1、打开微博首页

2、点击“热搜榜”,抓取热搜,存入对应列表

3、点击“文娱榜”,抓取热搜,存入对应列表

4、点击“要闻榜”,抓取热搜,存入对应列表

5、调用子流程,打开百度首页

6、点击“查看更多”

7、点击“热搜”,抓取热搜,存入对应列表

8、点击“小说”,抓取热搜,存入对应列表

9、点击“电影”,抓取热搜,存入对应列表

10、点击“电视剧”,抓取热搜,存入对应列表

11、点击“汽车”,抓取热搜,存入对应列表

12、点击“游戏”,抓取热搜,存入对应列表

13、新建excel,通过对应列表写入数据

2、整体效果展示

3、脚本编辑

3.1、打开微博首页,设置3个list变量,

分别存放微博的3个热搜数据,这样的好处就是隔离每个热搜种类,为后面方便读取数据铺垫

3.2、通过“循环相似元素”指令,获取各种热搜的文本内容

“循环相似元素”指令十分强大,RPA可以从元素库中选择一个已捕获的元素,再获取页面上相似的元素,从来把页面上所有相似元素获取,进而可以获取它们的对象、元素文本内容、元素值等,终于再循环操作你想操作的

文本内容插入到每个列表中

具体脚本

3.3、子流程:百度搜索,

打开百度搜索页码,通过“循环相似元素”指令,获取各种热搜的文本内容;

此流程与上面微博循环相似元素类似

3.4、调用子流程,百度热搜

为什么会想到使用子流程呢?因为脚本一旦太多,复杂性提高,对于我这种小白,有时就会很难理解;使用子流程可以把脚本分块,更加容易理解,后期维护脚本也方便

3.5、内容写入

写内容我选择的是excel,文本、csv写入也是可以的,根据大家的情况选择咯

将之前存入list的文本内容,依次写入到excel,最后记得要保存excel

excel写入方式我选择的是“写入范围”:列,从第2行开始,每个list作为一列,一列一列的写入,sheet最好不要使用默认的,自己取名,区分各种数据

3.6、最后展示下热搜信息

4、总结

    这一套操作下来,大家觉得如何呢,反正我觉得挺好用的,十分适合懒人,简单总结一下

  1. 此款RPA操作简单,入门容易,不会代码也能AI
  2. 效率提升明显,原本搜罗这些热点信息需要3分钟左右,使用RPA之后,1分钟之内处理完成 
  3. 永久收益,脚本只需编辑调试成功,后面重复使用,大大得解脱双手

tips:这里只有微博和百度,如果有其它平台也需要类似需求,小伙伴如果有需要可以留言,借一步说话。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/623526.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

rmallox勒索病毒#如何防范及处理?

rmallox勒索病毒介绍 rmallox将其特定的“.rmallox”扩展名添加到每个文件的名称中。例如,您命名为“my_dog.jpeg”的照片将被转换为“ my_dog.jpeg.rmallox”,在名为“ 资料.xlsx ”的Excel表格中报告——转换为“ 资料.xlsx.rmallox”,等等…

中医圆运动规律

目录 人体圆运动营气在十二经脉的运行规律子午流注与圆运动升降结合图 人体圆运动 营气在十二经脉的运行规律 营气在脉中,卫气在脉外 这个顺序也是子午流注的顺序 子午流注与圆运动升降结合图

DBA面试总结(Mysql篇)

一、delete与trancate的区别 相同点 1.两者都是删除表中的数据,不删除表结构 不同点 1.delete支持按条件删除,TRUNCATE不支持。 2.delete 删除后自增列不会重置,而TRUNCATE会被重置。 3.delete是逐条删除(速度较慢&#xff09…

OpenBayes 在线教程|张国荣、鲁迅等老照片秒变高清!即刻上手的超火 SUPIR-AI 图像修复教程

小伙伴们,大家在生活中是不是也会遇到这样的烦恼:心心念念想要打印一张充满回忆的老照片或酷炫动漫壁纸,却发现图像糊得像打了马赛克? 市面上的图像修复工具五花八门,选择困难症人群找得快要崩溃? 终于找…

看看《MATLAB科研绘图与学术图表绘制从入门到精通》示例:绘制山鸢尾萼片长度和萼片宽度的小提琴图

使用MATLAB绘制鸢尾花数据集( fisheriris)中山鸢尾( Iris Setosa)的萼片长度和 萼片宽度的小提琴图。这将帮助我们更好地了解山鸢尾的这两个特征的数据分布情况,包括它们的 中位数、四分位范围及密度估计。这种可视化工…

antDesignVue 使用-持续更新

背景 vue3viteantdesignvuevue-router 1,全局完整注册 1.1下载antdesignvue npm i --save ant-design-vue 或者 npm install ant-design-vuenext --save 1.2在mian.ts中引入 import { createApp } from vue import { createPinia } from piniaimport App from ./App.vue …

ST-LINK Utility 4.6.0 下载安装及使用方法介绍

一、介绍 STM32 ST-LINK Utility是针对STM32全系芯片进行编程(读、写、擦除、选项字)的一款工具。 STM32 ST-LINK Utility软件主要的功能就是量产(批量下载代码的工具)。它也是比较实用的一个工具,当我们需要查看芯片F…

关于用虚拟机安装ubuntu22.04出现的问题,和之前踩过的坑

文章目录 概要如果自己分区虚拟机长时间进不去ubuntu系统建议的分区大小小结 概要 利用虚拟机安装ubuntu的好处是在ubuntu下载的东西不会因为关机而删除 今天心血来潮,想要学习一下把linux系统装到u盘来使用,搜教程但是进行到的时候,出现了错…

用ChatGPT读了几百篇文献,我总结出了文献综述这些经验

点击下方▼▼▼▼链接直达AIPaperPass ! AIPaperPass - AI论文写作指导平台 近期小编会将学术论文写作每一个流程需要了解的细节与ChatGPT在这细节的背景下如何提升我们的学术论文进行分章节讨论。最终汇总成一篇长文攻略。宝子们敬请期待哦。今天我们来详细聊聊文…

【零基础入门TypeScript】模块

目录 内部模块 内部模块语法(旧) 命名空间语法(新) 两种情况下生成的 JavaScript 是相同的 外部模块 选择模块加载器 定义外部模块 句法 例子 文件:IShape.js 文件:Circle.js 文件:…

23年新增CSS属性 container容器查询 容器单位实现字体大小随容器变化而变化

container兼容性很好,见下图 一、container规则 MDN文档介绍(由于这个属性是23新出,故mdn文档里是英文版本) container规则,也称container查询,可以实时匹配指定为容器元素的尺寸,开发者可以基…

平台工程在企业数字化转型中的战略价值

要建设成功、有弹性和面向未来的平台,需要做到这三点:了解需求、预测可能面临的挑战并制定经得起时间考验的解决方案。 了解需求是指理解利益相关者的要求和目标,无论他们是最终用户、开发人员还是平台生态系统中的其他相关方。这包括开展全面…