【靓小虫】2024抖音采集软件,支持关键词搜索、主页作品、评论采集等一键批量爬取!

目录
  • 一、背景洞察
    • 1.1 爬取目标
    • 1.2 结果演示
      • 1.2.1 关键词搜索结果
      • 1.2.2 采集:指定博主主页作品
      • 1.2.3 采集:指定作品的评论
    • 1.3 演示视频
  • 二、功能介绍
    • 2.0 用户登录
    • 2.1 配置cookie
    • 2.2 采集关键词搜索结果
    • 2.3 采集指定博主主页作品
    • 2.4 采集指定作品的评论
  • 三、付费说明
  • 四、软件获取

一、背景洞察

1.1 爬取目标

您好!我是@马哥python说,一名10年程序猿。图1-抖音图1-抖音

众所周知,抖音是目前国内最火热的短视频社交平台,每天拥有大量用户发布和浏览短视频作品,形成数亿的日活量。平台上各种作品数据、评论数据等也成为众多媒体从业者、数据分析者的分析目标,此类工具有助于用户快速获取目标数据,助力个人创作、数据挖掘、指导决策等日常工作,前景广阔。

基于以上洞察,我用python开发了一套抖音采集软件,起了个可爱的名字,叫"靓小虫"。

功能包括:

  1. 采集指定关键词的搜索结果,并自动导出csv文件
  2. 采集指定博主的主页作品数据,并自动导出csv文件;且支持下载对应视频mp4文件到本地
  3. 采集指定作品的评论数据,并自动导出csv文件

以上。

1.2 结果演示

1.2.1 关键词搜索结果

软件运行界面:图2-运行界面:采集搜索关键词
图2-运行界面:采集搜索关键词

采集结果csv:(12个字段:作者昵称,作者粉丝量,用户主页链接,视频文案,背景音乐,视频分享链接,视频无水印地址,视频发布时间,点赞数,评论数,收藏数,分享数)图3-采集结果:搜索关键词
图3-采集结果:搜索关键词

1.2.2 采集:指定博主主页作品

软件运行界面:图4-运行界面:采集主页作品
图4-运行界面:采集主页作品

采集结果csv:(11个字段:用户昵称,视频文案,视频时长,背景音乐,分享链接,视频地址,发布时间,点赞数,评论数,收藏数,分享数)图5-采集结果:主页作品图5-采集结果:主页作品

下载视频mp4文件:图6-下载作品MP4文件
图6-下载作品MP4文件

1.2.3 采集:指定作品的评论

软件运行界面:图7-运行界面:采集作品评论图7-运行界面:采集作品评论

采集结果csv:(9个字段:昵称,评论内容,主页链接,头像链接,发布日期时间,评论点赞量,IP,评论者标签,评论id,回复量)图8-采集结果:作品评论图8-采集结果:作品评论

1.3 演示视频

软件使用演示视频:【靓小虫】抖音爬虫软件,一键批量采集

二、功能介绍

2.0 用户登录

首先,登录软件,界面如下:图9-用户登录图9-用户登录

第一次登录,请先点击【注册】按钮,注册完之后,就有了账号和密码。
然后点击下方的【卡密购买】按钮,选择适合自己的收费方式,获取卡密。

2.1 配置cookie

软件登录成功之后,点击左下角的设置按钮,扫码登录抖音,如下:图10-扫码登录DY图10-扫码登录DY

扫码完成后,软件会自动配置好cookie,非常方便!

2.2 采集关键词搜索结果

点击左侧导航栏,进入【关键词搜索】菜单,输入关键词和页数,点击【搜索】按钮,开始采集。如图2所示。

采集完成后,点击【导出】按钮,会把采集结果自动导出到csv文件,目录:./Result/关键词/关键词.csv
采集结果csv如图3所示。

采集字段12个,含:作者昵称,作者粉丝量,用户主页链接,视频文案,背景音乐,视频分享链接,视频无水印地址,视频发布时间,点赞数,评论数,收藏数,分享数。

2.3 采集指定博主主页作品

点击左侧导航栏,进入【视频解析】菜单,输入主页链接和页数,点击【解析】按钮,开始采集。如图4所示。

①导出csv数据

采集完成后,点击【导出】按钮,会把采集结果自动导出到csv文件,目录:./Result/用户主页/作者昵称.csv

采集字段11个,含:用户昵称,视频文案,视频时长,背景音乐,分享链接,视频地址,发布时间,点赞数,评论数,收藏数,分享数。

采集结果csv如图5所示。

②下载视频MP4文件

采集完成后,选中需要下载的作品,点击【下载】按钮,会把视频MP4文件自动下载到本地,目录:./Result/用户主页/视频/作者昵称/作品名称.mp4

采集结果csv如图6所示。

2.4 采集指定作品的评论

点击左侧导航栏,进入【评论解析】菜单,输入分享链接和页数,点击【解析】按钮,开始采集。如图7所示。

采集完成后,点击【导出】按钮,会把采集结果自动导出到csv文件,目录:./Result/评论/视频id.csv

采集结果csv如图8所示。

采集字段9个,含:昵称,评论内容,主页链接,头像链接,发布日期时间,评论点赞量,IP,评论者标签,评论id,回复量。

注意,当前版本评论采集不包含二级评论,仅包含一级评论。

三、付费说明

软件定价如下:图11-软件收费
图11-软件收费

费用详细说明:

  1. 卡密说明
体验卡:使用期限1小时,4.9元。体验卡仅能购买一次。适合试用软件等临时需求
月卡:使用期限1个月,149元。月卡可多次购买。适合短期采集需求
季卡:使用期限3个月,399元。季卡可多次购买。适合中期采集需求
年卡:使用期限1年,1499元。年卡可多次购买。适合长期采集需求
  1. 一机一码
    软件采用一机一码机制,一个卡密只能在一台电脑运行、不可多电脑运行。
  2. 软件多开
    一台电脑仅允许运行一个软件,不支持软件多开。

四、软件获取

完整exe采集软件,微信公众号"老男孩的平凡之路"后台回复"靓小虫"获取。


我是@马哥python说,一名10年程序猿,持续分享Python干货中!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/778555.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

读零信任网络:在不可信网络中构建安全系统10认证身份

认证身份1. 用户所知道的信息 1.1. 只有用户本人知道的信息 1.2. 密码1.2.1. 密码是常用的认证机制1.2.2. 密码验证就是确认用户“所知”性的较好途径1.2.3. 用户可以利用密码管理器来便捷地管理多个高强度密码,从而有效降低数据泄露风险1.2.4. 长度足够长1.2.4.1. 最近的NIST…

代码随想录算法训练营day04|24.两两交换链表中的节点,19.删除链表的倒数第N个节点,面试题 02.07.链表相交,142.环形链表II

24.两两交换链表中的节点 题目链接:https://leetcode.cn/problems/swap-nodes-in-pairs/description/ 我的代码: /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNod…

For SALE: State-Action Representation Learning for Deep Reinforcement Learning

发表时间:2023(NeurIPS 2023) 文章要点:这篇文章提出,在强化学习里,对于特征向量表示的任务(low-level states),而不是图像表示的任务(image-based tasks),做表征学习也是有必要的。作者认为一个任务的困难在于底层的dynamic,而不是状态空间的大小,对state-action做…

活动回顾 | 2024 搜索客社区 Meetup 首期线上直播活动圆满结束,附 PPT 下载

2024 年 7 月 31 日,由搜索客社区和极限科技(INFINI Labs)联合举办的首期线上 Meetup 技术交流直播活动圆满结束。本次直播活动吸引了超过 300 人次的技术爱好者参与,共同探讨了 Easysearch、大模型、RAG 等前沿技术和实践应用,为广大搜索技术爱好者提供了一个宝贵的学习和…

HTML概述1

HTML概述 HTML中文是超文本标记语言,它是 HyperText Markup Language首字母简称,是一种用来结构化web网页及其内容的标记语言。网页的内容是由段落、列表、图片和文字等组成。 HTML组成 HTML由一系列元素组成。元素和标签不是一个概念,典型的元素就是由开始标签。文本和结束…

VS远程调试NatApp

目录远程调试用户机器程序1. 调试工具1.1 VS远程调试服务1.2 服务路径1.3 拷贝与启动服务1.4 配置选项2. 外网穿透隧道工具2.1 工具:natapp.exe2.2 官网2.3 购买隧道:2.4 配置隧道:2.5 修改配置:3. 启动调试3.1 附加进程3.2 配置进程 远程调试用户机器程序 1. 调试工具 1.1…

R语言入门笔记:第一节,快速了解R语言——文件与基础操作

上一期 R 语言入门笔记里面我简单介绍了 R 语言的安装和使用方法,以及各项避免踩坑的注意事项。我想把这个系列的笔记持续写下去。这份笔记主要是针对 R 语言学习过程中各个容易掉进去的坑进行规避,以及根据我自身的经验提供一些学习思路。目录关于 R 语言的简单介绍到什么地…

基于强化学习的路径规划matlab仿真,对比QLearning和SARSA

1.算法仿真效果 matlab2022a仿真结果如下(完整代码运行后无水印): 2.算法涉及理论知识概要强化学习(Reinforcement Learning, RL)是一种机器学习方法,它使代理(agent)通过与环境互动,学习采取何种行动以最大化累积奖励。在路径规划问题中,强化学习被用于自动探索环境,找…

阿里云服务器第一次使用时的配置

因为项目用到了4G模块, 测试云平台是基于阿里云 第一次远程桌面登录时,发现 使用 SocketTool 创建客户端后不能在云服务器上监听到相应的连接 根据阿里云官方的指南配置了一个专用端口 https://startup.aliyun.com/info/1074728.html 配置完成后,可观察到,使用模块也可正常发送…