抖音评论爬取软件,Python开发cookie采集
发布时间:2024-02-22 14:12
   这是用Python开发的抖音评论爬取的界面软件,那我们首先打开这个软件,看一下这个界面效果,那这个界面上需要填入个人cookie,爬取的目标视频链接。

   那我们首先看个人cookie,我们打开抖音的网页端,打开开发者模式。那我们任意选择一个视频。打开评论往下翻这个评论,我们找到这条请求,那看他的预览数据里面comments下面,那这些就是它的评论数据,那么打开对应它的标头请求标头cookie啊,把这一长段cookie复制下来,粘贴到软件上,视频链接,那我这里提前准备好了4个希罗儿女相关的抖音视频,把他的视频链接粘贴到软件上,点击开始执行。

   抖音评论爬取软件,Python开发cookie采集

   那我们看运行日志共检测到4个带爬视频,他已经开始爬第一个视频的评论,那这些相应的评论内容也在日志界面上打印出来了。那我们从这个日志上也能看到当前的爬取的进度,现在是1/4视频,4个视频里面的第一个。现在是2/4视频,那也就是第二个视频的评论。现在是3/4视频,第三个视频的评论。现在是最后一个视频,第4个视频的评论。现在软件提示全部视频评论已爬取完毕,请检查抖音评论4353结尾的这个CSV文件。

   那我们来看一下4353这个CSV文件,我们把它打开,那它爬取的字段包含这些目标链接,也就是刚才的四个视频的链接,评论者的昵称,评论者的ID,那这里的评论者ID其实就是抖音号个人抖音号评论者的主页链接,根据这个主页链接,就是可以直接打开这个评论者的主页,评论时间这里都是标准的时间格式。那最后一个字段就是最核心的这个评论的内容,那我们看这些其实都是刚才这4个视频的评论数据。

   与此同时呢,软件还会生成一个日志文件,今天是2月22号,那我们就打开这个0222这个日志,那这里展示的就是刚才爬取的过程生成的日志文件,方便回溯问题。