淘宝上做网站排名,建设网站业务竞争大,傻瓜式在线做网站,响应式网站建设代理商⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️ #x1f434;作者#xff1a;秋无之地 #x1f434;简介#xff1a;CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作#xff0c;主要擅长领域有#xff1a;爬虫、后端、大数据… ⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️ 作者秋无之地 简介CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作主要擅长领域有爬虫、后端、大数据开发、数据分析等。 欢迎小伙伴们点赞、收藏⭐️、留言 这次来给大家分享一下小红书笔记的爬取方式希望对大家有帮助
一、找到目标数据
小红书笔记的内容和互动数据点赞数、收藏数、评论数如下 二、找到数据所在接口或页面
通过f12搜索笔记ID找到对应的接口然后在接口返回信息体中搜索点赞数发现找到对应的数据说明这个接口或页面就是我们的目标 三、检查接口或页面的请求参数
通过检查接口的请求参数判断是否有加密参数、混淆参数等下图可以看到除了一个cookie参数以外其他参数都是不变的 四、获取登录cookie
一般获取登录cookie方式有2种第一种是接口请求另一种是模拟登录相对而言第二种简单点。具体操作请查下我另一个的一篇文章。
五、返回数据抽取目标数据
目标数据是存放在这个字典中可以使用正则匹配匹配结果就能通过字典读取了。 # 正则匹配
note_result re.findall(r__INITIAL_STATE__(.*?)/script, note_res)[0].replace(undefined,null)
###用户描述###
# 笔记标题
note_info_dict[title] note_dict[title]
# 笔记数据
interactions note_dict[interactInfo]
# 点赞数
note_info_dict[liked_count] int(interactions[likedCount])
# 收藏数
note_info_dict[collected_count] int(interactions[collectedCount])
# 评论数
note_info_dict[comments_count] int(interactions[commentCount])
# 分享数
note_info_dict[share_num] int(interactions[shareCount]) 以上就是我的分享如果有什么不足之处请指出多交流谢谢
如果喜欢请关注我的博客https://my.csdn.net/weixin_42108731