建筑公司网站源码 php,电商营销方式有哪些,网上怎么找承包小工程,网络营销效果好的网站一、背景说明
1.0 采集目标 采集DOU音评论数据对引流截流和获客有很多好处。首先#xff0c;通过分析DOU音评论数据#xff0c;我们可以更好地了解用户对于产品或内容的喜好和需求#xff0c;从而调整营销策略#xff0c;吸引更多用户关注和点击。其次#xff0c;评论数据…一、背景说明
1.0 采集目标 采集DOU音评论数据对引流截流和获客有很多好处。首先通过分析DOU音评论数据我们可以更好地了解用户对于产品或内容的喜好和需求从而调整营销策略吸引更多用户关注和点击。其次评论数据可以帮助我们了解竞争对手的表现和用户反馈帮助我们找到自己的竞争优势提升吸引用户的能力。另外评论数据还可以帮助我们管理用户口碑提升产品信誉度增加用户对产品的认可度为获客打下良好基础。最重要的是利用评论数据进行引流截流可以帮助我们引导用户进入我们自己的产品或平台增加转化率从而实现获客目标促进业务增长。
因此采集DOU音评论数据对引流截流和获客有着重要的作用可以帮助我们更好地理解用户需求和行为优化营销策略提升产品的竞争力吸引更多用户关注和参与。
1.1 效果演示
综上所述我用python开发了一个爬虫采集软件可自动抓取DOU音评论数据并且含二级评论
为什么有了源码还开发界面软件呢方便不懂编程代码的小白用户使用无需安装python、无需懂代码双击打开即用
软件界面截图
爬取结果截图 以上。
1.2 演示视频
软件运行演示【软件演示】D音评论采集工具可爬取上万条含二级评论
1.3 软件说明
几点重要说明 1. Windows用户可直接双击打开使用无需Python运行环境非常方便 2. 需要填入cookie和爬取目标视频链接 3. 支持同时爬多个视频的评论 4. 可爬取10个关键字段含视频链接,页码,评论者昵称,评论者id个人DY号,评论者主页链接,评论时间,评论IP属地,评论点赞数,评论级别,评论内容。 5. 评论中包含二级评论及二级展开评论。 二、代码讲解
2.1 爬虫采集模块
首先定义接口地址作为请求地址
# 请求地址
url https://www.douyin.com/aweme/v1/web/comment/list/定义一个请求头用于伪造浏览器
# 请求头
h1 {accept: application/json, text/plain, */*,accept-encoding: gzip, deflate, br,accept-language: zh-CN,zh;q0.9,en-US;q0.8,en;q0.7,cookie: 换成自己的cookie值,referer: https://www.douyin.com/,sec-ch-ua: Not_A Brand;v99, Google Chrome;v109, Chromium;v109,sec-ch-ua-mobile: ?0,sec-ch-ua-platform: macOS,sec-fetch-dest: empty,sec-fetch-mode: cors,sec-fetch-site: same-origin,user-agent: ua,
}其中cookie是个关键参数需要填写到软件界面里。cookie获取方法如下
加上请求参数告诉程序你的爬取条件是什么
# 请求参数
params {device_platform: webapp,aid: 6383,channel: channel_pc_web,aweme_id: video_id, # 视频idcursor: page * 20,count: 20,item_type: 0,insert_ids: ,rcFT: ,pc_client_type: 1,version_code: 170400,version_name: 17.4.0,cookie_enabled: true,screen_width: 1440,screen_height: 900,browser_language: zh-CN,browser_platform: MacIntel,browser_name: Chrome,browser_version: 109.0.0.0,browser_online: true,engine_name: Blink,engine_version: 109.0.0.0,os_name: Mac OS,os_version: 10.15.7,cpu_core_num: 4,device_memory: 8,platform: PC,downlink: 1.5,effective_type: 4g,round_trip_time: 150,webid: 7184233910711879229,msToken: LZ3nJ12qCwmFPM1NgmgYAz73RHVG_5ytxc_EMHr_3Mnc9CxfayXlm2kbvRaaisoAdLjRVPdLx5UDrc0snb5UDyQVRdGpd3qHgk64gLh6Tb6lR16WG7VHZQ,
}下面就是发送请求和接收数据
# 请求地址
url https://www.douyin.com/aweme/v1/web/comment/list/
# 发送请求
r requests.get(url, headersh1, paramsparams)
# 转json格式
json_data r.json()定义一些空列表用于存放解析后字段数据
ip_list [] # ip属地
text_list [] # 评论内容
create_time_list [] # 评论时间
user_name_list [] # 评论者昵称
user_url_list [] # 评论者主页链接
user_unique_id_list [] # 评论者DY号
like_count_list [] # 点赞数
cmt_level_list [] # 评论级别循环解析字段数据以评论内容为例
# 循环解析
for comment in comment_list:# 评论内容text comment[text]text_list.append(text)其他字段同理不再赘述。
最后是把数据保存到csv文件
# 保存数据到DF
df pd.DataFrame({目标链接: https://www.douyin.com/video/ str(video_id),页码: page,评论者昵称: user_name_list,评论者id: user_unique_id_list,评论者主页链接: user_url_list,评论时间: create_time_list,评论IP属地: ip_list,评论点赞数: like_count_list,评论级别: cmt_level_list,评论内容: text_list,}
)
# 保存到csv文件
if os.path.exists(result_file): # 如果文件存在不再设置表头header False
else: # 否则设置csv文件表头header True
df.to_csv(result_file, modea, indexFalse, headerheader, encodingutf_8_sig)完整代码中还含有判断循环结束条件、时间戳转换、二级评论及二级展开评论的采集等关键实现逻辑详见文末。
2.2 软件界面模块
软件界面采用tkinter开发。 主窗口部分
# 创建日志目录
work_path os.getcwd()
if not os.path.exists(work_path /logs):os.makedirs(work_path /logs)
# 创建主窗口
root tk.Tk()
root.title(DY评论采集软件 | 马哥python说)
# 设置窗口大小
root.minsize(width850, height650)填写cookie控件
# 【填入Cookie】
tk.Label(root, justifyleft, font(微软, 14), text个人Cookie:).place(x30, y75)
entry_ck tk.Text(root, bg#ffffff, width110, height2, )
entry_ck.place(x30, y100, anchornw) # 摆放位置填写视频链接控件
# 【视频链接】
tk.Label(root, justifyleft, font(微软, 14), text视频链接:).place(x30, y145)
note_ids tk.StringVar()
note_ids.set()
entry_nt tk.Text(root, bg#ffffff, width110, height14, )
entry_nt.place(x30, y170, anchornw) # 摆放位置底部软件版权说明
# 版权信息
copyright tk.Label(root, text马哥python说 All rights reserved., font(仿宋, 10), fggrey)
copyright.place(x290, y625)以上。
2.3 日志模块
好的日志功能方便软件运行出问题后快速定位原因修复bug。
核心代码
def get_logger(self):self.logger logging.getLogger(__name__)# 日志格式formatter [%(asctime)s-%(filename)s][%(funcName)s-%(lineno)d]--%(message)s# 日志级别self.logger.setLevel(logging.DEBUG)# 控制台日志sh logging.StreamHandler()log_formatter logging.Formatter(formatter, datefmt%Y-%m-%d %H:%M:%S)# info日志文件名info_file_name time.strftime(%Y-%m-%d) .logcase_dir r./logs/info_handler TimedRotatingFileHandler(filenamecase_dir info_file_name,whenMIDNIGHT,interval1,backupCount7,encodingutf-8)日志文件截图
三、获取源码及软件
完整python源码及exe软件微信公众号老男孩的平凡之路后台回复爬抖音评论软件即可获取。点击直达