怎么把小红书竞品笔记的标签批量导出到Excel?

文章摘要
用浏览器DevTools批量抓包竞品笔记标签,再转Excel,全程零代码,10分钟搞定。
问题定义:为什么“标签”才是竞品分析的核心
小红书2026年搜索权重里,标签(#话题+自定义关键词)仍占综合排序约三成。相比点赞、收藏,标签是唯一直接被平台拿来聚类并分发流量的字段。把竞品近期高曝笔记的标签一次性导出到Excel,可快速拼出“热词地图”,用于选题、投流、SEO埋词。下文给出一条零代码、可复现、不触碰任何灰产接口的批量导出路径。
前置条件与成本估算
1. 账号与设备
- 任意小红书账号(无需品牌合作人权限)。
- 桌面端Chrome/Edge(Firefox亦可,步骤相同)。
- Excel或Google Sheets(仅做分列与去重)。
2. 时间&性能
经验性观察:一次抓取50篇笔记,标签字段回传约130 KB,本地转表30秒内完成;网络延迟主导总耗时。若一次性翻页至200篇,浏览器内存占用可升至400 MB,仍属安全区间。
最短可达路径(分平台差异)
Step 1 进入竞品主页
桌面浏览器地址栏输入www.xiaohongshu.com并登录→右上角搜索框输入竞品昵称→点进“用户”页签。iOS/Android端亦可复制竞品主页链接→发到电脑端打开。
Step 2 触发一次“真实加载”
在竞品主页向下滚动,直到出现“已显示全部笔记”或浏览器滚动条不再增加。此时前端已缓存约30–50篇笔记的JSON。
Step 3 打开DevTools抓包
- 键盘F12→Network面板→过滤器输入
api/sns/web/v1/user_posted(截至当前最新版本,URI可能微调)。 - 选中任意一条记录→右侧Preview确认返回体含
notes数组。
Step 4 批量复制响应体
右键该请求→Copy→Copy Response→粘贴到本地文本文件,命名raw.txt。若竞品笔记>50篇,需回到页面继续下拉,重复Copy,直至覆盖目标区间。
Step 5 清洗并转Excel
打开Excel→数据→获取数据→从文本/CSV→选中raw.txt→分隔符选“无”→加载到工作表。按Ctrl+H,查找"tag_list":[,替换为换行符^p,再用“文本分列”以"name":"为分隔符,即可得到单列标签。最后“删除重复值”即完成。
提示
如果返回体被压缩,DevTools会自动解压,无需额外设置;复制到的已是明文JSON。
例外与副作用
1. 私密/限时笔记无法被抓到
若博主将笔记设为“仅粉丝可见”或“24h后隐藏”,接口不会返回详情,属于平台权限边界,无绕过方案。
2. 标签被“折叠”怎么办
部分品牌合作笔记为了美观,把标签写在评论区。此时接口返回的tag_list为空,需要额外抓取评论。方法:在DevTools过滤器输入api/sns/web/v1/comment/sublist,逐条复制后人工合并,工作量与笔记数成正比,建议抽样10%即可。
3. 重复请求会触发风控吗?
经验性观察:连续下拉30次(约600篇)未出现滑块验证码;若使用脚本高并发,则可能在5分钟内被弹窗。因此全程手动滚动+复制是最低成本的风控规避。
验证与回退方案
1. 校验标签完整性
随机抽5篇笔记,手动对照网页端可见标签与Excel行数,误差应≤1条;若差异大,检查是否漏复制响应体。
2. 回退到手工记录
当批量接口结构变更(URI或字段名变化),可立即回到“单篇复制”模式:打开笔记→悬停至底部标签→Ctrl+C→粘贴到Excel,每篇约15秒,适合样本<30篇的临时需求。
与第三方工具协同(可选)
市面上有“第三方归档机器人”声称可自动回传CSV,但需登录cookie,存在泄露风险。若必须使用,请单独开小号并定期改密,且关闭支付宝/微信免密支付,把潜在损失降到最小。
适用/不适用场景清单
| 场景 | 是否推荐 | 原因 |
|---|---|---|
| 月更≥200条的大牌竞品 | ✔ | 手动滚动成本<<收益,可一次性拿全 |
| 仅查看3–5篇爆款 | △ | 直接肉眼记录更快,抓包清洗反显冗余 |
| 需每日监控 | ✘ | 接口+人工双变量,长期维护成本高,建议改用官方“品牌合作人中心”热词云 |
故障排查速查表
| 现象 | 最可能原因 | 验证与处置 |
|---|---|---|
| Preview空白 | 返回304未更新 | 清空缓存,重新滚动触发请求 |
| Excel分列后乱码 | 引号/逗号未转义 | 先用Notepad++替换"为""再导入 |
| 找不到user_posted | URI已升级 | 在过滤器输入user逐个排查最新关键字 |
最佳实践清单(可打印)
- 先定义样本区间:例如“最近90天”“点赞>1000”,避免无意义全量。
- 一次滚动≤600篇,浏览器内存可控,减少闪退。
- 导出后立即做“去重+词频统计”,用Excel透视表10秒完成。
- 把高词频标签放回小红书搜索框验证,确认仍在推荐池内,再写入选题库。
- 每月月初检查接口字段是否变化,必要时更新分列规则。
FAQ(结构化数据)
批量导出会被封号吗?
全程手动滚动、未修改请求参数,经验性观察无封号案例;若用脚本高并发,则可能弹验证码。
标签里出现“隐藏符号”怎么处理?
用Excel CLEAN函数可清除不可见字符;若仍异常,在Notepad++开启“显示所有符号”手动删除。
手机端能直接导出吗?
截至当前版本,官方未提供移动端批量导出;需把链接分享到电脑端按上文步骤操作。
总结与下一步行动
通过浏览器DevTools抓包,小红书竞品笔记标签可在10分钟内完整落入Excel,无需安装插件或暴露登录凭据。抓包法依赖公开接口,结构变更时只需微调字段名即可恢复。完成导出后,建议立即用透视表统计词频,再与官方“品牌合作人中心”热词云交叉验证,就能在选题会前拿到一份实时、可溯源的标签地图。下次新品上市,直接把高词频标签埋进标题与首行文案,搜索流量通常会在3–5天内给出正向反馈——若未起量,再回退到旧版AB测试,也不损失预算。