返回博客
build-in-publicseogoogle-indexingdebuggingai-agent

第 6 天:Google 抓不到我的 172 个页面 —— 而且我的 AI 一直在对着空气回复

Nemo8 min read
Share:
## 仪表盘看起来很正常,但现实并非如此。 69 个用户。今天有 12 个访客。零注册。仪表盘显示系统正在运行。Celery 任务显示为绿色。文章正在发布。但当我真正查看数据时,发现有两件事在悄无声息地崩溃了。 ## 问题 1:Google 抓不到那 172 个页面 我终于认真检查了 Google Search Console。不是看那些虚荣指标,而是看索引报告。 **36 个页面已索引。172 个页面“已发现 - 尚未索引”。** 这意味着 Google 知道我的页面存在(通过 sitemap),但还没打算去抓取它们。对于一个权重较低的新站,Google 给你的抓取预算(crawl budget)非常少。我的那 172 个页面正排在一个可能需要几个月才能处理完的队列里。 奇怪的地方在于:我的 sitemap 有 595 个 URL,博客文章都在数据库里,API 也能正确返回。但是 *首页* —— 整个网站权重最高的页面 —— 却没有指向任何博客文章的链接。Google 的爬虫来到首页,没看到博客内容的链接,然后就离开了。这些博客文章成了“孤儿页面”。 ### 修复方案 三项改进: 1. **在首页增加了 30 个博客链接。** 不仅仅是一个“最新文章”的小组件 —— 而是 3 个精选卡片 + 27 个紧凑链接。现在,每次首页访问都为 Google 提供了 30 条发现博客内容的路径。 2. **撰写了 19 篇新的 SEO 博客文章。** 每一篇都针对特定的长尾关键词:“how to grow telegram channel 2026”、“bluesky vs twitter for business”、“indie hacker marketing strategy”。这些不是 AI 垃圾内容(AI slop) —— 每一篇都是 1,000 到 2,000 字的干货,是我会给创业朋友的真实建议。 3. **集成了 Google Indexing API。** 我不再等待 Googlebot 按照它自己的时间表来发现页面,而是直接将 URL 推送给 Google。设置了一个服务账号,在 Search Console 中完成了授权,并一次性推送了 142 个 URL。Google 应该会在 24-48 小时内开始抓取,而不是等上几周。 同时还运行了 IndexNow 来通知 Bing/Yandex —— 提交了 596 个 URL。 博客文章也需要翻译。运行了翻译流水线:115 篇文章被翻译成中文、西班牙语和葡萄牙语。博客总数从 396 篇增加到 539 篇。 **修复前:** 36 个页面已索引,0 个首页到博客的链接,没有主动推送索引 **修复后:** 595 个 sitemap URL,30 个首页链接,向 Google 推送了 142 个 URL,共 539 篇博客文章 ## 问题 2:我的 AI 一直在点赞推文,却从未回复 互动系统本应寻找相关的推文,生成深刻的回复并发布。它已经运行好几天了。我以为它工作正常,因为我在数据库里能看到“互动事件”。 然后我看了看实际数据: **总计 173 次互动。109 个点赞。0 条回复。** 零。一条回复都没有。每一次“互动”都仅仅是一个点赞。 ### 为什么? 代码使用 Gemini 生成回复,然后通过一个安全过滤器检查是否有“听起来像 AI”的短语: ```python ai_tells = ["great post", "love this", "interesting take", "this resonates", "totally agree", "couldn't agree more", "well said", "nailed it"] for tell in ai_tells: if tell in reply_lower: return {"reply": "", "style": style["id"]} ``` 过滤器会检查回复中 *任何位置* 是否 *包含* 这些短语。不仅仅是开头 —— 而是任何地方。所以,一个非常好的回复,比如 “The part about building alone resonates — I spent 3 months doing exactly that”(独自构建的那部分引起了我的共鸣 —— 我花了 3 个月时间做同样的事),会因为包含 “resonates” 而被拒绝。 Gemini 生成的文本很自然,但自然的文本有时确实会包含像 “agree” 或 “resonates” 这样的词。这个过滤器杀掉了 100% 生成的回复。每一条都掉进了兜底逻辑:只点赞推文,然后跳过。 我这几天一直在把互动预算浪费在点赞上。点赞对于增长来说几乎毫无价值。回复才是驱动个人资料访问和关注的关键。 ### 修复方案 将过滤器从“包含”改为“以...开头”: ```python for tell in ai_start_tells: if reply_lower.startswith(tell): return {"reply": "", "style": style["id"]} ``` 立即进行了测试。回复生成现在正常工作了: - 输入:"Building alone is the FASTEST way to learn everything" - 生成的回复:"That split between building for 16 hours and marketing is so real. Of the marketing stuff you listed, which one feels the most impossible?" 很自然,提出了问题,并引用了原推文。这正是我们想要的。 ## 额外修复:OAuth 2.0 媒体上传 在调试时,我发现了另一个问题。用户 63(MysticStage,一个 AI 宠物肖像产品)已经连续几天发布失败。每条帖子都显示:“Failed to upload media: Max retries exceeded.” 原因:Twitter 的媒体上传 API (v1.1) 仅支持 OAuth 1.0a 认证。而用户 63 是通过 OAuth 2.0 连接的。每当系统尝试上传图片时,它向一个只接受 OAuth 1.0a 签名的端点发送了 Bearer 令牌。瞬间返回 401 错误。 修复方案:检测 OAuth 2.0 用户并跳过图片上传 —— 改为只发布纯文本。一条能成功发布的纯文本推文,比一条发布失败且毫无声息的带图推文要好上千万倍。 ## 流量和用户 本周的数据反映了一个正在增长但尚未找到核心增长渠道的产品现状: | 日期 | 访客数 | 页面浏览量 | |-----|----------|------------| | 3月9日 (周日) | 18 | 55 | | 3月10日 (周一) | 49 | 120 | | 3月11日 (周二) | 45 | 293 | | 3月12日 (周三) | 71 | 161 | | 3月13日 (周四) | 15 | 31 | | 3月14日 (周五) | 31 | 127 | | 3月15日 (周六) | 46 | 142 | | 3月16日 (周日) | 12 | 43 | 总计 69 个用户。过去 7 天有 16 个新注册。主要流量来源:Twitter/X (164 次访问), GitHub (125), Google Search (56), Hacker News (42), ChatGPT (13)。 Google Search 的数字是最关键的。56 次自然搜索访问几乎可以忽略不计。这就是为什么我今天把时间花在 SEO 上。如果那 539 篇博客文章中哪怕只有 10% 开始针对长尾关键词获得排名,那 56 次访问就可能变成每月 500+ 次 —— 而且搜索流量的转化率是社交媒体流量的 3-5 倍,因为人们是在主动寻找解决方案。 一个有趣的信号:ChatGPT 给我们带来了 13 次访问。这意味着我们的 GEO(生成式引擎优化)正在起作用 —— AI 搜索引擎正在回复中推荐 BlogBurst。这是大多数竞争对手甚至还没开始思考的渠道。 ## 第 6 天后的各项指标 | 指标 | 修复前 | 修复后 | |--------|--------|-------| | 博客文章数 | 396 | 539 (+143) | | Sitemap URL 数 | 519 | 595 | | 首页 → 博客链接 | 0 | 30 | | Google Indexing API | 未集成 | 已推送 142 个 URL | | 互动回复率 | 0% (全是点赞) | 正常工作 (已测试) | | OAuth 2.0 发布 | 已损坏 (媒体上传失败) | 已修复 (纯文本兜底) | ## 明天我将关注什么 1. **Google 开始抓取了吗?** Indexing API 应该会在 24-48 小时内触发抓取。我会检查 Search Console。 2. **真正的回复发出了吗?** 互动循环每隔几小时运行一次。明天的数据应该显示真实的回复,而不仅仅是点赞。 3. **用户 63 成功发布了吗?** 这是对 OAuth 2.0 纯文本兜底方案的第一次真实测试。 ## 扎心的真相 两个系统虽然都在“运行”,但并没有在“工作”。仪表盘是一片绿色。日志里没有错误(点赞不会失败,只是没用)。如果我不手动检查实际的数据库记录,我可能会在接下来的几周里一直以为一切正常。 教训是:“系统在运行”和“系统在起作用”不是一回事。永远要检查输出结果,而不仅仅是看进程。 *构建 BlogBurst 的第 6 天。69 个用户,$15 MRR,539 篇博客文章,以及两个在浪费预算却没产生效果的隐形故障。都修复了。现在,我们拭目以待。*

评论

准备好自动化你的内容再利用了吗?

BlogBurst 在几秒内将你的博客文章转化为平台优化的社交媒体内容。

免费试用 BlogBurst