robots.txt 禁止抓取後，為什麼頁面還是出現在搜尋結果中？

robots.txt 只是告訴爬蟲「不要來抓這個頁面」，但並沒有阻止搜尋引擎將該網址加入索引。如果頁面已經被索引或外部有連結指向，Google 仍可能顯示網址但標示「沒有可用的網頁資訊」，必須使用 noindex 標籤才能真正阻止索引。

noindex 和 nofollow 有什麼不同？我該同時使用嗎？

noindex 是告訴搜尋引擎「不要把這個頁面收錄到索引庫」，nofollow 則是「不要追蹤這個頁面上的連結」。兩者功能不同，若頁面內容不該被搜尋但連結需要被追蹤，只用 noindex；若連結也不要傳遞權重，才需要同時加上 nofollow。

不行，Sitemap 只是「建議」搜尋引擎優先抓取的清單，而非封鎖指令。即使從 Sitemap 移除，只要頁面存在且沒有 robots.txt 禁止或 noindex 標記，爬蟲仍可能透過內部連結或外部連結發現並索引該頁面。

技術條件與抓取理解 · 中文問題頁

可抓取性問題最常見的誤會，是把 robots、noindex、nofollow 與 sitemap 排除混成一件事。先分清楚每一個訊號到底在擋什麼，排查才會準。

Reddit 討論 1 則 How to Crawl a Site with Screaming Frog When Robots.txt Blocks Everything?

可抓取性問題最常見的誤會，是把 robots、noindex、nofollow 與 sitemap 排除混成一件事。先分清楚每一個訊號到底在擋什麼，排查才會準。

這類問題真正想解的是：目前到底是哪個層級的封鎖或排除訊號，讓 Google 沒辦法正常發現、抓取或保留這頁。

站內延伸文章

相鄰問題

社群來源

How to Crawl a Site with Screaming Frog When Robots.txt Blocks Everything? https://www.reddit.com/r/SEO/comments/1rw69gj/how_to_crawl_a_site_with_screaming_frog_when/