robots.txt 中没有索引

2023-12-02

我总是阻止谷歌使用 robots.txt 文件为我的网站建立索引。最近我读到了谷歌员工的一篇文章,他说你应该使用元标签来做到这一点。这是否意味着 Robots.txt 不起作用?由于我正在使用 CMS,我的选择非常有限,并且仅使用 robots.txt 文件会容易得多。我的问题是,如果我继续使用 robots.txt 文件而不是元标记,可能发生的最糟糕的情况是什么。


简单来说,差异如下:

  • A 机器人.txt文件控制爬行。它指示正在寻找要爬行的页面的机器人(又称蜘蛛)“避开”某些地方。您将此文件放置在网站的根目录中。

  • A noindex标签控制索引。它告诉蜘蛛该页面不应被索引。您将此标签放置在相关网页的代码中。

当您想要在目录级别或整个站点进行控制时,请使用 robots.txt 文件。但是,请记住,机器人不需要遵循这些指令。大多数都会,例如 Googlebot,但将任何高度敏感的信息保留在网站的公开访问区域之外会更安全。

与 robots.txt 文件一样,noindex 标记将从搜索结果中排除页面。该页面仍将被抓取,但不会被索引。当您想要在单个页面级别进行控制时,请使用这些标签。

关于爬行和索引之间的区别的旁白:爬行(通过蜘蛛)是搜索引擎的蜘蛛跟踪您的网站的方式;爬行的结果进入搜索引擎的索引。将此信息存储在索引中可以加快相关搜索结果的返回速度 - 无需扫描与搜索相关的每个页面,而是搜索索引(较小的数据库)以优化速度。

如果没有索引,搜索引擎将查看与搜索词相关的每一个数据或信息,我们都有时间在等待搜索结果显示的同时制作和吃几个三明治。该索引使用蜘蛛来保持其数据库最新。

以下是该标签的示例:

<meta name="robots" content="noindex,follow"/>

既然您阅读并理解了上述信息,我想您已经能够自己回答您的问题了;)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

robots.txt 中没有索引 的相关文章

  • 通过 PHP 呈现纯文本

    出于某种原因 我想通过 PHP 脚本提供 robots txt 我已经设置了 apache 以便 robots txt 文件请求 实际上是所有文件请求 到达单个 PHP 脚本 我用来渲染 robots txt 的代码是 echo User
  • robots.txt 文件放在哪里? [关闭]

    Closed 这个问题是无关 目前不接受答案 robots txt应该放在哪里 domainname com robots txt or domainname public html robots txt 我将文件放入domainname
  • robots.txt 的正则表达式

    我正在尝试设置 robots txt 但我不确定正则表达式 我有四个不同的页面 全部以三种不同的语言提供 我想我可以使用正则表达式 而不是列出每个页面乘以 3 nav aspx page aspx changelang 可能附加一个查询字符
  • robots.txt 中没有索引

    我总是阻止谷歌使用 robots txt 文件为我的网站建立索引 最近我读到了谷歌员工的一篇文章 他说你应该使用元标签来做到这一点 这是否意味着 Robots txt 不起作用 由于我正在使用 CMS 我的选择非常有限 并且仅使用 robo
  • 阻止滥用机器人爬行?

    这是一个好主意吗 http browsers garykeith com stream asp RobotsTXT 滥用爬行是什么意思 这对我的网站有什么坏处 并不真地 无论如何 大多数 坏机器人 都会忽略 robots txt 文件 滥用
  • robots.txt - 这有效吗?

    我刚刚遇到了一个 robots txt 如下所示 User agent Disallow foobar User agent badbot Disallow 仅禁止所有文件夹后 具体是否badbot规则是否适用 注意 此问题仅用于理解上述规
  • 如何设置仅允许站点默认页面的robot.txt

    假设我有一个网站http example com http example com 我真的很想让机器人看到主页 但任何其他页面都需要被阻止 因为它对蜘蛛来说毫无意义 换句话说 http example com http example co
  • Robots.txt,如何只允许访问域根目录,而不允许更深层次的访问? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我想允许爬虫访问我的域的根目录 即index html 文件 但没有更深入的目录 即没有子目录 我不想在 robots txt 文件中单独列出和拒绝每
  • Robots.txt优先问题

    如果 robots txt 中有这些行 Disallow folder Allow folder filename php 那么 filename php 会被允许吗 谷歌对这些行的优先顺序是什么 例如 这里会发生什么 Allow Disa
  • robots.txt URL 格式

    根据这一页 http www robotstxt org robotstxt html User agent 或 Disallow 行中不支持 globbing 和正则表达式 然而 我注意到堆栈溢出机器人 txt https stackov
  • “索引、关注”或“关注”有什么区别?

    下面的列表有什么区别 首先 你可能知道元机器人 标签 元机器人标签是告诉蜘蛛或爬虫要抓取或索引哪个页面 关注手段 页面将被抓取 没有关注意味着 页面不会被抓取 指数均值 您的页面显示在搜索结果中 无索引意味着 您的页面未显示在
  • Googlebots 忽略 robots.txt? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我有一个网站 根目录中有以下 robots txt User agent Disabled User agent Googlebot Disabled
  • 任何人都可以获得任何 C# 代码来解析 robots.txt 并根据它评估 URL

    简短的问题 有没有人有任何 C 代码来解析 robots txt 然后根据它评估 URL 看看它们是否会被排除 长问题 我一直在为尚未发布到谷歌的新网站创建站点地图 站点地图有两种模式 用户模式 如传统站点地图 和 管理 模式 管理模式将显
  • Robots.txt - 多个用户代理的抓取延迟的正确格式是什么?

    下面是一个示例机器人 txt文件允许多个用户代理 with 多次抓取延迟对于每个用户代理 抓取延迟值仅供说明之用 在真实的 robots txt 文件中会有所不同 我在整个网络上搜索了正确的答案 但找不到 有太多混合的建议 我不知道哪个是正
  • BOT/蜘蛛陷阱创意

    我有一个客户 他的域名似乎受到 DDoS 攻击的严重打击 在日志中 看起来很正常的具有随机 IP 的用户代理 但它们翻阅页面的速度太快 不像人类 他们似乎也没有要求任何图像 我似乎找不到任何模式 我怀疑这是一群 Windows 僵尸 客户过
  • 为什么 Chrome 要求 robots.txt?

    我在日志中注意到 Chrome 请求了robots txt和我所期望的一切一样 2017 09 17 15 22 35 sanic INFO Goin Fast http 0 0 0 0 8080 2017 09 17 15 22 35 s
  • 具有大量动态子域的站点的站点地图

    我正在运行一个允许用户创建子域的网站 我想通过站点地图将这些用户子域提交给搜索引擎 但是 根据站点地图协议 和 Google 网站管理员工具 单个站点地图只能包含来自单个主机的 URL 最好的方法是什么 目前我有以下结构 站点地图索引位于
  • 尽管文件可访问,但“Lighthouse 无法下载 robots.txt 文件”

    我有一个NodeJS NextJS应用程序运行于http www schandilla com http www schandillia com 该项目有一个机器人 txt文件可访问于http www schandillia com rob
  • Ruby on Rails robots.txt 文件夹

    我即将启动 Ruby on Rails 应用程序 作为最后一个任务 我想设置机器人 txt文件 我找不到有关如何为 Rails 应用程序正确编写路径的信息 起始路径是否始终是 Ruby on Rails 应用程序或应用程序文件夹的根路径 那
  • 使用“禁止:/*?”在 robots.txt 文件中

    I used Disallow 在 robots txt 文件中禁止所有可能包含 的页面在网址中 该语法是否正确 或者我是否也阻止了其他页面 这取决于机器人 遵循原始 robots txt 规范的机器人不会给出 任何特殊含义 这些机器人会阻

随机推荐

  • 为什么右值引用被通用引用变成左值引用[重复]

    这个问题在这里已经有答案了 我想当通用引用参数与右值引用参数匹配时 会返回右值引用参数 然而 我的测试表明 右值引用被通用引用函数模板变成了左值引用 为什么会这样呢 include
  • NSDateFormatter 的时间错误

    我有一个字符串 我想从中解析时间 NSString longdate Mar 27 2011 8 38 38 PM 我想解析这个日期并仅输出时间部分 小时 分钟 上午 下午 First convert our string into an
  • 如何排除与 ASP.Net 中 HttpHandler 的指定路径匹配的内容?

    我知道 如果我想将 MyPage aspx 的请求转到名为 MyAssembly 的程序集中名为 MyHandler 的类 我可以将其添加到我的 web config 文件中
  • VS 2010 无法删除继承的附加依赖项

    您好 我错误地在项目配置 gt 链接器 gt 输入 gt 附加依赖项设置下添加了 cv210d lib cxcore210d lib 和 highgui210d lib 作为继承值 但我似乎无法将它们从 继承的 附加依赖项中删除 因此 每次
  • 如何执行伴生对象 Lateinit 是否初始化检查

    如果我有一个 Lateinit 变量 我可以检查它是否使用 this lateInitVar isInitialized 进行初始化 如下所示https stackoverflow com a 47860466 3286489 但是 如果该
  • 单击微调器时出现无法添加窗口、令牌无效错误

    我有一个 Android 应用程序 当单击侧栏中的选项时 它会转到一个片段 然后进入另一个具有可单击单选按钮的片段 单击这些时 它将创建一个弹出窗口 其中包含一些文本字段 基本上流程是这样的 活动 gt 片段 1 gt 片段 2 gt 弹出
  • 如果散列中有一个或多个字段,则使用 HashSet 和 Contains 返回 TRUE

    我想知道是否可以使用 HashSet 并创建该方法Contains如果某个字段位于给定对象的哈希中 则返回 true 这是我想要的一个例子 static void Main string args HashSet
  • Google Drive API v3 在 java 中获取根文件夹 ID

    我尝试了几种方法 但无法获取 Java Api v3 中的根文件夹 id 我尝试过的 String id service files get fileId root setFields id execute getId String id
  • 如何将 JSON 字符串转换为 BSONDocument

    我有以下使用reactivemongo 驱动程序的函数 并且实际上可以很好地写入数据库 def writeDocument val document BSONDocument firstName gt Stephane lastName g
  • 如何更新 Tkinter 标签?

    我有一个简单的 tkinter GUI 其中有一个显示数字和按钮的标签 我将其设置为变量 x 当按下按钮时 x 的值增加 1 但是 当我点击按钮时 标签不会更新 我该怎么做呢 from tkinter import x 1 def add
  • Windows 7 图标大小问题

    我正在尝试创建一个应用程序图标 我拿了一堆创建的 ico 文件 每个大小一个 并将它们组合成一个 ico 文件 我可以看到他们都很好 我有 16x16 32x32 48x48 64x64 和 128x128 图标 全部 32 位 带透明度
  • SwiftUI - NavigationLink 不适用于按钮

    我正在制作一个应用程序 在其中输入两个数字 并希望在单击按钮时在第二个屏幕中显示数字的相加结果 我可以在控制台中打印结果 但不幸的是 按钮周围的导航链接似乎不起作用 如果我将 NavigationLink 放在按钮标签周围而不是整个按钮周围
  • 如何从 Node.js 以编程方式运行“yarn tag”?

    我想从node js 以编程方式运行yarn 命令 但找不到任何sdk 或cli 实用程序 唯一的事情就是产生一个新的进程 但这很麻烦 截至 2019 年 1 月 Yarn 尚无可直接调用的 API 你cannot需要 Yarn 并使用类似
  • 在 wxPython 中绘图的最佳画布?

    我必须绘制组成物理网络拓扑模型的元素图 会有节点和拱门 后者可以是单向的或双向的 我想捕获节点和拱门的单击事件 以选择元素并在某处显示其属性 以及节点 以移动它们 和拱门 以连接或断开元素 的拖动事件 我做了一些研究 并将替代方案缩小到OG
  • 创建 Visual Studio 扩展时如何获取“源代码管理历史记录”窗口中的选定项目?

    我开发了一个Visual Studio 扩展 我将一个按钮附加到源代码管理历史记录窗口的上下文菜单 菜单上有 变更集详细信息 比较 等 我需要得到选定的历史项目从窗户看 但不知道该怎么做 Update 我使用 Team Foundation
  • 无法从客户端设备通过 C# 表单应用程序访问我的 SQL Server

    我有一个 C 应用程序连接到我的计算机上的在线服务器 当我在 Visual Studio 中测试我的应用程序时 它工作正常 但是当我将应用程序提供给客户端时 它无法工作 我在代码中直接在单击按钮事件中使用此连接字符串 Data Source
  • _app.getInitialProps 不会在每个请求上调用

    我正在根据主机名设置主题 一切都在开发模式下运行 但我只是跑了npm run build我看到了getInitialProps在构建期间被调用 我找不到任何有关何时的信息 app s getInitialProps被叫 我构建了整个应用程序
  • Git 分支名称 - 区分大小写还是不区分大小写?

    我是一个新的 git 用户 最近需要照顾一个过时的 git 存储库 这是原始状态 由 git show branch 输出 cr232 CR 232 Release dev Style Changes dev Style Changes d
  • 将 ListBox.SelectedObjectCollection 转换为 ListBox.ObjectCollection?

    是否可以将 ListBox SelectedObjectCollection 转换为 C 中的 ListBox ObjectCollection 如果是这样 我该怎么办 我有一个接受的函数List
  • robots.txt 中没有索引

    我总是阻止谷歌使用 robots txt 文件为我的网站建立索引 最近我读到了谷歌员工的一篇文章 他说你应该使用元标签来做到这一点 这是否意味着 Robots txt 不起作用 由于我正在使用 CMS 我的选择非常有限 并且仅使用 robo