FavoriteLoading
0

SEO搜索引擎的工作方式–爬行,建立索引和排名(二)

2xx状态码:指示对页面的请求成功的一类状态码。

4xx状态码:一类状态码,指示对页面的请求导致错误。

5xx状态码:一类状态码,指示服务器无法执行请求。

高级搜索运算符:您可以在搜索栏中键入特殊字符和命令,以进一步指定查询。

算法:一种过程或公式,通过该过程或公式以有意义的方式检索和排序存储的信息。

反向链接:或“入站链接”是来自其他网站的指向您网站的链接。

漫游器:也称为“爬虫”或“蜘蛛”,它们是在互联网上搜寻内容的原因。

缓存:网页的已保存版本。

咖啡因: 百度或Google的网络索引系统。咖啡因是Web内容的索引或集合,而Googlebot是出去寻找内容的爬虫。

引用:也称为“企业列表”,引用是基于Web的对本地企业的名称,地址和电话号码(NAP)的引用。

伪装:向搜索引擎显示的内容与向人类访问者显示的内容不同。

抓取预算:搜索引擎机器人将在您的网站上抓取的平均页面数

搜寻器指令:关于搜寻器的说明,说明您希望其在网站上进行搜寻和建立索引。

距离:在本地包的上下文中,距离是指接近度,搜索者的位置和/或查询中指定的位置。

互动度:代表搜索者如何通过搜索结果与您的网站进行互动的数据。

Google质量指南:Google发布的指南,详细列出了由于其恶意和/或意图操纵搜索结果而被禁止的策略。

Google Search Console:由Google提供的免费程序,它允许网站所有者监视其网站在搜索中的运行情况。

HTML:超文本标记语言是用于创建网页的语言。

索引覆盖率报告: Google Search Console中的报告,可向您显示站点页面的索引状态。

索引:一个庞大的数据库,其中包含所有内容搜索引擎爬虫的发现范围,并认为它们足以满足搜索者的需求。

内部链接:您自己网站上的链接指向同一网站上的其他页面。

JavaScript:一种将动态元素添加到静态网页的编程语言。

登录表单:指访问者访问内容之前需要登录身份验证的页面。

手动处罚:是指Google的“手动操作”,其中人工审核者确定您网站上的某些页面违反了Google的质量准则。

元机器人标记:为爬网程序提供有关如何爬网或索引网页内容的指令的代码段。

导航:链接列表,可帮助访问者导航到您网站上的其他页面。通常,这些内容会显示在网站顶部的列表(“顶部导航”),网站侧栏(“侧面导航”)或网站底部的列表(“页脚导航”)中。

NoIndex标记:指示搜索引擎不要为其所在页面编制索引的元标记。

PageRank: Google核心算法的组成部分。这是一个链接分析程序,它通过测量指向网页的链接的质量和数量来估计网页的重要性。

个性化:指搜索引擎根据某人独特的因素(例如他们的位置和搜索历史)修改其结果的方式。

突出:在本地组合中,突出是指在现实世界中广为人知和喜爱的企业。

RankBrain: Google核心算法的机器学习组件,可通过提升最相关,最有用的结果来调整排名。

相关性:在本地包的背景下,相关性是本地商家与搜索者所寻找的匹配程度

Robots.txt:文件,这些文件建议您的网站搜索引擎应该和不应该爬网的部分。

搜索表单:指网站上的搜索功能或搜索栏,可帮助用户在该网站上查找页面。

搜索质量评估者指南:适用于Google的人力评估者指南,用于确定真实网页的质量。

站点地图:爬网程序可用来发现您的内容并为其编制索引的URL列表。

垃圾邮件策略:与“黑帽”一样,垃圾邮件策略是违反搜索引擎质量准则的那些策略。

URL文件夹:网站中出现在TLD(“ .com”)之后的部分,以斜杠(“ /”)分隔。例如,在“ cwhello.com/blog”中,我们可以说“ / blog”是一个文件夹。

URL参数:问号后面的信息,该信息附加到URL上以更改页面的内容(主动参数)或跟踪信息(被动参数)。

X-robots-tag:类似于meta robots标签,此标签为抓取工具提供了有关如何抓取或索引网页内容的说明。

欢迎分享本文,转载请保留出处!—重蔚自留地 站长邮箱:951076433@qq.com