关于我们 RRS sitemaps 网站地图

首页 > SEO基础 > SEO优化 > 正文

SEM论坛

百度搜索如何提取页面主体内容

2019-07-10 09:25:19 |  评论:0  |  点击:  |  SEM论坛

百度搜索如何提取页面主体内容

大家都知道页面想要被收录的话,首先必须得有百度蜘蛛抓取,在成功抓取后经过第一轮的质量分析,合格的页面就会被放到索引库,后续我们site的话才有可能看到数据。这里就涉及到一个问题,百度搜索是如何提取页面的主体内容的!本文笔者就简单的跟大家说说这个问题,至于提取后的check结果,以后再具体讲解。

事实上百度搜索提取页面的主体内容是很简单的,因为通常来说,任何一个页面都有较为明显统一的结构,通常用div这样的标签,所以搜索引擎能够很方面的区分页面的几大内容模块:头部内容、中间内容、底部内容,而在中间内容部分往往又可能分出主体内容和侧边栏内容。所以通过这些内容模块,百度搜索就能大概的提取出页面的主体内容了。

有朋友说网站首页、分类页以及详情页面的模板都不一样,百度搜索怎么去处理呢?大家要知道百度搜索是有大数据作为基础的,也就是说无论我们怎么去设计页面结构,百度都能够轻而易举的识别。

前面说的提取内容是从大概的方面,下面我们就以首页和文章页面来具体做下讲解:

一、百度搜索怎么提取网站首页的主体内容

百度搜索是如何提取网站首页的主体内容呢?相对来说首页的页面布局会比较复杂,但是无论怎么布局,都需要用到类似div这样的结构,另外大家在设计模板的时候,往往会对标题做H标签设置,或者是加粗等,这些都能够给百度搜索提高分析的依据。所以,百度搜索会根据首页的页面标题,然后结合html代码的标签,把主要的文字内容都提出来。一般来说百度搜索会把首页的主体内容处理得更加结构化,以此为依据给后续的页面收录关键词排名提供参考。

总之来说,百度搜索能够把网站首页内容以结构化的形式处理,同时会针对不同的关键词,初步的计算权重。

二、百度搜索怎么提取文章页面的主体内容

通过上面的内容介绍,大家应该都清楚了,文章页面的结构要简单得多,基本上重要的信息就在于文章本身的内容,以及相关文章的内容。所以百度搜索提取页面的主体内容会更加简单。

百度对首页的内容处理会呈现结构化,那么对文章这样简单的页面是否也会这样呢?其实这个理解也是可以的。对于文章页面来说,最重要的信息就是文章的内容,其次就是紧密相关的内容,这些是百度搜索提取的主体信息。但也请大家注意,虽说像侧边栏和头部底部等地方的内容重要性不大,但是百度仍然会提取,只是起到的作用就很小了。

关于百度搜索如何提取页面主体内容的问题,笔者就简单的跟大家说这么多。总结来说,百度搜索能够很好的识别页面的主体内容,所以我们设计页面机构的时候,就要尽可能的规范;其次在处理内容模块的时候,要注意跟页面主题的相关性,百度更加喜欢内容主题明确、内容层级清晰的页面!

当然还有很多其他类型的页面,都可以按照这个思路去分析。这里有个问题大家要注意,百度搜索更加重重视主体内容里面的链接,给予的权重也会更高。所以,大家在设计内链的时候就要注意了。


关键字: