您好、欢迎来到现金彩票网!
当前位置:秒速时时彩 > 搜索算法 >

百度搜索引擎的算法是怎样的?

发布时间:2019-07-03 05:13 来源:未知 编辑:admin

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  展开全部百度基础算法分析:链接流行度核心算法+百度推广+框计算+开放平台

  1.【链接流行度】和大多数关键词搜索引擎一样,页面URL地址链接的流行程度为核心的基础核心算法;

  2.【百度推广】起先叫做百度竞价,后改为百度推广,包括关键词竞价算法和网盟推广算法两部分;

  1.【页面的收录】搜索蜘蛛程序收录的页面链接现新的链接并爬行的页面及内容合格录快照并分类存储立页面基本数据(页面URL、页面关键词、页面标题描述、收录来源、收录时间、内容简述、页面权重、更新周期);

  2.【百度免费产品】百度百科、百度文库、百度贴吧、百度知道、百度空间等百度自身免费产品的页面收录;

  3.【百度开放平台】主要是站长提供的结构化数据(网站与百度的深度合作,如汽车网站的参数数据、百度知道接口等)和开发者提交的各种应用(开发者加入百度开发者中心并提交相关应用通过审核);

  4.【百度竞价推广】网站主开通百度推广账户付费并通过网站审核辑关键词广告及推广计划交百度推广后台;

  5.【百度网盟推广】网站主开通百度推广账户付费并通过网站审核辑网盟广告及推广计划交百度推广后台;百度联盟广告合作伙伴站长参与网盟推广并审核通过》预留广告位并做好网盟接口。

  1.【百度搜索页面的检索】用户输入关键词并检索架算(语义分析及分词判断、行为分析、智能人机交互、海量基础算法)计算结果(开放平台的数据、传统搜索结果、百度推广结果、百度自身产品结果)计算结果排名。

  2.【百度网盟页面的推荐】用户访问百度网盟某合作网站页面盟算法根据用户浏览器大量有价值的搜索Cookis计算并推荐广告户被有质量的广告吸引并点击盟推广后台引导用户进入参与网盟推广的网站相应页面。

  搜索引擎算法: 获得网站网页资料,建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。搜索引擎的数据库是依靠一个叫“网络机器人(crawlers)”或叫“网络蜘蛛(Spider)”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按一定的规则分析整理形成的。

  百度搜索引擎在衡量网页质量时,会从以下三个维度综合考虑给出一个质量打分。下面会一一介绍这些影响网页质量判断的维度特征:

  一个访问流畅,内容质量高且浏览体验好的网页具有较高的质量;反之,任何一个维度出现问题,都会影响网页的整体质量。下面我们具体介绍下这三个维度。

  网页主体内容是网页的价值所在,是满足用户需求的前提基础。百度搜索引擎评价网页内容质量主要看其主体内容的好坏,以及主体内容是否可以让用户满意。 不同类型网页的主体内容不同,百度搜索引擎判断不同网页的内容价值时,需要关注的点也有区别,如:

   下载页:是否提供下载入口,是否有权限限制,资源是否有效。

  百度搜索引擎考量网页内容质量的维度非常多,最为重要的是:成本;内容完整;信息真实有效以及安全。下面我们通过举例来感受一下百度搜索引擎是如何对网页的内容质量进行分类的,请站长对比自己站点的页面,站在搜索引擎和用户的角度为自己打分:

  百度搜索引擎认为内容质量好的网页,花费了较多时间和精力编辑,倾注了编者的经验和专业知识;内容清晰、完整且丰富;资源有效且优质;信息真实有效;安全无毒;不含任何作弊行为和意图,对用户有较强的正收益。对这部分网页,百度搜索引擎会提高其展现在用户面前的机率。例如:

  内容质量中等的网页往往能满足用户需求,但未花费较多时间和精力进行制作编辑,不能体现出编者的经验和专业知识;内容完整但并不丰富;资源有效但质量欠佳;信息虽真实有效但属采集得来;安全无毒;不含作弊行为和意图。在互联网中,中等质量网页其实是一个比较大的数量集合,种类面貌也繁杂多样,百度搜索引擎在评价这类网页时往往还要考虑其它非常多因素。在这里,我们仅部分举例来让各位感受一下:

  百度搜索引擎认为主体内容信息量较少,或无有效信息、信息失效过期的都属于内容质量差网页,对用户没有什么实质性的帮助,应该减少其展现的机会。同时,如果一个网站内该类网页的占比过大,也会影响百度搜索引擎对站点的评级,尤其是UGC网站、电商网站、黄页网站要尤其重视对过期、失效网页的管理。例如:

  没有内容质量可言的网页指那些制作成本很低,粗制滥造;从别处采集来的内容未经最起码的编辑整理即放置线上;挂木马等病毒;含有作弊行为或意图;完全不能满足用户需求,甚至含有欺骗内容的网页。例如:

  除上述网页外,欺骗用户和搜索引擎的网页在无内容质量可言集合里占很高比例。百度搜索引擎对作弊网页的定义是:不以满足用户需求为目的,通过不正当手段欺骗用户和搜索引擎从而获利的网页。目前互联网上这部分网页还属少数,但作弊网页的价值是负向的,对用户的伤害非常大,对这类网页,搜索引擎持坚决打击态度。

  不同质量的网页带给用户的浏览体验会有很大差距,一个优质的网页给用户的浏览体验应该是正向的。用户希望看到干净、易阅读的网页,排版混乱、广告过多会影响用户对网页主体内容的获取。在百度搜索引擎网页质量体系中,用户对网页主体内容的获取成本与浏览体验呈反比,即获取成本越高,浏览体验越低。面对内容质量相近的网页,浏览体验佳者更容易获得更高的排位,而对于浏览体验差的网页,百度搜索引擎会视情况降低其展现的机率甚至拒绝收录。

  影响用户浏览体验好坏的因素很多,目前百度搜索引擎主要从内容排版、广告影响两方面对网页进行考量:

  内容排版:用户进入网页第一眼看到的就是内容排版,排版决定了用户对网页的第一印象,也决定了用户对内容获取的成本。

  广告影响:百度搜索引擎理解网站的生存发展需要资金支持,对网页上放置正当广告持支持态度。网页应该以满足用户需求为主旨,最佳状态即“主体内容与广告一起满足用户需求,内容为主,广告为辅”,而不应让广告成为网页主体。

  下面我们通过举例来感受一下百度搜索引擎是如何对网页的浏览体验进行分类的,站长可以据此对比检验自己站点的浏览体验如何:

  页面布局和广告放置影响了用户对主体内容的获取,提高了用户获取信息的成本,令用户反感。包括但不仅限于以下情况:

   广告遮挡主体内容;或者在通用分辨率下,首屏都是广告,看不到主体内容;

  用户希望快速地从搜索引擎获取到需要的信息,百度搜索引擎尽可能为用户提供能一次性直接获取所有信息的网页结果。百度搜索引擎认为不能直接获取到主体内容的网页对用户是不友好的,会视情况调整其展现机率。

  百度搜索引擎会从正常打开、权限限制、有效性三方面判断网页的可访问性,对于可以正常访问的网页,可以参与正常排序;对于有权限限制的网页,再通过其它维度对其进行观察;对于失效网页,会降权其展现机制甚至从数据库中删除。

  1)打开权限:指打开网页都需要登录权限,没有权限完全无法看到具体内容,普通用户无法获取或获取成本很高,百度搜索引擎会降低其展现机率。不包括以登录为主要功能的网页。

  2)资源获取权限:指获取网页主要内容,如文档、软件、视频等,需要权限或者需要安装插件才能获得完整内容。此时会分三种情况:

   提供优质、正版内容的网站,由于内容建设成本很高,尽管查看全文或下载时需要权限或安装插件,但属于用户预期之内,百度搜索引擎也不认为权限行为对用户造成伤害,给予与正常可访问页面相同的对待。

   对于一些非优质、非正版的资源,来自于用户转载甚至机器采集,本身成本较低,内容也不独特,用户获取资源还有权限限制——需要用户注册登录或者付费查看,百度搜索引擎会根据具体情况决定是否调整其展现。

   还有一些视频、下载资源页,也许自身资源质量并不差,但需要安装非常冷门的插件才能正常访问,比如要求安装“xx大片播放器”,百度搜索引擎会怀疑其有恶意倾向。

  入党申请书,本身就是转载的,网上到处都是,但这个页面仍然要求收费才能下载。

  往往指死链和主体资源失效的网页。百度搜索引擎认为这部分网页无法提供有价值信息,如果站点中此类网页过多,也会影响百度搜索引擎对其的收录和评级。建议站长对此类网页进行相应设置,并及时登录百度站长平台,使用死链提交工具告知百度搜索引擎。

   打开后提示内容被删除,或因内容已不存在跳转到首页的网页;

   被删除内容的论坛帖子,被删除的视频页面(多出现在UGC站点)

http://golfsandpiper.com/sousuosuanfa/573.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有