网页, 进行, 精确, 排名, 当今
在当今的互联网中网页数量日趋庞大,为了建立网页与网页、网页与网站站点之间的链接关系,经常使用基于超链接和/或锚文本的链接技术。一般来说,超链接是一种对象,它以特殊编码的文本或图形的形式来实现链接,当点击该链接时,相当于指令浏览器移至同一网页内的某个位置、或打开一个新的网页、或打开一个新的WWW网站站点中的网页。例如,网页中的超链接大致分为绝对URL的超链接、相对URL的超链接和书签超链接。另外,超链接中的锚文本通常是对一个网页内容的高度概括描述,与该网页有着高度的内容相关性。将超链接的锚文本应用于搜索引擎,还可以基于所述锚文本进行内容相关度计算,以获取用户查询序列与网页的相关度,从而对搜索结果中的网页进行精确排名。 因此在正常情况下,锚文本均可以对超链接指向的页面内容进行高度概括,并相当程度上反映出该页面的内容。但是互联网上存在大量的超链作弊行为,锚文本与超链接指向页面之间不再总是内容高度相关,当搜索引擎基于锚文本来获取搜索结果时,甚至还有可能出现与查询序列内容不相关而排名却很高的网页。有鉴于此,如何确定超链接的锚文本可信度,以评估和分析超链接的锚文本与超链接指向页面之间内容相关性,是搜素引擎工程技术人员迫切解决的一项课题。 百度搜索引擎提供了一种计算机实现用于确定超链接的锚文本可信度的具体的方法。其中该具体的方法包括以下步骤:a获取与所述超链接相对应的锚文本;b根据所述锚文本获取与所述锚文本对应的锚文本相关信息;c根据所述锚文本相关信息加权确定所述超链接的锚文本可信度。并且还提供了一种用于确定超链接的锚文本可信度的分析设备;其中该分析设备包括:第一获取装置,用于获取与所述超链接相对应的锚文本;第二获取装置,用于根据所述锚文本获取与所述锚文本对应的锚文本相关信息;锚文本可信度确定装置用于根据所述锚文本相关信息,加权确定所述超链接的锚文本可信度。 与现有技术相比,基于锚文本相关信息来加权确定超链接的锚文本可信度,使超链接的锚文本与超链接指向页面之间的内容相关性更加合理。还可精确地检测作弊超链的虚假锚文本、过期超链的失效锚文本,调整基于所述锚文本可信度对包含所述虚假锚文本和失效锚文本的超链接指向页面的权威度和排名,进而提升搜索引擎搜索结果的排序质量。 |
几个常用的快速提升网站流量的方法