武汉seo公司哪家好:百度搜索引擎检测网站heilian垃圾链接的算法实现

武汉seo
网站优化:百度搜索引擎检测网站heili
heilian又称暗链、湮没链接,是heimao手法中相当赅博的一种能力,是指用非正常能力获取的其他网页的反向链接,最常见的heilian就是经由过程各类网页轨范裂痕获取搜刮引擎权重或网页级别(PR)较高的网页的照料权限代码(Webshell),进而在被黑网页上链接自己的网页。该能力是搜刮引擎中进行作弊最有效最迅速的体式之一,在暴利行业行使尤多,比如游戏、waigua、彩铃等营业的行业。现有的heilian检测体式首要包罗以下几种:其一、网站照料人员经由过程常常查察网页源代码的体式,检测网页是否被挂上heilian。其二、查察网页中的链接是否可访谒,假如存在未知链接,则嫌疑被挂上heilian,删除该未知链接。其三、经由过程FTP工具查察网页文件的改削时候,假如存在改削时候异于大大都文件改削时候的文件,则该文件就或许被改削了文件源代码,挂了heilian。上述几种heilian检测体式都需要大量的人工把持,一方面华侈人力资源,对网站照料人员的heilian常识提出较高要求,无法实现heilian的主动检测;另一方面,对于新呈现的heilian作弊体式,很难实时有效地发现。百度搜素引擎供给了一种检测heilian的算法措置装配,以便于实现heilian的主动检测。具体手艺方案如下:S1、提取待检测网页的超链接,一一对获取的超链接执行heilian检测流程@heilian检测流程包罗:Al、判断超链接的视觉特征参数是否满意预设的不成见特征要求,假如是,则确定该超链接为heilian。百度heilian检测算法的测试案例中在heilian检测流程的轨范Al中,假如判断功效为否,则进一步执行轨范A2;A2、判断该超链接的外链引用次数是否跨越预设的次数阀值,假如是,则确定该超链接为heilian。百度heilian检测算法的测试案例中假如所述A2的判断功效为否,则将该超链接插手白名单数据库,竣事对该超链接的heilian检测流程。百度heilian检测算法的测试案例中在所述轨范Sl之前还包罗:SO、将所述待检测网页的网址与已有的白名单数据库进行成家,假如成家得上,则确定所述待检测网页不存在heilian,竣事流程;否则持续执行所述轨范Slo百度heilian检测算法的测试案例中所述确定该超链接为heilian进一步包罗:获取该超链接的网页内容特征;将获取的内容特征与已挖掘出的恶意特征数据库进行成家,假如成家得上,则确定该超链接为heilian。百度heilian检测算法的测试案例中所述恶意特征数据库中存储有被识别为heilian的网页的关头词;所述将获取的内容特征与已挖掘出的恶意特征数据库进行成家具体包罗:将获取的该超链接的网页标题title或网页元信息l}Zeta与所述恶意特征数据库中存储的关头词进行成家。百度heilian检测算法的测试案例中在确定出该超链接为heilian后,进一步包罗:从该heilian的网页中进一步提取关头词,将该关头词存储于恶意特征数据库。百度heilian检测算法的测试案例中在所述轨范Al中,当所述视觉特征参数为颜色设置参数时,对应的不成见特征要求为该超链接的颜色设置参数与所述待检测网页布景颜色一致;或者当所述视觉特征参数为字体参数时,对应的不成见特征要求为该超链接的字体参数的值小于或等于预设的字体参数阀值;或者当所述视觉特征参数为关头字位置参数时,对应的不成见特征要求为该超链接的关头字位置在所述待检测网页的可见规模之外;或者当所述视觉特征参数为链接揭示参数时,对应的不成见特征要求为该超链接以跑马灯形式闪现或者不显示。百度heilian检测算法的测试案例中所述恶意特征数据库存储有被确定为heilian的链接;该体式还包罗:从网页库中获取超链接中包含了所述恶意特征数据库中链接的网页,对该网页中的其他超链接一一执行所述heilian检测流程,并将检测出的heilian插手所述恶意特征数据库;或者,从网页库中找出与所述恶意特征数据库中链接的网页相似度满意预设相似度要求的网页,将找出的网页作为待检测网页转至轨范Sl处起头执行,然后将检测出的heilian插手所述恶意特征数据库。一种检测heilian的装配,该装配包罗:链接提取模块,用于提取待检测网页的超链接,并将提取的超链接一一供给给检测模块;检测模块,用于判断超链接的视觉特征参数是否满意预设的不成见特征要求,假如是,则将该超链接发送给heilian确定模块;heilian确定模块,用于将领受到的超链接确定为heilian。百度heilian检测算法的测试案例中该装配还包罗:引用次数判断模块,用于在所述检测模块的判断功效为否时,判断该超链接的外链引用次数是否跨越预设的次数阂值,假如是,则将该超链接发送给所述heilian确定模块。百度heilian检测算法的测试案例中该装配还包罗:白名单维护模块,用于在所述引用次数判断模块的判断功效为否时,将该超链接插手白名单数据库。百度heilian检测算法的测试案例中该装配还包罗:白名单判断模块,用于将所述待检测网页的网址与已有白名单数据库进行成家,假如成家得上,则确定所述待检测网页不存在heilian;否则,触发所述链接提取模块。百度heilian检测算法的测试案例中该装配还包罗:恶意特征成家模块,用于获取发送给所述heilian确定模块的超链接,获取该超链接的网页内容特征,将获取的内容特征与已挖掘出的恶意特征数据库进行成家,假如成家得上,则将该超链接发送给所述heilian确定模块。百度heilian检测算法的测试案例中所述恶意特征数据库中存储有被识别为heilian的网页的关头词;所述恶意特征成家模块在将获取的内容特征与已挖掘出的恶意特征数据库进行成家时,具体将获取的该超链接的网页标题title或网页元信息Meta与所述恶意特征数据库中存储的关头词进行成家。百度heilian检测算法的测试案例中该装配还包罗:恶意特征库维护模块,用于在所述heilian确定模块将该超链接确定heilian后,从该heilian的网页中进一步提取关头词,将该关头词存储于恶意特征数据库。百度heilian检测算法的测试案例中在所述检测模块中,当所述视觉特征参数为颜色设置参数时,采取的不成见特征要求为该超链接的颜色设置参数与所述待检测网页布景颜色一致;或者当所述视觉特征参数为字体参数时,采取的不成见特征要求为该超链接的字体参数的值小于或等于预设的字体参数I-7值;或者当所述视觉特征参数为关头字位置参数时,采取的不成见特征要求为该超链接的关头字位置在所述待检测网页的可见规模之外;或者当所述视觉特征参数为链接揭示参数时,采取的不成见特征要求为该超链接以跑马灯形式闪现或者不显示。百度heilian检测算法的测试案例中所述恶意特征数据库存储有被确定为heilian的链接;该装配还包罗:恶意特征库挖掘模块,用于从网页库中获取超链接中包含了所述恶意特征数据库中链接的网页,将该医美推广网页中的其他超链接一一供给给所述检测模块,并将所述heilian确定模块确定的heilian插手所述恶意特征数据库;或者,从网页库中找出与所述恶意特征数据库中链接的网页相似度满意预设相似度要求的网页,将找出的网页作为待检测网页供给给所述链接提取模块,然后将所述heilian确定模块确定的heilian插手所述恶意特征数据库。由以上手艺方案能够看出,百度heilian检测算法供给了一种主动实现heilian检测的体式,无需手工把持,不再受限于网站照料员对heilian常识的把握,因为百度heilian检测算法基于heilian的根蒂行为特征,即不成见的视觉特征,是以即就是新呈现的heilian,只要满意该根蒂行为特征均能够实时有效地发现。【附图申明】图1为百度heilian检测算法实施例一供给的检测heilian的体式流程图;图2为百度heilian检测算法实施例二供给的对超链接的视觉特征参数进行检测的流程图;图3为百度heilian检测算法实施例四供给的检测heilian的装配结构图。
上一篇:武汉seo优化淘宝皇冠卖家做客搜狐谈创业经验
下一篇:【武汉seo公司哪家好】一份完整的产品运营推广方案

网友回应

发布回复
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论,一切言论责任自负。
评价:
表情:
用户名: 验证码:点击我更换图片

欢迎扫描关注我们的微信公众平台!

欢迎扫描关注我们的微信公众平台!