相信很多人和泪雪一样,并没有听说过360搜索的一项具体的算法名称,当泪雪在站在群里面看到官方的管理员发表出来才知道有这么一个叫ICO的算法,我的第一反应还以为是网站的ICO图标呢,仔细一看原来如此,下面是官方给出的一些介绍。
ICO算法主要是解决对入索引的低质量和无效数据执行清理,在不同的阶段会对不同类型的无效数据做清理,该算法是一个长期执行的算法。(ICO 全称:Index clear optimize)
动态:超过清理10亿以上索引页面处理的算法360搜索都提前公布告知站长,以及告知算法优化处理的主要方向。
ICO算法—针对重复内容清理
处理量级:10亿以上
处理网页特点:
该算法主要是针对重复内容进行清理,对用户没有价值内容的页面,内容时效性强且过期得页面,采集站类,含有无效参数的页面等
例如:招聘类网站不同子站,但内容相同的页面,小说采集站且对用户贡献小,旧新闻页且重复过多也会处理一部分。
除非注明,否则均为泪雪博客原创文章,禁止任何形式转载
留言评论