相信很多人和泪雪一样,并没有听说过360 搜索的一项具体的算法名称,当泪雪在站在群里面看到官方的管理员发表出来才知道有这么一个叫 ICO 的算法,我的第一反应还以为是网站的 ICO 图标呢,仔细一看原来如此,下面是官方给出的一些介绍。

360 搜索 ICO 算法简介

ICO 算法主要是解决对入索引的低质量和无效数据执行清理,在不同的阶段会对不同类型的无效数据做清理,该算法是一个长期执行的算法。(ICO 全称:Index clear optimize)

动态:超过清理 10 亿以上索引页面处理的算法 360 搜索都提前公布告知站长,以及告知算法优化处理的主要方向。

ICO 算法—针对重复内容清理

处理量级:10 亿以上

处理网页特点

该算法主要是针对重复内容进行清理,对用户没有价值内容的页面,内容时效性强且过期得页面,采集站类,含有无效参数的页面等

例如:招聘类网站不同子站,但内容相同的页面,小说采集站且对用户贡献小,旧新闻页且重复过多也会处理一部分。

除非注明,否则均为泪雪博客原创文章,禁止任何形式转载

本文链接:https://zhangzifan.com/360-index-clear-optimize.html

发表评论