不管是赶集网、58同城等分类信息网站,还是慧聪网、1688等大型B2B电子商务网站,上海网站开发公司每天更新的数据全是海量的。赶集网淘宝相应职位招聘页面,北京地区仅一天发布的淘宝相应职位就有20页之多,要依靠人工审核每条数据是不可能完成的。
上海网站开发公司审核大批网站数据必须要建立一个强大的机审规则来代替人工审核工作量。具体操作流程如下:
(1)短信验证码确认发布。利用短信验证码可以有效防止机器发布海量垃圾信息,假如有短信验证码,就能确定是人为发布。
(2)建立违禁词库。网民发布信息的信息不可控,可能会涉及到黄赌毒等法律法规禁止的相应信息,因此必须要违禁词库来做低级筛选屏蔽相应信息。当网民发送的信息包含违禁词库
信息时,自动触发删除或者人工审核程序。违禁词库应依据法律法规政策和时代改变一直一直地更新、增加信息,在更初设计时必须要有足够多的容量和算法来确保短期能完成这样的审核。
(3)UGC网站信息页一般都设有投诉举报入口。当有其他顾客投诉举报该信息时,立即触发人工审核机制,对该信息重新审核。
上海网站开发公司建设SEO人员在优化UGC网站时,想要迅速审核海量数据,可以参考上述方法。
热点文章
最新文章