摘要:本发明提供了一种网站类型的识别方法及装置,其中的方法包括:根据预定关键词集对预定数据库进行筛选获得网站集合;根据所述网站集合中每个网站的预定特征对所述网站集合进行过滤;根据过滤后的网站的特征识别出网站的类型。该方法通过对预定数据库中的网站进行筛选和过滤后以实现网站类型的识别,减少了计算量,提高了识别效率和网站类型识别的准确度。
- 专利类型发明专利
- 申请人百度在线网络技术(北京)有限公司;
- 发明人李曙聪;牛朋涛;董长阳;蒋智超;徐元峰;
- 地址100085 北京市海淀区上地十街10号百度大厦
- 申请号CN201510634837.6
- 申请时间2015年09月29日
- 申请公布号CN106557520A
- 申请公布时间2017年04月05日
- 分类号G06F17/30(2006.01)I;