处理网页
考试要求: 熟悉     
知识路径:  > 多媒体信息显示、发布及搜索技术  > 多媒体信息搜索技术  > 搜索引擎的基本工作原理  > 搜索引擎的基本工作原理


 
       搜索引擎抓取到网页后,还要进行大量的预处理工作,然后才能提供检索服务。其中,最重要的工作就是提取关键词、建立索引库和索引。其他工作还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度和丰富度等。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有