多媒体信息检索的定义与分类
被考次数: 2次
被考频率: 低频率
答错率:    35%
知识难度:
考试要求: 熟悉     
知识路径:  > 多媒体信息显示、发布及搜索技术  > 多媒体信息搜索技术  > 多媒体信息搜索的定义与分类


本知识点历年真题试卷分布
>> 试题列表    
 

 
       多媒体信息检索是指根据用户的要求对图形、图像、文本、声音、动画等多媒体信息进行检索,最终得到用户所需的信息。多媒体信息检索系统有着广阔的应用前景,它将广泛应用于电子会议、远程教学、远程医疗、电子图书馆、艺术收藏、地球资源管理、天气预报、时装设计、金融市场、军事指挥系统、防汛指挥系统等领域。例如,数字图书馆将物理信息转化为数字多媒体形式,通过网络安全地发送给世界各地的用户。
       多媒体信息既包括数字化的文本、图形与图像信息,又包括数字化的视频与音频信息。对于这些结构化信息,主要针对文本文献的传统信息检索方法(基于外部特征和基于文本描述)无法揭示和表达多媒体信息的实质内容和语义关系。为了适应这一需要,人们提出了基于内容的多媒体信息检索思想。基于内容的检索是指根据媒体和媒体对象的内容及上下文联系在大规模多媒体数据库中进行检索。
       多媒体信息检索根据检索的内容可以分为以下几类。
       (1)基于内容的图像检索
       基于内容的图像检索(Content-based image retrieval, CBIR)是指在给定查询图像的前提下依据内容信息或指定查询标准在图像数据库中搜索并查找出符合查询条件的图片。CBIR是依据图像的视觉特征检索图像的。典型的CBIR系统允许用户输入一张图片以查找具有相同或相似内容的其他图片。而传统的图像检索是基于文本的,即通过图片的名称、文字信息和索引关系实现查询功能,这一概念于1992年由T. Kato提出,他在论文中构建了一个基于色彩与形状的图像数据库,并提供了一定的检索功能进行实验。此后,基于图像特征提取以实现图像检索的过程以及CBIR这一概念被广泛应用于各种研究领域,如统计学、模式识别、信号处理和计算机视觉。
       在CBIR中,各个图像都把特征提取后存储在数据库中,以便和待查询的图像特征进行比较,它主要包括以下两个步骤。
       . 特征提取:提取特征以达到可互相区别的程度。
       . 匹配:输出一个和这个特征相匹配的结果,也就是视觉特征上的相似性。
       所以基于内容的图像检索是依据人的视觉特点从图像中提取出最原始的视觉信息,主要包括图像的颜色特征、图像的形状特征、图像的纹理特征等,然后使用特征匹配算法进行检索和匹配。
       (2)基于内容的音频检索
       基于内容的音频检索是指通过音频特征分析对不同音频数据赋予不同的语义,使具有相同语义的音频在听觉上保持相似。内容特征提取是指寻找原始音频信号的表达形式,提取能代表原始信号的数据。音频内容特征的提取有两种不同的技术线路:一种是从叠加音频帧中提取特征,其原因在于音频信号是短时平稳的,所以短时提取的特征较稳定;另一种是从音频片段中提取,因为任何语义都有时间延续性,在长时间刻度内提取音频特征可以更好地反映音频所蕴含的语义信息,一般是将音频帧的统计特征作为音频片段特征。
       (3)基于内容的视频检索
       基于内容的视频检索是指根据视频的内容及上下文关系对大规模视频数据库中的视频数据进行检索,它区别于传统的基于关键字的检索手段,融合了图像理解、模式识别、计算机视觉等技术,是一种根据视频的内容及上下文关系且没有人工参与的基于关键字的检索手段,可以自动提取并描述视频的特征和内容,从而实现对大规模视频数据库中的视频数据进行检索。其关键技术的第一部分是镜头分割,第二部分是关键帧提取,第三部分是基于特征的视频索引与存储组织。
       (4)基于内容的多媒体文件检索技术
       基于内容的多媒体文件检索技术减少了机器的工作量,检索结果具有较高的精确匹配度,文件数据库管理者可以针对不同的文件类型对关键词检索技术和基于内容的检索技术进行综合利用,以期达到最好的效果。基于内容的多媒体文件检索技术虽然只是起步,但其前景却是辉煌的,随着技术问题的逐步解决,基于内容的多媒体文件检索技术将在信息社会的各个领域发挥重要的作用。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有