肢体动作交互技术
考试要求: 熟悉     
知识路径:  > 多媒体应用的新技术  > 人机交互技术  > 肢体动作交互技术


 
       近些年,随着嵌入式系统、传感器、无线通信、分布式技术等的快速发展,各种新的应用层出不穷,人们面临的计算环境也发生了诸多变化,从桌面计算到移动计算再到无处不在的计算,人机交互技术面临着新的机遇和挑战。
       在这样的背景下,传统的基于桌面隐喻的键盘、鼠标以及相应的WIMP(Window, Icon, Menu, Pointing Device)界面已经难以满足用户对交互技术的需要。于是从20世纪90年代开始,研究人员将焦点聚集到了下一代用户界面的研究上,而基于肢体动作的交互技术就是其中的一个重要方向。目前,肢体交互中的非穿戴式实现方案已经相当成熟了,如Kinect体感器。
       Kinect是微软公司在2009年6月2日的E3大会上正式公布的XBOX 360体感周边外设。它是一种3D体感摄影机(开发代号:Project Natal),它同时导入了即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能。微软的Kinect不需要使用任何控制器,它依靠相机捕捉三维空间中玩家的运动。
       Kinect的整体结构如下图所示。Kinect一共有3个摄像头,中间的摄像头是RGB摄像头,用来获取640×480像素的彩色图像,每秒最多获取30帧图像;两边有两个深度传感器,左侧的是红外线发射器,右侧的是红外线接收器,用来检测玩家的相对位置。Kinect的两侧是一组四元麦克风阵列,用于声源定位和语音识别;其下方还有一个带内置马达的底座,可以调整俯仰角。
       
        Kinect的整体结构
       Kinect主要包括以下几个功能。
       ①骨骼追踪。对在Kinect视野范围内移动的一个或两个人进行骨骼追踪,可以追踪到人体上的20个节点(一般是24个节点)。此外,Kinect还支持更精确的人脸识别。
       ②深度摄像头。利用光编码技术,通过深度传感器获取视野内的环境三维位置信息。这种深度数据可以简单地理解为一张利用特殊摄像头获取的图像,但是其每一个像素的数据不是普通彩色图片的像素值,而是这个像素的位置距Kinect传感器的距离。由于这种技术是利用Kinect红外发射器发出的红外线对空间进行编码的,因此无论环境光线如何变化,测量结果都不会受到干扰。
       ③音频处理。与Microsoft Speech的语音识别API集成,使用一组具有消除噪声和回波的四元麦克风阵列,能够捕捉到声源附近有效范围内的各种信息。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有