肢体动作交互技术-软考在线

肢体动作交互技术



考试要求：熟悉

知识路径： > 多媒体应用的新技术 > 人机交互技术 > 肢体动作交互技术

近些年，随着嵌入式系统、传感器、无线通信、分布式技术等的快速发展，各种新的应用层出不穷，人们面临的计算环境也发生了诸多变化，从桌面计算到移动计算再到无处不在的计算，人机交互技术面临着新的机遇和挑战。

在这样的背景下，传统的基于桌面隐喻的键盘、鼠标以及相应的WIMP（Window, Icon, Menu, Pointing Device）界面已经难以满足用户对交互技术的需要。于是从20世纪90年代开始，研究人员将焦点聚集到了下一代用户界面的研究上，而基于肢体动作的交互技术就是其中的一个重要方向。目前，肢体交互中的非穿戴式实现方案已经相当成熟了，如Kinect体感器。

Kinect是微软公司在2009年6月2日的E3大会上正式公布的XBOX 360体感周边外设。它是一种3D体感摄影机（开发代号：Project Natal），它同时导入了即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能。微软的Kinect不需要使用任何控制器，它依靠相机捕捉三维空间中玩家的运动。

Kinect的整体结构如下图所示。Kinect一共有3个摄像头，中间的摄像头是RGB摄像头，用来获取640×480像素的彩色图像，每秒最多获取30帧图像；两边有两个深度传感器，左侧的是红外线发射器，右侧的是红外线接收器，用来检测玩家的相对位置。Kinect的两侧是一组四元麦克风阵列，用于声源定位和语音识别；其下方还有一个带内置马达的底座，可以调整俯仰角。

Kinect的整体结构

Kinect主要包括以下几个功能。

①骨骼追踪。对在Kinect视野范围内移动的一个或两个人进行骨骼追踪，可以追踪到人体上的20个节点（一般是24个节点）。此外，Kinect还支持更精确的人脸识别。

②深度摄像头。利用光编码技术，通过深度传感器获取视野内的环境三维位置信息。这种深度数据可以简单地理解为一张利用特殊摄像头获取的图像，但是其每一个像素的数据不是普通彩色图片的像素值，而是这个像素的位置距Kinect传感器的距离。由于这种技术是利用Kinect红外发射器发出的红外线对空间进行编码的，因此无论环境光线如何变化，测量结果都不会受到干扰。

③音频处理。与Microsoft Speech的语音识别API集成，使用一组具有消除噪声和回波的四元麦克风阵列，能够捕捉到声源附近有效范围内的各种信息。

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5