二、构建身体姿势识别
这一模块是通过对身体各个部位的确认,来识别不同的身体姿势,以代表不同的游戏指令。通过检测手臂的姿态、脸部的位置等,系统就能确定玩家的特定姿势,触发动画中鹰的动作效果。被窝网
其中涉及到一个名为 OpenPose 的开源库,其包含各种手势识别、姿势识别、面部识别的 AI 模型,而 Nalwan 使用了名为 COCO 的身体姿势模型。该模型含有 18 个骨骼节点捕捉器,能实时识别人体的 18 个关节,Griffin 用到了其中 6 个关节。
▲COCO 关节点图
OpenPose 建立在 PyTorch 框架之上,该框架在 NVIDIA AGX Xavier 中运行帧率很低,只有 4FPS。Nalwan 则使用 torch2trt 工具,将 PyTorch 模型移植到 TensorRT 中,大大加快了帧率,达到 100FPS。被窝网