4月1日消息,人工智能(AI)开发者 Jagadish K. MahendRan 及其团队推出了一款由人工智能驱动的语音激活背包,旨在协助视障人士进行导航和环境感知。这款背包能够识别多种常见障碍物,如交通信号灯、悬挂物体、人行横道、移动物体及上下坡等,其计算能力依托于一款低功耗的交互式设备。

英特尔技术支持的 AI 背包为视障人士提供导航和环境感知的帮助
Jagadish 说:“去年我认识了一位视觉障碍的朋友,发现当我在训练机器人看东西时,实际上许多人却看不见,并需要帮助。这让我萌生了开发这个视觉辅助系统的想法,利用英特尔的 OpenCV 人工智能工具包(OAK-D)。”
根据世界卫生组织的估计,全球有 2.85 亿视障人士。然而,现有的视觉辅助系统仍非常有限,从基于全球定位系统(GPS)的语音智能手机应用到配备摄像头的智能拐杖,这些设备不仅数量少,还缺乏深度感知能力,而这对于视障人士的独立出行至关重要。
英特尔技术倡导与 AI4Good 部门总监 HeMa ChaMRaj 表示:“看到这个开发者迅速地利用英特尔边缘人工智能技术开发出解决方案,帮助视障人士享受更便捷的生活,实在令人惊叹。现在我们拥有这样的技术,接下来需要开发者社区的创意来进一步拓展这一领域。”

Jagadish K. MahendRan 为他的人工智能驱动声控背包进行展示,该背包能帮助视障人士感知周围环境
系统工作原理:
该系统集成在一个小巧的背包中,内含主计算装置,如同一台笔记本电脑。摄像头藏于马甲内,而一个口袋大小的电池包则置于腰包中,支持大约 8 小时的使用时间。Luxonis OAK-D 空间人工智能摄像头可固定在马甲或腰包上,并连接至背包中的计算装置。马甲上设有三个可放置 OAK-D 摄像头的小孔。

背包装置
Luxonis 创始人兼首席执行官 Brandon Gilles 表示:“Luxonis 的使命是让工程师能开发出对人们有意义的产品,并快速应用英特尔的人工智能技术。看到有人在如此短的时间内利用 OAK-D 开发出这样非凡的背包设备,我感到非常高兴。”

穿戴装置
OAK-D 装置是一款强大的多功能人工智能设备,采用英特尔 MOVidiUS VPU 和 OpenVINO 工具包进行边缘人工智能推理。它能够运行先进的神经网络,提供加速的计算机视觉功能和实时深度图像,同时具备 4K 摄像头的颜色信息。
用户可以通过蓝牙耳机发出语音指令,系统也会以语音回应。在用户移动时,系统会通过语音帮助识别常见障碍物,如信号灯、树枝及行人,并提醒前方的交叉路口、路缘、楼梯和入口等信息。
