互联网资讯 / 人工智能 · 2023年12月9日 0

AI让智能手机通过声音生成3D图像

英国的科学家们发现了一种新方法,使得智能手机和笔记本电脑等常见设备具备类似蝙蝠的环境感知能力,堪比超胆侠的技能。

格拉斯哥大学的计算机科学家和物理学家在《物理评论快报》上发布的研究论文中介绍了这一成果,显示其在安全和医疗保健领域的潜在应用。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

该技术基于一种复杂的机器学习算法,利用声波的反射来生成图像,类似于蝙蝠使用回声定位进行导航和捕猎的方式。

研究团队提出的算法能够测量扬声器或小型天线发出的声音或无线电波脉冲在室内传播并返回传感器所需的时间。

通过对这些数据的巧妙分析,算法能够推断出房间的形状、大小及布局,并识别出其中存在的物体或人员。

最终结果以视频形式呈现,将回声数据转换为三维视觉效果。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

与蝙蝠的回声定位不同的是,这项技术的算法经过调整,使其能够与来自单一来源的数据共同工作,例如麦克风或无线电天线。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

研究人员指出,“这一技术能够通过任何配备有麦克风和扬声器或无线电天线的设备生成图像。”

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

TuRpin博士提到,动物的回声定位能力非常出色,科学界已经成功开发出多种技术以重现从反射声中生成三维图像的能力,如雷达和激光雷达(LiDAR)。

该研究的独特之处在于:

首先,它仅需来自单一输入的麦克风或天线的数据即可创建三维图像。

其次,任何配备有这两种设备之一的设备都能够转变为回声定位装置。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

这意味着三维成像的成本可以显著降低,从而开启许多新应用的可能性。

例如,通过接收入侵者反射的信号,可以在没有摄像头的情况下确保建筑物的安全。

同样的方法也适用于追踪养老院中虚弱病人的活动。

甚至可以用于监测医疗机构中病人胸部的起伏,以提醒工作人员关注其呼吸变化。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

论文中详细介绍了研究人员如何利用笔记本电脑的扬声器和麦克风产生并接收千赫兹范围内的声波。

他们同样对千兆赫兹范围的无线电频率声波进行了类似的实验。

在每次实验中,研究团队收集了一个人在房间内走动时声波的反射数据。

同时,他们还使用一台特殊相机记录房间数据,该相机通过一种称为飞行时间的过程来测量房间的尺寸并提供低分辨率图像。

超胆侠来了!「蝙蝠感知」AI让智能手机听声生成3D图像

结合来自麦克风的回声数据和飞行时间相机的图像数据,研究小组在多次实验中训练他们的机器学习算法,将回声中的特定延迟与图像关联起来。

最终,该算法能够仅凭回声数据生成高度准确的房间及其内容的图像,展现出蝙蝠式的环境感知能力。

这项研究建立在该团队之前工作的基础上,训练了一种神经网络算法,通过使用单像素探测器测量光线的反射来构建三维图像。

TuRpin博士补充道,“我们现在能够利用光和声音证明这种算法的有效性,这非常令人振奋。显然,这里蕴含着以新方式感知世界的巨大潜力,我们期待继续探索生成更高分辨率图像的可能性。”