螳螂在昆虫中脱颖而出,因其复眼和独特的三维视觉能力。工程师们现在正在尝试模仿这一视觉系统,以增强机器视觉。
自动驾驶汽车有时会因为其视觉系统难以以三维方式解读静止或缓慢移动的物体而无法正确导航。这一限制类似于单眼视觉的昆虫,尽管它们的复眼在追踪运动和提供宽阔视野方面表现出色,但在深度感知能力方面有限。
但螳螂则有所不同。
螳螂的眼睛具有重叠的视场,使其具备双眼视觉和真实的三维深度感知能力。
弗吉尼亚大学工程与应用科学学院的研究人员利用这一独特特性,集成了先进的光电工程和创新的“边缘”计算——在数据采集地点附近处理数据——来创建人工复眼。这项技术旨在解决妨碍机器准确解读现实世界视觉数据的现有挑战,如精确度问题、数据处理延迟和高计算需求。
“我们对螳螂眼睛功能的调查使我们意识到,一个生物仿生系统需要开发新技术来模拟它们的生物优势,”电气与计算机工程查尔斯·L·布朗系的博士生白亨俊表示。
关于这些仿生眼
研究团队设计了“眼睛”,模仿螳螂的自然设计,使用微透镜结合多个光电二极管,当它们遇到光时会产生电信号。他们使用柔性半导体材料创建这些组件,以复制螳螂眼睛的曲面形状和分面排列。
“在确保有效性能的同时以半球形状创建传感器是一项前沿成就,确保了广阔的视野和增强的深度感知,”白亨俊解释道。
“该系统提供实时的准确空间感知,这对需要与变化环境互动的技术至关重要。”
可能的应用包括低能耗车辆和无人机、自动驾驶汽车、机器人制造、监控、安全解决方案和智能家居技术。
白亨俊在材料科学与工程领域具有专业知识的副教授李奎相的指导下,是最近在《科学机器人》上发表的论文的主要作者。
该团队在原型中的一个重要成果是与传统视觉系统相比,潜在的功耗降低超过400倍。
边缘计算的优势
李的系统不依赖于云计算,而是高效地实时处理视觉数据,大大减少了与数据传输和外部计算相关的时间和资源消耗,从而降低能耗。
“这项研究的创新突破体现在柔性半导体材料、保持精确角度的设备、传感器内存元素和独特的后处理算法的结合上,”白亨俊说道。
传感器阵列不断跟踪周围环境的变化,识别像素的移动,并将这一数据转化为更小的数据集进行处理。
这种方法反映了昆虫通过视觉信号解读环境的方式,区分动态像素以理解运动和空间信息。例如,像许多昆虫和人类一样,螳螂利用运动视差的原理,使得近处的物体看起来比远处的物体移动得更快。虽然一只眼睛可以创建这种效果,但单靠运动视差并不能提供准确的深度感知。
螳螂眼睛的非凡之处在于它们使用立体视觉——用双眼看来判断深度——以及它们的半球形复眼结构和运动视差来导航世界。
“这些先进材料和算法的有效结合实现了实时、高效和精确的三维空间感知,”李强调,作为薄膜半导体和智能传感器的新兴研究人员。
“我们团队的研究提供了重要见解,可能会通过呈现一种创新的生物仿生方法来解决复杂的视觉处理问题,从而鼓励工程师和科学家,”他补充说。
这项研究得到了国家科学基金会和美国空军科学研究办公室的资助。