一个研究团队开发了一种人工智能驱动的环,配备了微声纳技术,可以实时持续跟踪美国手语(ASL)中的手指拼写。
由康奈尔大学领导的研究团队开发了一种人工智能驱动的环,配备了微声纳技术,可以实时持续跟踪美国手语(ASL)中的手指拼写。
在目前的形式下,SpellRing可以通过手指拼写输入文本到计算机或智能手机中,手指拼写在美国手语中用于拼写无对应手势的单词,如专有名词、名字和术语。经过进一步开发,该设备——被认为是同类产品中的首个——有望通过持续追踪整个手势的单词和句子来彻底改变美国手语翻译。
信息科学博士生林炫哲(Hyunchul Lim)表示:“许多其他识别美国手语手指拼写的技术没有被聋人和听力损失者社区采用,因为硬件笨重且不实用。我们希望开发一个单一的环来捕捉美国手语中所有微妙而复杂的手指动作。”
林是《SpellRing:使用环识别美国手语中的连续手指拼写》(”SpellRing: Recognizing Continuous Fingerspelling in American Sign Language using a Ring”)的主要作者,该论文将于4月26日至5月1日在日本横滨举行的计算机协会人机交互系统(CHI)会议上发布。
SpellRing佩戴在拇指上,配备有麦克风和扬声器。它们一起发送和接收不可听见的声波,以追踪佩戴者的手和手指动作,同时微型陀螺仪跟踪手的运动。
然后,一个专有的深度学习算法处理声纳图像,并实时预测与许多需要更多硬件的现有系统相似的准确度的美国手语手指拼写字母。
开发人员对SpellRing进行了评估,测试了20名经验丰富和新手的美国手语签署者,让他们自然地连续手指拼写了超过20,000个不同长度的单词。SpellRing的准确率在82%到92%之间,具体取决于单词的困难程度。
信息科学助理教授、论文合著者张诚(Cheng Zhang)表示:“开发工具的技术社区与使用工具的目标社区之间总是存在差距。我们弥补了一部分gap。我们为评估它的目标用户设计了SpellRing。”
林未来的工作将包括将微声纳系统集成到眼镜中,以捕捉上半身运动和面部表情,从而实现更全面的美国手语翻译系统。
林说:“聋人和听力损失者在手语中使用的不仅仅是他们的手。他们还使用面部表情、上半身运动和头部手势。”林在康奈尔大学完成了基础和中级的美国手语课程,作为他SpellRing研究的一部分。“美国手语是一种非常复杂的视觉语言。”
本研究得到了国家科学基金会的资助。