数字语音录音包含有价值的信息,可以指示个体的认知健康,提供了一种非侵入性和高效的评估方法。研究表明,数字语音测量可以通过分析语音速率、清晰度、音调变化和停顿等特征来检测认知衰退的早期迹象,当这些特征偏离规范模式时,可能表明认知障碍。然而,语音数据引入了隐私挑战,因为录音中嵌入了可识别个人身份的信息,如性别、口音和情感状态,以及可能独特识别个体的更微妙的语音特征。当语音数据被自动化系统处理时,这些风险会加剧,引发了关于再识别和潜在数据滥用的担忧。
在一项新的研究中,波士顿大学Chobanian & Avedisian医学院的研究人员提出了一个计算框架,该框架应用音调变换(一种声音录制技术,可以提升或降低声音音调)以保护说话者身份,同时保留对认知评估至关重要的声学特征。“通过利用音调变换等技术作为语音混淆的手段,我们展示了在保留声学特征的诊断价值的同时减轻隐私风险的能力,”通讯作者Vijaya B. Kolachalama博士(FAHA)解释道,她是医学副教授。
研究人员使用来自Framingham心脏研究(FHS)和Delaware痴呆银行(DBD)的数据,在不同级别应用音调变换,并结合其他变换,例如时间尺度修改和噪声添加,以改变响应神经心理测试的语音特征。接着,他们通过等错误率评估说话者混淆,并通过区分认知状态(正常认知(NC)、轻度认知障碍(MCI)和痴呆(DE))的机器学习模型的分类准确性来评估诊断效用。
使用混淆语音文件,计算框架能够在FHS数据集中准确区分NC、MCI和DE,准确率为62%,在DBD数据集中准确率为63%。
研究人员表示,这项工作有助于在医学分析中道德和实用地整合语音数据,强调在维护认知健康评估的完整性时保护患者隐私的重要性。“这些发现为未来在临床和研究环境中开发标准化的以隐私为中心的语音评估指南铺平了道路,”Kolachalama补充道,她还是计算机科学副教授、哈里里计算研究所的附属教师以及波士顿大学计算与数据科学系的创始成员。
这些发现已在线发布在《阿尔茨海默病与痴呆:阿尔茨海默协会期刊》上。
该项目得到了国家老龄化研究所人工智能与技术协作中心(P30-AG073104和P30-AG073105)、美国心脏协会(20SFRN35460031)、盖茨风险投资和国家卫生研究院(R01-HL159620、R01-AG062109和R01-AG083735)的资助支持。