CNCC2023中国计算机大会将于10月26至28日在辽宁省沈阳市举办,会议形式包括大会特邀报告、大会论坛、技术论坛、特色活动及展览。本次技术论坛将有700余位在人工智能、安全、计算+、软件工程、教育、网络、芯片、云计算等30个热门专业领域的国际知名学者、两院院士、产学研各界代表在内的报告嘉宾,着力探讨计算技术与未来宏观发展趋势,为参会者提供深度的学术和产业交流机会。
近年来,我国计算机技术发展水平不断提升,人工智能作为引领新一轮科技革命的重要驱动力,正影响着人们的生产、生活、学习方式。与此同时,人工智能技术也帮助残障人士生活质量得到极大提高。AI+辅具聚焦技术是什么?言语障碍患者的语音数据库目前进展如何?......围绕相关问题,CCF杰出会员、中国科学院副研究员王甦菁接受了新华网专访。
新华网:作为“AI + 辅具:语音,一座沟通的美好桥梁”论坛主席,能否介绍一下什么是辅具?为什么提出AI+辅具这个概念?
近几年,我一直关注AI+辅具,研究人工智能如何与残障人士需求相结合,本次论坛其实是CNCC2020“AI + 辅具”技术论坛的延续。
王甦菁:辅具是指能够有效地防止、补偿、减轻、或替代因残疾造成的身体功能减弱或丧失的产品、器械、设备或技术系统。例如:轮椅、助听器,甚至包括佩戴的眼镜。我因为自身原因,深知残障人士需求,特别是硬性需求。现阶段,可以说是进入智能时代,包括汽车辅助驾驶的路线规划、避障等技术,如果可以运用到残障人士的辅具上,电动轮椅装上传感器就能避障。残障人士、或者犹如老年群体等反应速度相对较慢的人群,以及行动不便的人群更需要这些技术。近几年,我一直关注AI+辅具,研究人工智能如何与残障人士需求相结合,本次论坛其实也是CNCC2020“AI + 辅具”技术论坛的延续。
新华网:此次论坛聚焦的技术是什么?重点探讨的内容有哪些?
沟通是不可缺少的,残障人士如果沟融不便就无法真正融入社会。
王甦菁:此次技术论坛我们主要聚焦语音,沟通是不可缺少的步骤,也是残障人士真正融入到社会的途径之一。今年把论坛主题设置为“AI + 辅具:语音,一座沟通的美好桥梁”,这里提到的沟通不仅是人与人之间的沟融,也是人与机器的沟通。回顾语音识别技术发展史,因为只采集普通话建设大模型,最早语音辅具只能识别普通话。后经需求推动,大模型逐步开始采集方言进行建设,因此识别方言的功能便被开发出来。基于以上情况,我认为,如果将残障人士的说话模式以及语音语调可以作为小样本数据,并在大模型上微调,就可以得到一个可以供残障人士使用的定制智能语音数据库。因此也是希望借助此次CNCC2023大会论坛,以语音为切入点,深入探讨如何通过声学、计算机视觉等多种方法,解决残障人士在人际沟通和人机交互方面问题,实现残障人士无障碍沟通。
新华网:本次论坛上首次发布全新的言语障碍患者的语音数据库,在建立中遇到了哪些困难?目前语音数据库取得哪些进展?
主要困难是采集的时间较为紧张,语言障碍样本比较难找。目前语音数据库已采集言语障碍残障人士样本20多个,后续我们团队将继续采集。
王甦菁:目前我们团队正在做语音数据库的样本收集,主要困难一是,采集的时间较为紧张。从萌生在此次大会上发布言语障碍患者的语音数据库的初步构想,到目前进入数据库样本采集阶段,操作周期仅2个多月。原计划在发布时应该采集100个语音障碍样本,截至目前已采集20多个样本。因为采集语言障碍样本的过程与以往语音库采集较为不同,我们需要针对语言障碍样本进行1小时的采集,采集后由团队成员对其进行标注,由于每个人语言障碍程度不同,所以1小时的语言障碍语音样本标注耗时往往会是正常语音3.5-4倍,甚至更长,这是个很艰苦的过程。其次,语言障碍样本比较难找。部分样本会存在心理上的顾虑,不愿意被采集。借助这次论坛将数据库发布,希望让计算机领域专家知道这个“特殊”数据库存在,通过计算机专家来建设数据模型。所以这次论坛还有个隐形的意义,就是在残障人士和计算机专家以及开发者之间架起一座桥梁。如果有相关专家对语音数据库问题感兴趣,我们将提供样本数据支持,使专家能够更精准获言语障碍患者的痛点,更好建立语音数据库模型。
新华网:您认为CCF举办CNCC大会有怎样的现实意义?同时对正在科研道路上或者希望走上科研道路的残障人士有何寄语?
CCF为残障人士科研工作者提供良好平台,希望更多的从事科研工作的残障人士走到台前展示自己。
王甦菁:特别感谢CCF能够为残障人士以及科研工作者提供交流平台。只要是CCF会员,有好的想法都可以申请在中国计算机大会举办相关主题分论坛,我想这也是为什么大会影响力大的原因,CCF不仅在学术上承担自己的责任,而且在公益方面也做了许多好事,例如大会上有公益研究的分论坛,看到了人文关怀,让科技有温度。作为CCF会员,我希望更多从事科研工作的残障人士可以走到台前展示自己。

