AI初创公司掀起“听觉革命”浪潮-新华网

得益于生成式人工智能的发展，耳机和耳塞等可穿戴设备开辟了新赛道。图片来源：物理学家组织网

在人类与科技亲密接触的漫长旅程中，耳朵，这个曾用于聆听风声雨声、低语浅笑的器官，正悄然成为人工智能（AI）进军现实世界的“战略要地”。

从美国拉斯维加斯国际消费电子展（CES）闪烁的聚光灯，到实验室里无声跳动的脑电波信号，一场关于“听觉革命”的浪潮正由一群AI初创公司掀起。他们押注的不是智能手机、智能眼镜，而是智能耳机。他们致力于让耳机华丽变身为一个集翻译、记录、控制，乃至“读脑”于一体的超级接口。

不再被动接收声音

10年前，美国韦弗利实验室和迈马努公司率先为耳机注入了“语言魔力”——实时翻译。戴上耳机，西班牙语瞬间化作英语，中文脱口而出变成法文。这一功能曾被视为科幻桥段，如今却已在课堂、会议室、机场落地生根。

谷歌紧随其后，在2020年推出语音激活的AI助手，让耳机朝着智能化的道路继续迈进。而苹果与三星则以降噪技术为盾牌，构筑起高端音频体验的护城河。然而，真正的变革并非来自巨头，而是一些并不拥有煊赫声名的初创企业。

OSO公司便是其中之一。他们的耳机不再只是被动接收声音，而是主动参与对话。它能录制会议、识别发言者、提取关键决策，并以自然语言生成摘要。

中国AI硬件公司“未来智能”推出的RecDot耳机，不仅支持多语言实时转录，还能跨平台运行。该公司首席执行官马啸透露，他们的设备兼容多款手机，能打破生态壁垒，让AI真正“人人可及”。

而时空壶公司的耳机则在教育领域发力。该公司美国销售主管布莱恩·谢克利夫表示，其90%的销售额来自学校。非英语母语的学生佩戴它上课，可实时理解授课内容。

从语音交互迈向神经感知

如果说语音交互是第一代智能耳机的起点，那么神经感知，便是它的未来。

加拿大初创公司Naqi Logix正试图让耳机“读懂你的脸”。其“神经耳机”看似普通耳塞，实则内嵌超灵敏生物传感器，能捕捉面部肌肉微弱的电信号，如眨眼、挑眉、抿嘴，甚至下巴轻绷，皆可转化为指令。

该公司产品总监扎维尔·亚历山大表示，他们制作这款耳机的初衷是帮助一位瘫痪的朋友重新玩游戏。如今，这款耳机已能让四肢瘫痪者仅凭面部动作控制电脑、浏览网页，甚至操控电动轮椅。运营经理桑德普·艾莉亚则看到了这款耳机更深层次的内核——人们希望能够以更隐秘、更微妙的方式与环境互动，而无须用智能手机呼叫Siri，用扬声器呼叫Alexa，或用眼镜呼叫Meta。

另一家美国公司Neurable走得更远。其MW75 Neuro LT头显虽非传统耳机，却代表了同一方向的终极愿景——用思维交流。通过监测大脑前额叶的电活动，这一设备能识别用户的意图。

便利与局限并存

尽管前景诱人，但智能耳机能否取代智能手机、智能眼镜，成为AI的主导终端？答案尚未揭晓。

支持者认为，耳机具备天然优势：便宜、普及、便携。美国科技研究机构Techsponential总裁艾维·格林加特表示，全球数十亿人已拥有耳机，升级AI功能的成本极低。相比之下，智能眼镜价格高、佩戴不便，且常被视为“怪异”。

更重要的是，耳机始终贴近人体，是理想的传感器载体。它能持续采集语音、心率、体温乃至脑电波，构建个人数字孪生体。未来，它或许能预判你的情绪波动，在焦虑时播放舒缓音乐；或在会议中察觉你未尽之言，自动予以补全。

然而，挑战同样严峻。首先，耳机的使用场景受限。人们不会24小时佩戴耳机，尤其在公共场合说话并不总是合适。其次，耳机交互方式单一，缺乏摄像头意味着用户无法识别手势、环境或视觉信息，限制了AI的理解维度。

此外，对隐私与数据安全的担忧也始终存在。若耳机能捕捉每一次眨眼、每一句低语、每一段脑电波，那么，谁在存储这些数据？是否会被滥用？一旦黑客入侵，岂不是连“思想”都暴露无遗？

每一次人机交互的革新，似乎都伴随着终端形态的重塑：键盘让人类输入文字，触摸屏让人们用指尖滑动世界，语音助手开启了“开口即得”的时代。而今，耳机正试图成为下一个载体——一个更私密、更安静、更无缝的入口。（记者刘霞）

【纠错】【责任编辑:郭晓婷】

深度观察

新华全媒头条丨奔跑的长三角文体融合、商旅联动在提速