
得益于生成式人工智能的发展,耳机和耳塞等可穿戴设备开辟了新赛道。图片来源:物理学家组织网
在人类与科技亲密接触的漫长旅程中,耳朵,这个曾用于聆听风声雨声、低语浅笑的器官,正悄然成为人工智能(AI)进军现实世界的“战略要地”。
从美国拉斯维加斯国际消费电子展(CES)闪烁的聚光灯,到实验室里无声跳动的脑电波信号,一场关于“听觉革命”的浪潮正由一群AI初创公司掀起。他们押注的不是智能手机、智能眼镜,而是智能耳机。他们致力于让耳机华丽变身为一个集翻译、记录、控制,乃至“读脑”于一体的超级接口。
不再被动接收声音
10年前,美国韦弗利实验室和迈马努公司率先为耳机注入了“语言魔力”——实时翻译。戴上耳机,西班牙语瞬间化作英语,中文脱口而出变成法文。这一功能曾被视为科幻桥段,如今却已在课堂、会议室、机场落地生根。
谷歌紧随其后,在2020年推出语音激活的AI助手,让耳机朝着智能化的道路继续迈进。而苹果与三星则以降噪技术为盾牌,构筑起高端音频体验的护城河。然而,真正的变革并非来自巨头,而是一些并不拥有煊赫声名的初创企业。
OSO公司便是其中之一。他们的耳机不再只是被动接收声音,而是主动参与对话。它能录制会议、识别发言者、提取关键决策,并以自然语言生成摘要。
中国AI硬件公司“未来智能”推出的RecDot耳机,不仅支持多语言实时转录,还能跨平台运行。该公司首席执行官马啸透露,他们的设备兼容多款手机,能打破生态壁垒,让AI真正“人人可及”。
而时空壶公司的耳机则在教育领域发力。该公司美国销售主管布莱恩·谢克利夫表示,其90%的销售额来自学校。非英语母语的学生佩戴它上课,可实时理解授课内容。
从语音交互迈向神经感知
如果说语音交互是第一代智能耳机的起点,那么神经感知,便是它的未来。
加拿大初创公司Naqi Logix正试图让耳机“读懂你的脸”。其“神经耳机”看似普通耳塞,实则内嵌超灵敏生物传感器,能捕捉面部肌肉微弱的电信号,如眨眼、挑眉、抿嘴,甚至下巴轻绷,皆可转化为指令。
该公司产品总监扎维尔·亚历山大表示,他们制作这款耳机的初衷是帮助一位瘫痪的朋友重新玩游戏。如今,这款耳机已能让四肢瘫痪者仅凭面部动作控制电脑、浏览网页,甚至操控电动轮椅。运营经理桑德普·艾莉亚则看到了这款耳机更深层次的内核——人们希望能够以更隐秘、更微妙的方式与环境互动,而无须用智能手机呼叫Siri,用扬声器呼叫Alexa,或用眼镜呼叫Meta。
另一家美国公司Neurable走得更远。其MW75 Neuro LT头显虽非传统耳机,却代表了同一方向的终极愿景——用思维交流。通过监测大脑前额叶的电活动,这一设备能识别用户的意图。
便利与局限并存
尽管前景诱人,但智能耳机能否取代智能手机、智能眼镜,成为AI的主导终端?答案尚未揭晓。
支持者认为,耳机具备天然优势:便宜、普及、便携。美国科技研究机构Techsponential总裁艾维·格林加特表示,全球数十亿人已拥有耳机,升级AI功能的成本极低。相比之下,智能眼镜价格高、佩戴不便,且常被视为“怪异”。
更重要的是,耳机始终贴近人体,是理想的传感器载体。它能持续采集语音、心率、体温乃至脑电波,构建个人数字孪生体。未来,它或许能预判你的情绪波动,在焦虑时播放舒缓音乐;或在会议中察觉你未尽之言,自动予以补全。
然而,挑战同样严峻。首先,耳机的使用场景受限。人们不会24小时佩戴耳机,尤其在公共场合说话并不总是合适。其次,耳机交互方式单一,缺乏摄像头意味着用户无法识别手势、环境或视觉信息,限制了AI的理解维度。
此外,对隐私与数据安全的担忧也始终存在。若耳机能捕捉每一次眨眼、每一句低语、每一段脑电波,那么,谁在存储这些数据?是否会被滥用?一旦黑客入侵,岂不是连“思想”都暴露无遗?
每一次人机交互的革新,似乎都伴随着终端形态的重塑:键盘让人类输入文字,触摸屏让人们用指尖滑动世界,语音助手开启了“开口即得”的时代。而今,耳机正试图成为下一个载体——一个更私密、更安静、更无缝的入口。(记者 刘霞)




