
只需动嘴就能完成文档撰写、邮件回复,甚至操作专业软件——人工智能语音平台Willow Voice近日完成420万美元天使轮融资,由Y Combinator等机构领投。这款正在重塑办公场景的工具,试图让语音取代键盘成为效率新引擎。
藏在语音里的技术革命
Willow Voice的核心突破在于将日常对话实时转化为规范文本。当用户对着麦克风说话时,AI引擎同步完成三重任务:精准识别医疗、编程等专业术语;自动修正语法错误并删除口语赘词;还能根据上下文智能调整文本格式。整个过程在本地设备端到端加密运行,确保会议记录、客户信息等敏感数据永不外泄。
效率提升四倍的秘密
GitHub工程师通过实测发现,在编写技术文档时,语音输入比键盘操作快三倍;Canva设计团队用其口述设计需求,指令传达时间缩短70%。更关键的是,当配合Cursor等编程助手使用时,工程师只需口述思路,系统就能自动生成代码框架,实现"动口不动手"的开发模式。
剑指操作系统级的野心
现有420万美元融资将用于攻克两大瓶颈:首先是打破平台限制,从macOS向Windows、移动端扩展;其次是构建底层语音操作系统,让用户在不同应用间无缝切换时,AI仍能持续理解上下文。这恰是当前Siri、Alexa等语音助手的致命短板——一旦切换应用,对话记忆立即清零。
语音交互的临界点已至
业内人士指出三大趋势正推动变革:企业级隐私保护成为刚需,医疗法律等敏感行业尤其如此;远程协作催生免提操作场景;更重要的是GPT类模型大幅提升了语境理解能力。目前Willow Voice已在macOS开放公测,未来将推出分级订阅服务。
当Zoom会议记录能自动生成会议纪要,编程时口述需求即可输出代码框架——语音交互正从手机助手进阶为生产力工具。随着融资到位,Willow Voice的下一步可能重新定义"动手工作"的真正含义:或许未来职场人的核心技能,将是把想法说清楚的能力。