动动嘴皮子搞定工作？这款AI语音工具获420万美元押注

智享AI

封面图

只需动嘴就能完成文档撰写、邮件回复，甚至操作专业软件——人工智能语音平台Willow Voice近日完成420万美元天使轮融资，由Y Combinator等机构领投。这款正在重塑办公场景的工具，试图让语音取代键盘成为效率新引擎。
藏在语音里的技术革命
Willow Voice的核心突破在于将日常对话实时转化为规范文本。当用户对着麦克风说话时，AI引擎同步完成三重任务：精准识别医疗、编程等专业术语；自动修正语法错误并删除口语赘词；还能根据上下文智能调整文本格式。整个过程在本地设备端到端加密运行，确保会议记录、客户信息等敏感数据永不外泄。
效率提升四倍的秘密
GitHub工程师通过实测发现，在编写技术文档时，语音输入比键盘操作快三倍；Canva设计团队用其口述设计需求，指令传达时间缩短70%。更关键的是，当配合Cursor等编程助手使用时，工程师只需口述思路，系统就能自动生成代码框架，实现"动口不动手"的开发模式。
剑指操作系统级的野心
现有420万美元融资将用于攻克两大瓶颈：首先是打破平台限制，从macOS向Windows、移动端扩展；其次是构建底层语音操作系统，让用户在不同应用间无缝切换时，AI仍能持续理解上下文。这恰是当前Siri、Alexa等语音助手的致命短板——一旦切换应用，对话记忆立即清零。
语音交互的临界点已至
业内人士指出三大趋势正推动变革：企业级隐私保护成为刚需，医疗法律等敏感行业尤其如此；远程协作催生免提操作场景；更重要的是GPT类模型大幅提升了语境理解能力。目前Willow Voice已在macOS开放公测，未来将推出分级订阅服务。
当Zoom会议记录能自动生成会议纪要，编程时口述需求即可输出代码框架——语音交互正从手机助手进阶为生产力工具。随着融资到位，Willow Voice的下一步可能重新定义"动手工作"的真正含义：或许未来职场人的核心技能，将是把想法说清楚的能力。