
在数据爆炸的时代,如何让AI在保护用户隐私的前提下,高效地进行学习和分析,一直是科技界亟待解决的难题。近日,蚂蚁数科在这一领域交出了一份亮眼的答卷。他们推出的名为 Gibbon 的隐私保护AI训练框架,不仅在跨机构联合建模中有效化解了数据隐私和计算效率之间的尖锐矛盾,其创新性的技术成果还获得了全球信息安全顶级会议 ACM CCS 和 IEEE TDSC 的认可,足见其前沿性和实用价值。
过去,机构之间在进行联合建模时,往往面临一个两难的境地:要么为了保护数据隐私而牺牲计算效率,导致模型训练缓慢;要么为了追求速度而放松隐私保护,埋下安全隐患。Gibbon 框架的出现,为这个问题提供了巧妙的解决方案。它采用了一种创新的“安全两方训练”机制,专门针对梯度提升决策树(GBDT)这类模型。简单来说,就是让两个参与方在不暴露各自原始数据的情况下,共同完成模型的训练。更令人惊喜的是,这种方法不仅保障了隐私,还将 GBDT 模型的训练速度提升了2到4倍。相较于当前一些主流的多方安全计算技术,Gibbon 在安全性和效率上都表现出了明显的优势。
这还没完。在AI模型“推理”——也就是模型完成训练后,进行实际预测和应用——的阶段,蚂蚁数科同样带来了惊喜。他们开发了一种基于同态查找表的隐私保护决策图推理技术。这项技术能够让 GBDT、决策树等模型在数据隐私得到严格保护的前提下,进行推理计算。而其带来的效率提升更是惊人,速度相比传统方法快了2到3个数量级。这意味着,即使在高度敏感的数据场景下,AI也能以极高的效率完成任务,例如在金融风控、精准营销等领域,为企业提供安全、高效的解决方案。
值得一提的是,蚂蚁数科并非“单打独斗”,他们已经构建了一个相当成熟的隐私计算产品矩阵。除了 Gibbon 框架,还有能够实现可信数据流通的 FAIR 平台,以及提供全面隐私计算解决方案的摩斯(Morse)等。这些产品共同构筑了一个强大的生态系统,为各行各业在数据协作和应用时,提供了全方位的技术保障和支持。
可以说,蚂蚁数科的这一系列创新,不仅是AI技术发展的重要一步,更是对未来数据安全与合规应用的一次有力探索。随着数据隐私保护的呼声越来越高,以及AI技术的深度融合,像 Gibbon 这样能够平衡隐私与效率的解决方案,必将成为推动行业发展的关键力量。未来,我们有理由期待,蚂蚁数科将在隐私计算领域继续扮演引领者的角色,为构建一个更安全、更智能的数字世界贡献力量。