蚂蚁数科提出隐私保护AI新算法,可将推理效率提升超过100倍

近日,全球安全顶级会议ACM CCS以及顶刊IEEE TDSC发布获选论文名单,蚂蚁数科的两项隐私计算创新技术成果入选,标志着蚂蚁数科在隐私保护人工智能(Privacy-Preserving AI)技术领域的持续领先。这两项研究聚焦当前跨机构联合建模中应用最广泛的梯度提升决策树(GBDT)模型,通过创新的隐私保护算法,解决了联合建模和联合推理中如何在保障数据隐私前提下实现高性能计算的技术难题。

这两研究成果分别是被ACM CCS2025收录的《Gibbon: Faster Secure Two-party Training of Gradient Boosting Decision Tree》(长臂猿:更快的2方安全GBDT训练框架)与被IEEE TDSC录用的《Privacy-preserving Decision Graph Inference from Homomorphic Lookup Table》(基于同态查找表的隐私保护决策图推理)

GBDT类模型(包括XGBoost、LightGBM等)是一种基于梯度提升的决策树算法,可解释性强,预测速度快,广泛应用于营销、风控等场景,是跨机构联合建模中最流行最常用的算法。然而,在多方协作训练与推理过程中,如何在保障数据隐私的前提下实现高性能计算,长期面临“安全强则效率低,效率高则隐患多”的两难困境。

当前业界多采用联邦学习(FL)路线,虽性能较高,但存在潜在的信息泄露风险。例如,隐私计算联盟于2024年发布的《隐私计算产品通用安全分级白皮书》中就分析、披露了业内最流行的FL方案SecureBoost的信息泄露风险。

蚂蚁数科则另辟蹊径,选择安全等级更高但性能挑战更大的多方安全计算(MPC)技术路线,通过GBDT算法与先进密码学的深度协同设计,实现了安全与效率的双重突破:

在训练方面:提出新型安全两方GBDT训练框架Gibbon,相比当前最先进的MPC方案“Squirrel”(USENIX Security 2023),可将训练速度提升2~4倍,性能甚至优于联邦学习路线SecureBoost的开源实现。

在推理方面:创新性地提出同态查找表技术,实现隐私保护决策图推理,支持GBDT、决策树、评分卡等模型。其中,GBDT和决策树的推理效率提升2~3个数量级。

目前,上述研究成果已应用于蚂蚁数科隐私计算系列产品中,全面支持跨机构间高安全、高性能、可落地的数据协作。

蚂蚁数科已构建覆盖多场景的隐私计算产品矩阵:包括面向数据基础设施的可信数据流通平台FAIR;服务于金融与营销场景的隐私计算解决方案摩斯(Morse);以轻量化中间件形式为AI、BI及业务系统提供嵌入式隐私计算能力的密态中间件;以及为大语言模型应用提供全方位的数据和模型隐私保护的大模型隐私保护产品。

ACM CCS是国际公认的信息安全领域旗舰会议,被中国计算机学会(CCF)列为CCF-A类会议。IEEE TDSC是由IEEE Computer Society出版的权威学术期刊,聚焦可信计算、安全计算等研究领域,也是中国计算机学会A类期刊,代表该领域的最高学术水平。

点赞

发表评论

邮箱地址不会被公开。 必填项已用*标注