安全开采数据“富矿”:隐私计算基建的融合与进击


    信息的传递是人类文明的基础。从古人的结绳记事开始,到以文字作为载体,如今的数字时代,数据与我们的生产、生活深度交融。对数据的充分挖掘与分析,也让科技与产业走向了应用的深处,改变了我们的生产、生活与消费。
    数据的流通价值有目共睹,拿大部分人都使用过的健康码来说,其融合了大数据行程、防疫与接种的信息,是我们疫情出行的保障。而这些数据的共享对抗疫作用显著。“健康码”、“行程码”的背后是全国范围内的大数据支撑。公共健康数据的互联互通,不仅仅只是局限在疫情中发挥效用,在未来公共卫生紧急情况下,数据可以帮助政府更好的分析预测,让政府作出更加科学的决策以保障民众的健康与安全。
    在医疗领域,数据安全的共享是 “两难又两全”问题,隐私数据备受关注,容易引起多方对隐私数据的监视。不过这也恰恰给了隐私计算施展的舞台与天地。在隐私信息泄露严重,但数据处理与分析的势头渐猛的矛盾中,数据的推动使用,价值与贡献,亟需隐私计算来化解流通中的难题。
    指数增长的生产力
    在数据激增的背景下,海量的数据背后屹立着千行百业,行业间的数据确权、竞争等情形,数据孤岛成为数据资产使用过程的最大障碍。不仅阻隔和闭塞了系统与场景的一些发展可能,对于信息的交流、整合、应用等都产生不同程度的影响。
    而隐私计算成为数据价值流动过程中的唯一技术解,隐私计算能够在不暴露原始数据的情况下,实现数据的融合使用。并且隐私计算技术可以实现,精准控制数据融合使用的目的和方式,即控制数据算什么、怎么算,让数据使用监管成为可能。
    隐私计算成为架起数据共享与安全的桥梁,可以让多个数据持有方的数据不仅能够正常连通协作,也可以保障数据不可见的隐秘性,完成数据的分析、计算、应用。
    举例来说,我们知道在医疗领域,沉淀了许多规模化、高质量的数据,AI技术在落地的过程中,可以依赖这些优质的数据训练出效果更好的模型。但在实际的落地应用中,因为数据的隐私、确权、孤岛等问题,数据间的打通和协作阻碍重重。AI在医疗领域中理论的优势并不能完全发挥。隐私计算可以很好地解决医疗领域的数据困境问题,让数据在不可见的情形下仍能相互连通共享创造价值。
    
    隐私计算数据价值特性使其在数据密集的行业如金融、医疗、通信运营商、政府等领域开始落地。这些领域本身就是数据价值的高地,数据的生产与运用处于各类产业的前端。同时,这些行业对于数据的规范要求较高,对于这些领域来说,数据有效利用可以放大其背后的潜能,价值巨大。
    拿金融领域来说,隐私计算主要应用于金融中的风控和营销方面。随着区块链技术的发展,隐私计算与区块链技术的结合,也可以赋能更多的金融场景,比如跨境支付、供应链金融等。在反洗钱业务中,此前由于对中小企业的经营数据掌握得不够完备,银行对中小企业的贷款非常谨慎,中小企业贷款难成为阻碍市场化发展一大恶疾,在隐私计算与区块链等技术的结合下,银行可以更好地收集到相关信息与同业机构交换参数、联合计算建模,解决了中小企业数据背调的问题。
    隐私计算即能实现数据对于金融、医疗等领域科技创新的“倍增作用”,又能充分保护数据隐私,使数据在流通和融合过程中可用不可见,数据的生产力得以被充分放大,价值也随之水涨船高。
    技术流派的融合
    据国家互联网信息办公室,中国数字经济规模已达31万亿元,约占GDP三分之一。IDC数据表明,2025年全球数据量将达到175ZB,并保持指数级增长趋势。数据海量增长的背景下,数据的规范合规政策也在不断跟进。
    《数据安全法》与《个人信息保护法》在去年十月左右开始陆续实施,隐私计算也成为数据安全合规应用的技术保障,成为备受期待的最优解,被资本与企业追捧。据毕马威发布的隐私计算报告预测,未来三年,隐私计算的营收服务费用可达200亿左右,而数据平台可以撬动的运营收入可达千亿级别。
    在政策和市场驱动的背景下,互联网巨头、网络安全、大数据公司等初创科技企业纷纷入局,在数据价值应用的蓝海中抢占先机。大部分企业的入场时间在2018年前后,技术流派也以多方安全计算、联邦学习、可信执行环境这三种流派为主。在实际落地商用的过程中,单一路径技术的模式逐渐无法满足市场需求,三种技术路径的融合成为现下的主要趋势。目前在隐私计算赛道中,抢占赛道先位的有蚂蚁金服、华控清交、翼方健数、数牍科技、冲量在线等。
    这些企业也多以金融、医疗为主要应用场景领域,金融与医疗领域是数据密集型产业,且数据蕴含的价值高,行业数据敏感,隐私计算的特性与其天生契合。金融与医疗的应用场景也不断有隐私计算落地开花结果的案例。
    例如金融领域中隐私计算在银行的应用方面,可适用于联合营销、联合风控、统一授信、业务合规等,如在不暴露客户资产的情况下银行可以进行联合统计,开展客户综合管理、查询数据或提升精准营销能力等。政府方面的落地,在江浙的部分城市目前已经通过隐私计算技术,实现了政务数据和银行金融数据之间的共享,并把这些数据积极应用于反诈工作中。
    
    隐私安全计算的产品与解决方案在市场与资本中获得了强烈的反响,2021年更是被称之为“隐私计算元年”。这其中有政策利好,如数据资源正成为与人力资源、自然资源同样重要的第三类资源。数据也跟土地、劳动力、技术、资本等一样被当作生产要素写进了国家文件中。数据的应用在行业和社会层面都意义重大。
    不过,在隐私计算不断落地的过程中,市场中也有另外的声音质疑:隐私计算可以保证数据的安全,那么谁来界定隐私计算系统的安全?
    数据安全保护涉及的技术种类多、门槛高,各种专业术语让人晕头转向,而且因为数据不可感,只能单方面通过企业介绍来了解。这个最核心的疑虑答案,数据服务方们的共同选择是交给市场来共建行业的标准。制定隐私计算的安全标准考虑的点包含算法安全、密码安全、产品安全等多重安全风险点,互联互通的系列标准、行业场景标准及测试体系等都开始逐渐讨论与展开,隐私计算的各产业联盟共同推进技术规范与应用的落地,使其健康有序发展。
    有限的天花板or广阔的天地?
    数据价值在分析与计算后折射的势能是不可估量的,对大数据应用或人工智能企业来说,合理边界和方式使用用户数据,已成为从企业与产业的核心驱动力之一。隐私计算市场在这个态势下的起步中,有流畅的市场、政策快车道加速,也有一些路障需要跨越。
    1.市场需求的表达不充分。对于金融、通信、政府等领域因为近些年互联网行业的数字化技术洗礼,接受与教育的成本低,而在工业、交通、能源等传统数据大户领域中,数字化的程度有限,推进隐私计算市场教育的成本与时间较久,市场的需求反馈准确表达有限。
    2.一些行业数据的管理标准混乱,数据的开放存在障碍。例如在医疗领域中,数字化的水平参差不齐,数据的管理缺乏统一的标准,而数据的打通需要多方的协作,闭源的数据平台较多,数据方的打通协同执行程度有限。
    3.隐私计算产品的标准化程度低,通用性差。隐私计算中的产品与解决方案多以定制化为主,这也意味着周期与成本的高企,规模的发展难以铺开。
    在隐私计算的基建阶段,一切都在探索和尝试,需要解决的问题不少,距离设想的未来按数据交易量抽成的分润时代还较远,隐私计算和许多技术含量高的to b平台一样,是一个需要常耕深入的技术,需要玩家们做好长跑的准备,行业较为统一的共识是完全的规模化应用还得十年的时间,元年的基建时代,安心打磨技艺即可。
    
    对于隐私计算的未来,市场上也有另外的声音,因为隐私计算赛道涉及敏感数据的交易、流通等,这类数据平台的建立未来会被监管列为重点关注的对象,政府或者国有企业会作为合规方来搭建,市场的隐私计算只能作为技术的供应商存在,作为生产要素的数据基础设施平台的建设,最终的控制权会被政府管制,预想的发展空间会不及理论设想,市场的天花板有限。
    无论是有限的天花板理论还是无限的天地,我们可以确认的是隐私计算的独特优势都会让数据的价值发生质变。而这也意味着数据时代,促进数据生态良性发展的隐私计算会是数据发展最佳的助推器,只要锚定数据的价值,护航其跃升的隐私计算就有广阔的发展天地。至于走得多远,行的多深,市场与时间会给出答案。