在日常生活场景,AI细分技术领域应用速度不断加快,在推动能源、交通、建筑、医疗等行业转型升级过程中起到的作用日益突显;在疫情防控工作中,AI技术应用可以准确掌握疫情发展动态,对疫情的影响进行预演判断。
值得注意的是,在应用过程中,AI技术的不足之处、软硬件之间融合应用存在裂缝等问题也随之暴露。由滥用AI技术所引发的个人隐私数据泄露等问题,也引发了业界的担忧。
近日,《每日经济新闻》记者(以下简称“NBD”)专访AI独角兽企业第四范式主任科学家涂威威,其谈及了AI数据保护等问题。涂威威表示,AI的发展和监管处于动态博弈的状态,无论是治理和数据保护都是为了更好的发展。能够平衡两者关系,制定AI治理规则及数据保护的法律,才能更好引领AI行业的发展,掌握竞争主动权。
数据质量决定AI价值隐私保护成本仍存挑战
NBD:数据对AI技术的重要性何在?
涂威威:AI三要素是数据、算法、算力。对于任何企业,打牢数据基础都非常关键。AI真正核心是从数据中发掘更多业务规律和价值。在算法、算力的支持下,数据的数量、质量决定AI价值。
NBD:目前,AI企业在数据安全建设方面面临什么问题?
涂威威:对于多数大众以及企业而言,数据隐私保护是复杂又庞大的工程。技术层面面临两方面的挑战:在效果方面,需要让数据安全、用户隐私得到相同保护强度,并且提出更有效的算法,解决应用场景问题;在成本方面,机器学习、隐私保护技术复杂程度高,技术环节仍需要较多专家介入到数据预处理、特征工程、模型调参当中,这也加大了人工接触数据的机会,理论上增加泄露隐私风险。
NBD:在保护数据安全方面,有哪些探索路径?
涂威威:为了更好的实现数据保护,我认为企业需要从技术、标准两方面发力。在技术层面,我们在隐私技术方面的工作主要为差分隐私、隐私保护的迁移学习技术等。
此外,我们研究出自动多方机器学习技术。让机器自动完成数据预处理、特征工程、模型调参等工作。大幅减少了专家人工的介入,提升安全性的同时,也大幅降低了隐私保护技术的使用门槛,并与多方机构开展了深度合作。不过,以差分隐私技术为代表的隐私保护技术与自动机器学习相结合还需要解决很多问题。例如,如何在保护隐私的同时保证自动机器学习的效果与效率、如何有效自动分配隐私预算等。
在标准方面,我们此前通过GDPR认证。也希望在数据隐私保护方面探索更多国际交流、合作空间。
线上数据持续攀升数据保护要求更高
NBD:疫情期间,AI技术发挥出哪些作用?
涂威威:在疫情防控工作中,关键在于及时发现高风险人群与超级传染者,准确掌握疫情发展动态并就不同政策对疫情的影响进行预演判断,以及更快速地追溯到病毒的传播路径,提高政府部门的防控效率。
之前,我们联合高校研究所、医疗机构临床专家,研发出基于AI的智能疫情防控方案投入应用。主要包含三部分:一是利用AI技术丰富现有的防控筛查规则模型,精准筛查高风险易感人群,进行精准防控;二是构建了更接近实际情况的可学习的省、市、区、县级数字孪生系统,实时预演分析疫情发展,做出拐点的预测;三是利用AI技术构建疫情溯源系统,快速追溯传染路径。
NBD:疫情下,AI应用场景有哪些新突破?
涂威威:疫情带来最大的变化就是企业在线化程度加深。在线化不是简单把货品从线下搬到线上,而是对经营行为进行数字化行为、智能化服务。需要通过智能推荐、智能搜索、智能推送、智能客服等AI技术引擎,帮助企业多快好省地实现线上化智能运营,解决流量暴涨带来的消费者体验和资源调配优化等问题,开辟线上化发展新局面。
NBD:这给企业带来了哪些新思考?
涂威威:这次疫情中,我们服务的大型零售企业都在思考两方面的内容:一是解决突然增长的线上订单压力;二是思考怎样把在线客户转为私域流量。
为了帮助企业应对突然爆发的在线需求,AI企业也需要提供线上化、智能化的精细化运营能力,帮助零售、金融、制造等传统行业拥抱数字化革新、把握线上发展新机遇。未来,线上用户、商品服务组合、用户线上积累数据会不断攀升。同时,也意味着对用户隐私保护的技术提出了更高的要求。
数据保护制定权或成未来竞争方向
NBD:业界认为,AI治理规则及数据保护制定权至关重要,您怎样看待?
涂威威:数据应用隐私问题一直备受关注。2018年,“史上最严个人数据保护法”欧盟GDPR强制执行。2019年初,谷歌因违反GDPR条例被法国数据保护监管机构处以5000万欧元罚款。
GDPR之后,各个国家、地区重点加大了隐私保护关注力度,并通过立法等方式进行有效干预。2020年1月,加州消费者隐私法案(CCPA)生效。3月6日,国内《个人信息安全规范》正式发布,在现有《网络安全法》的基础上,积极推动《数据安全法》、《个人信息保护法》等,进一步加强隐私保护的力度。
因而,数据是AI的基石,保护隐私是AI落地的必要条件,AI治理规则、数据保护的制定权将成为未来竞争的方向。
NBD:此前有APP收集人脸信息,如何面对数据带来的伦理道德挑战?
涂威威:对于企业来说,直接收集数据是成本最低,效率最高的方式。例如,互联网金融行业,企业通过买第三方数据判定信用等级,成本极其低。但这种方式存在侵权风险。
除了提高数据隐私保护意识和技术解决能力之外,目前,国家不断完善数据隐私保护层面的法律法规制定。相关行业标准也在制定中,其中包括了操作流程及规范、人员管理、技术选型等方面。
NBD:对于行业未来的发展,您还有何建议?
涂威威:AI的本质在于能更有效、更精细化地挖掘数据的价值,而挖掘数据的同时,伴随着泄露隐私的风险。然而,以往常用的加密及普通的匿名化手段并不能完全保证数据安全,攻击者还可以对分析结果的差分攻击以及查表撞库等方法反推原数据。
隐私保护这场风暴仍在席卷全球科技行业,国际及国内在数据合规方面的整体意识不断增强。AI企业在隐私保护和数据安全这条道路上并没有什么捷径可走,AI企业必须静下心来做好产品和技术本身。