当前位置:首页 > 体育 > 正文

如何解决我国可利用工业数据少的问题?邬贺铨:引入可信数据空间

  • 体育
  • 2024-12-13 12:24:04
  • 347
摘要: 专题:财经年会2025:预测与战略 《财经》年会2025:预测与战略暨2024全球财富管理论坛于12月13日-12月15日在...

专题:财经年会2025:预测与战略

  《财经》年会2025:预测与战略暨2024全球财富管理论坛于12月13日-12月15日在北京举行。中国工程院院士、中国工程院原副院长邬贺铨出席并演讲。

  邬贺铨谈到,智能体是一种可以接受自然语言命令,可以跟环境互动,并且具有初步思维链的软件,可以将大模型的知识转化为感悟。通常智能体是跟场景一一对应的。“如果说大模型相当于智能手机的操作系统,智能体就相当于手机里头的APP Store。我们的手机实际上仅有操作系统并不显示出它的功能,需要装载一个一个APP。”在他看来,今年大模型的重要进展就是智能体开发出来了。

  邬贺铨指出,目前人形机器人还是预编程序的,去年人形机器人的关键成本下降了40%,马斯克预言未来可能只需一万美元,并且认为只要成本下来、价格下来,未来人形机器人的数量要超过全球的人口数。

  他谈到,人工智能的发展得益于大数据、算力、算法,其中数据是关键。现在数据成为一个很大的挑战,自然语言的数据相对来讲可存储、可开源利用的比较少,但中国工业门类齐全,中国拥有全世界最大的工业数据,但很多大企业有很多工业数据,但是自己不会开发,不愿意跟别人分享,跟别人合作的时候担心数据泄露,而很多中小企业没有数据。“从这个角度看,尽管理论上我国拥有很多工业数据,但实际上可利用的工业数据很少。”

  怎么解决这个困境?邬贺铨建议,引入可信数据空间。“把自己的数据放到这个可信数据空间,相当于一个有围栏的沙箱,数据放进去可以是加密的,邀请相关的互联网企业带着大数据的开发技术进入到可信数据空间。既然是合作方,我把相应的加密的密钥告诉你,你可以在可信数据空间里对这些数据进行解密计算,计算的结果还给数据提供方。在可信数据空间里,数据不出去,而且数据是可用不可见的,邀请进来的互联网企业不可能带走这个数据。”

  邬贺铨表示,通过可信数据空间,我们提供数据源的验证和接入身份验证,提供数据目录得以检索,提供敏感数据的过滤和去标识化,提供数据格式的转换,提供数据挖掘的工具,提供数据加密和解密的计算,提供数据安全的一些工具软件和合规检查,还可以提供一些数据清算、结算的软件。通过这些(措施),既保证数据搞活,又保证数据的安全,是激活数据、发掘数据要素价值的一个很有力的工具。

  此外,他还强调,进入可信数据空间的数据要脱敏,特别是政府掌握了大量的个人信息数据,包括电信运营商、金融企业都有大量的个人数据,这些数据可以运用,但是需要进行脱敏,要去标识化,也就是在传输过程中是把它扰乱的、偏置了,在传输中是不可能解释出来,接收端可以还原。真正的跨境数据要匿名化,不可能还原。除此之外,他提到,计算要进行加密计算,企业A要用企业B的数据,企业B要用企业A的数据,但实际上谁都不愿意把原始数据送出去。解决的办法是采用一个特定的密钥把这个数据加密了,以加密的数据来计算,计算的结果跟不加密是等效的,但是原始数据谁也拿不走。

  但是,邬贺铨也指出,能不能接入到数据可信空间,还是需要验证的,因为只有协议的双方才能够共用这个可信数据空间。

  “所以,可信数据空间实际上是希望政府来投,并且一些大企业带头,建设真正可信数据空间,解决数据不会用、不敢用、成本太高的难题,同时免除提供数据的和使用数据的双方一种怕数据违规、怕数据泄密、怕违反规定登顶担心,希望通过这种方式,把我们真正的工业数据大国变成真正把工业数据用起来。”他说。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

发表评论