数据治理与元宇宙|数据问题解决不了,元宇宙就不会这么快到来

2021-12-15 00:36 浏览量:361

“元宇宙”这个词最近在媒体上出现得越来越多。这就引出了一个问题,这个词到底是什么意思?从可行性的角度来看,这个概念实际上意味着什么?最重要的是,像元宇宙这样的东西出现并获得应用的前景如何?

一 元宇宙或镜像世界的幻象

“元宇宙”是作家尼尔·斯蒂芬森在他2003年的书《雪灾》中创造的一个术语。在这本书中,斯蒂芬森将元宇宙描述为一种可操作性更强、信息量更大的虚拟现实和增强现实。这种覆盖为物理现实提供了一种普遍的、交互式的数字补充。这个词从21世纪开始在科技爱好者中流行起来。

最近,马克·扎克伯格(Mark Zuckerberg)等人使用了这个词。《纽约客》杂志的凯尔·切卡引用扎克伯格的话称:“元宇宙是‘一个你可以在数字空间中与人共处的虚拟环境’。这是一个“嵌入式互联网”,你可以置身其中,而不仅仅是看着它。我们相信这将是移动互联网的继承者。

Facebook显然希望扩大其Oculus护目镜和广告的市场,并正在使用元宇宙的比喻,帮助向用户描述他们可能会如何购物、玩游戏和更浸入式的在线互动。

自从斯蒂芬森的书出版以来,其他一些术语也出现了,用来描述一个类似的概念。例如,凯文·凯利(Kevin Kelly)在2019年3月《连线》杂志的一篇文章中介绍了他的“镜像世界”概念“。

在2019年8月增强世界博览会上与《福布斯》专栏作家查理·芬克(Charlie Fink)在台上讨论时,凯利说,“镜像世界是一幅以数字形式呈现的一对一的现实世界地图。也就是说,在真实世界的正上方有一个数字皮肤,可以用增强现实技术显示出来。它在相同的规模和位置,所以它是一个皮肤。或者你可以说它是鬼魂,或者它以同样的方式嵌入。在讨论中,凯利和芬克都认为,镜像世界可能需要25年的时间才能完全成为一种通用的、可伸缩的“数字皮肤”。

二、数字孪生的想象

更明确地说,Kelly和Fink实际上是在谈论呈现层或数字皮肤,作为人、地点、事物和概念的3D表示,以及它们如何交互。Fink早在一年前就在类似的背景下使用了元宇宙这个词。换句话说,无论是镜像世界还是元宇宙,都是从交互的、互操作的表现形式开始的,即所谓的数字孪生(学者MIchael Grieves从2002年开始在产品生命周期制造环境中经常使用这个术语)。

目前,有用的数字孪生像它们所代表的实体一样,以有限的、特定目的的方式在应用。例如,通用电气、施耐德电气和西门子等制造商为燃气轮机等设备创建了数字孪生,以预测每个产品生命周期中不同时刻的故障。燃气轮机是为发电厂设计的。这对数字孪生体帮助制造商改进设计。

但长期的愿景更为广阔。所有这些公司都有愿景,但仍处于萌芽阶段的计划,可能会扩大并进一步连接使用中的数字孪生。例如,西门子的工业知识图谱概念(至少已有4年历史)可以让许多数字孪生拥有丰富的关系和情境化数据:

一些组织设想了更大、互动更复杂、更有用的数字孪生聚合体。例如,英国数字建筑中心设想“如果数字孪生被开发成可互操作、安全且连通的,那么整个建筑环境就会成为一个相互连接的系统。”

当政府机构的数字模型建立和运行时,可以想象的是,作为模型的组合,可以提供这些机构在不同环境下如何相互作用的过去、现在和未来状态的景象。制药、消费品、交通运输和农业等资产密集型行业都在努力实现整个供应链的数字化。不幸的是,大多数数据和知识管理企业都不擅长网络规模的数据管理。

三 交互式虚拟和增强的数据逻辑挑战

斯蒂芬森、凯利和芬克的愿景是鼓舞人心的,但他们主要是从用户的角度想象可能性,而没有深入探讨企业在将愿景的独立组件变成现实时所面临的挑战。

数据竖井和逻辑扩展一直以来都是规则,而不是例外,公司管理数据和限制逻辑扩展的能力甚至不如21世纪末和21世纪初智能手机和移动应用出现时。

这对典型的信息密集型企业意味着什么?要管理的数据库多达10,000多个,要监管数千个SaaS和其他订阅,要监管定制代码和许多操作系统、工具和服务。这些数据分布在多个云中,并由事实上的数据联合企业控制,每一个企业都声称控制这些数据,因为它们在数据来源的早期就利用了数据。

尽管长期的趋势有助于逻辑和数据共享,比如当前和未来的网络,但现在数据比以往任何时候都更加白热化,其复杂性正在失控地螺旋上升。

事实是,这种失控的历史的、外包的、以应用程序为中心的云栈,在知识图谱和分散的网络下,阻碍了我们以数据为中心的方式进行的工作

四 超越数据孤岛和代码扩展到共享数据和逻辑基础

你可以想象,要超越学校40年来一直在强化的根深蒂固的模式,就需要重新思考“数字生态系统”,需要以更批判性的眼光看待它。首先,需要对随处可见的自动数据集成的说法持保留态度。事实是,数据协议很难,数据集成更难,而互操作性是最难的。没有互操作性就没有交互式数字孪生。

因此,科学界的数据和知识必须面对不同层次的困难。可以预见的是,需要的能力越多,知识基础就需要更多的关心和培养。简单地说,可以按照以下方式进行比较:

•协议。与两个或多个实体或数据集的兼容性和一致性;

•集成。整合单个数据集,提供广泛的数据访问和交付;

•互操作性。共享同一语言的不同系统之间的实时数据交换和解释。这种交换和解释以一种保存该数据的原始上下文的方式发生。

上面探讨了元宇宙或镜像世界的概念,创建和有效使用元宇宙或镜像世界的主要障碍是数据以及知识,它是具有支持关系逻辑的上下文化数据的管理。更具体地说,为了更有用和准确,交互式数字孪生需要网络规模的互操作性,而不仅仅是应用规模。

换句话说,我们为更多的目的以新的方式生成和使用数据越多,我们就必须在如何大规模管理它方面更有创造性。为了使用数字孪生在元数据尺度上管理物理资产,我们需要将数据管理扩展为资产,通过对这些资产进行动态建模,以便充分表示它们的交互,而不仅仅是静态视图。

五 数据治理在元宇宙的应用

下面从实例的角度探讨元宇宙/交互式数字孪生数据管理的挑战。让我们以公用事业行业为例。

1公用事业行业数字孪生中数据管理的挑战

公用事业行业提供了物联网规模的数据收集和双数字模拟需求的一个很好的例子。该行业必须在各地广泛生产和分配电力,这是一个非常资产密集型的环境。这些资产还往往必须位于受到各种自然灾害威胁的地方。

这是一个必须处理混合包遗留的集中公用事业资产,以及现代的,更加分散的,太阳能和风能发电,存储和分配。来自许多不同公共天然气和电力组织的管理人员管理这些资产的组合。

由于该行业是如此的数字资产密集型,“一家公用事业公司很快就会发现自己拥有数百甚至数千个数字孪生,每个数字孪生都来自同样多的系统和物联网设备。通过将多个数字孪生整合到一个网络中,准确通知单个数字孪生的复杂任务将继续被放大。坏数据对这样一个系统的影响很容易是惊人的。

2 新的架构和数据和逻辑

坏数据的根本原因通常是糟糕的架构设计,这些设计本质上是狭隘的、过时的,没有预见到当今的需求规模或数据连接需求。自从原始计算、网络和存储得到改进,大数据处理变得可以负担得起以来,这一直是我们在争取的。

当我们创建满足当今需求的创新架构时,理想情况下,我们是在系统级设计的帮助下,提供实现高能力目标的手段。在这个过程中,我们期望许多其他系统之间的即插即用连接。交互逻辑对于系统之间的连接至关重要,您可以想象每个数字孪生都构成一个系统,系统之间的交互利用它们之间的即插即用连接。

为了让这些数字孪生表示法相互作用,需要创建对人、地点、事物和想法的可重用描述,以及他们的行为,这些描述必须在逻辑上和语言上都是一致的,并且要同时具有人类和机器的可读性。

知识图非常适合于此目的。知识图的核心是上下文化的动态模型,它允许以知识图、实例数据图、规则和事实的形式丰富和重用数据,这些知识图可以很容易地相互连接和缩放。

这些知识图可以使更大的系统之间的互操作性成为可能。可以这样想:越来越多的逻辑以知识图的形式结束,在知识图中可以出于互操作性的目的重用它。一旦完成了使图一致的艰苦工作,就可以将图和子图拼接在一起,可以创建数据上下文,而不仅仅是数据块。

3 抽象和基于规则的交互逻辑进入知识图谱

人类语言,无论是涉及单词、数字还是数学表达式,都表达了机器需要“理解”并用于帮助我们发现、保存、管理和进一步阐明表格数据集中典型企业实例数据中经常缺少的上下文的逻辑结构的问题。

架构师和建模师对应用程序中的描述性和基于规则的逻辑进行更多的释放和上下文化,就可以使其具有可重用性,并将这些逻辑放入更容易访问的知识图中,这些知识图中还包含相关的实例数据,那么数字孪生就会变得更有用、更具有交互性。

如果我们要构建数字孪生,并创建这个元宇宙的各个部分,我们需融合数据和逻辑资源,使其具有可发现、可重用、可访问和动态的特点,此外还需要提供数据科学家的强大分析资源。


      作者:晓晓

来源:数据驱动智能

上一篇:一文了解数据分析师视角下的数据中台

下一篇:5分钟了解“内部威胁”,企业数据安全的定时炸弹

  • 分享:
龙石数据
咨询电话: 0512-87811036,18013092598
联系我们
商务联系微信

商务联系微信

0512-87811036,

18013092598

咨询电话