洪永淼:数据要素与数据经济学

发布者:政策研究中心发布时间:2024-08-15浏览次数:44


2024年7月3日,2024中国数字经济发展和治理学术年会在清华大学成功举办。本届学术年会聚焦“数据要素、人工智能与数智时代的理论创新”,邀请国内外40余位专家、学者及机构代表进行主旨演讲和交流。来自清华大学、北京大学、中国人民大学、中国科学院大学、中国社会科学院大学、浙江大学、南开大学、上海交通大学、西安交通大学等高校和数字经济相关科研机构及企业代表共400余人出席线下会议。会议通过多个平台同步直播,当天信息浏览量超过十万人次。

中国科学院大学经济与管理学院院长洪永淼以《数据要素与数据经济学》为题进行了主旨演讲。本文根据洪永淼教授现场发言内容整理。

我今天要讲的,主要是从经济学的视角来看数据要素和数据经济学这个新兴学科。特别是作为一种新型生产要素,数据要素具诸多与传统要素迥异的重要特征,这些特征塑造了数字经济的新形态与运行规律,对我们构建数据经济学这个学科会带来哪些理论上的机遇和挑战。

一、引言

在数字经济时代,数据已成为驱动绝大多数经济活动的核心要素,其地位已超越了农业时代和工业时代的土地、劳动力和资本等传统要素。现代经济体系无时无刻不在产生海量数据,这些数据反过来又催生或者驱动新的经济活动。诸如机器人、无人机、机器翻译、量化交易、量化财务管理、无人驾驶等领域,皆生动展示了数据在其中发挥的决定性作用。

《经济学人》杂志2017年一篇封面文章提出,“数据而非石油,才是当今世界最宝贵的资源”。《哈佛商业评论》2019年一篇题目为“哪些国家在引领数据经济”的文章,首次提出了“数据生产总值”(Gross Data Product)的概念,用以衡量一个国家或经济体的数据财富。

作为一种新型的生产要素,数据是数字化、网络化、智能化的基础,正在快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着人类生产方式、生活方式思维方式以及社会治理方式。特别是数据要素推动了技术、资本、劳动力、土地等传统生产要素发生深刻变革与优化重组,对经济社会发展具有放大、叠加、倍增的作用。基于数据要素的新质生产力及其相关的新型生产关系正在加速形成。

当数据被确认为生产要素时,数据经济学自然就成为一门新兴学科,正如劳动、管理、技术、土地等传统要素各自对应有劳动经济学、管理经济学、技术经济学、土地经济学等学科一样,数据经济学也应建立起类似的学科体系。但数据作为一种新型生产要素,它与传统生产要素有着诸多不同的特点,这些特点又会对数据经济学带来哪些新的机遇和挑战呢?这就需要我们深刻理解和把握数据要素的基本属性。

二、数据及其产生过程

什么是数据?数据的本质是信息和知识的载体。我们现在看到的数据是能够以数字、文本、图像、音频和视频等多种符号形式记录或表现,以便于人类或计算机解读和处理的各种客观事实的信息集合。从计量经济学和统计学视角来看,数字是结构化的数据,文本、图像、音频、视频等是非结构化的数据。目前,非结构化数据已经占据了超过80%的比例,相比结构化数据,非结构化数据涵盖的范围更广,类型更多样。

数据是对现实世界的详实记录与映射,不仅反映客观的社会经济活动,还折射出公众对政府政策、重大事件(如疫情、战争)的即时心理反应。数据无处不在,《经济学人》杂志的一篇封面文章里讲到,“无论你是在跑步、看电视或者在乘坐交通工具,几乎每个活动都创造了数字痕迹,为数据分析公司提供了更多原始数据。”

从经济学的视角来看,数据供给有一个数据产业链,牵扯到数据收集、数据储存、数据分析以及数据应用。根据数据生成来源的不同,我们可以把数据分为个人数据、企业数据以及公共数据。

个人数据的主要来源是互联网用户在各种数字平台上进行的浏览、搜索、互动、交易等活动,例如,在Google、百度上的搜索记录,在淘宝、京东、Amazon的购物记录,在美团、饿了么上的订餐记录,在滴滴打车、Uber上的行程记录,以及在微信、抖音、Twitter上的互动交流记录等。企业数据主要是企业在生产经营活动中产生的各类相关指标。如制造业企业利用传感器、计算机的芯片或跟踪器,对企业的运行状况、能耗、产量、温度、湿度、压力、库存、物流、销售等生产经营指标进行实时监测而收集的数据。公共数据源自各级政府部门、各类公共事业单位,包括财政、税务、海关、自然资源、生态环境、交通、电力等部门在提供公共服务过程中生成的数据。

在实际经济活动中,这三种数据并不是相互独立、彼此排斥的,而是相互联系、相互影响的。个人数据可以为企业经营提供重要参考,企业数据可以帮助政府制定更有效的监管政策,而公共数据则为各类经济活动提供基础支持。通过综合利用这三类数据,可以实现更高效的资源配置、更精准的市场分析和更科学的决策制定,从而推动经济社会的全面发展。

三、数据的自然属性与经济特征

数据的自然属性和经济特征是我们理解数据的起点。自然属性指的是数据本身具有的性质,关乎数据的固有特质,决定了其适用范围与使用价值。

一是虚拟性。与土地、劳动力、资本等实体要素不同,数据本质上是一种物理符号,可以编码为“0”或“1”的二进制字符串储存在计算机。与传统生产要素在现实的三维空间中占据一定体积或面积不同,数据没有这种物理限制。由于数据的虚拟性,它能够被计算机快速存储和传输,传输速度可以在几毫秒内实现从地球的东端到西端的传输,这与传统的物流运输存在巨大差异。

二是非消耗性。土地、劳动力、资本等传统要素会随着使用而逐渐消耗,但数据则不会。数据可以被多次重复使用,且不会损失其原有的价值。例如,同一数据可以被多次使用,而数据本身不会因为使用次数的增多而减损。这种非消耗性打破了传统生产要素有限供给对生产发展的限制,使数据成为一种极具潜力的生产要素。

三是非排他性。这一特性源于数据的虚拟性以及计算机存储和处理技术的发展。与传统生产要素不同,数据不受物理限制。任何个人或组织都可以在同一时刻访问和使用同一数据集,且这种使用不会影响其他用户对该数据的访问,这是数据与其他生产要素显著不同的特点。

四是时效性。数据具有不同的时效性,有些数据的信息是永久性的,像地理位置、种族、性别,这些基本不会更改。有些数据是缓慢变化的,比如身高、年龄、风俗习惯、社会文化等等,这些是在慢慢变化。但是更多的数据,特别是大数据,反映的是即时的经济社会活动,比如像当前的经济状况、国际冲突、经济危机等等,具有很强的时效性。IBM几年前的一个研究报告指出,60%的非结构化数据在几毫秒内就失去了价值,超过一半的数据在其产生的那一刻起就不具有任何价值了。

五是低信噪比。虽然数据容量巨大,但其中的噪声很多,有价值的信息相对较少。例如,社交媒体平台每天都会生成海量数据,但这些数据中大部分是无关或噪声数据,只有一小部分具有实际价值。因此如何有效地过滤数据噪声,提取出有用的信息,将成为数据科学家和分析师的重要任务。

六是高流动性。与土地、劳动力、资本等传统要素相比,数据的流动成本极低,流动性非常高。例如,数据可以通过互联网在几毫秒内从一个国家传输到另一个国家,这种高效的传输方式大大降低了数据交换的时间成本和经济成本。数据的高流动性特点使其成为现代经济中不可或缺的关键要素,极大推动了信息交流、资源共享和经济活动的高效运作。

经济属性关注数据在经济活动中的表现特征,聚焦其经济价值。与传统要素相比,数据要素具有很多独特的经济特征。

第一,规模经济性。数据生产需要投入各种传感器设备、测量仪器、储存设备、算力设备以及数据分析仪器等等,因此具有高固定成本的经济特征。而数据一旦生成,就能以近乎零成本的方式进行快速复制、无限重复使用,额外增加一单位数据的边际成本几乎为零,因此,又具有低边际成本的经济特征。高固定成本、低边际成本的成本结构为数据带来了显著的规模经济性,使得数据生产企业具有明显的自然垄断特点。

第二,要素互补性。与传统生产要素不同,数据不能单独作为一个生产要素存在,它必须与其他的要素相结合(像劳动、资本、技术),才能形成有效的要素,发挥赋能作用。数据与劳动力结合,就变成了数字劳动力。比如骑手有了GPS导航,整个物流的运输成本将大大提高。数据与资本结合,就变成了数字资本,有效提高资本的回报率。现在智能的投资顾问平台其实就是大数据跟人工智能的结合,跟资本的结合能够有效地提高金融行业的回报率。数据跟技术相结合,产生数据技术。波音公司利用数字孪生技术,可以优化工艺制造流程,降低设计生产周期,提高飞机的安全性、可靠性。

第三,场景依赖性。数据的经济价值和回报价值在很大程度上取决于其所处的具体应用场景。不同的场景下,相同的数据可能会产生截然不同的经济效果和价值。比如网约车平台的消费数据,交易一经结束,乘客位置、等待时间、乘车偏好等信息再也没有用了。但如果将乘客的消费数据收集起来,就有可能通过数据挖掘等方法总结出乘客的消费规律,从而创新平台的交易模式。

第四,经济价值衰减性。随着时间的推移,某些数据的信息可能会变得过时或者不再适用于当前的环境和需求而失去其原有的经济价值。例如,市场研究中使用的消费者偏好数据,如果不及时更新或者不再反映当前消费趋势,其经济价值就会迅速下降。数据的经济价值衰减性强调了数据管理的重要性和及时更新数据的必要性。

第五,数据确权模糊性。由于数据的虚拟性和广泛来源,其权利归属的界定和管理与传统生产要素存在显著的差异。在互联网平台上产生的数据,例如社交媒体、电子商务和智能设备,由成千上万的用户生成,因此真正的数据所有者通常是大量的互联网用户,特别是消费者。然而,能够收集、存储和利用这些数据的却往往是互联网大数据平台和相关技术公司,这种情况导致了数据所有权的分离和模糊性,这是数据与传统要素显著区别的一个重要特征。

第六,经济外部性。数据的使用不仅仅影响到参与数据交易的双方,还可能对第三方、整个社会甚至国家产生正面或负面影响。这种外部性可以是数据交换的积极效应,也可能是负面影响,这取决于数据使用的方式和目的。正面的影响是正外部性,如数据合并产生的溢出效应;负面的影响就是负外部性,如数据泄露侵犯个人隐私或国家利益。确权的模糊性以及经济的外部性是造成整个数据要素交易市场建立比较困难的两大原因。

四、构建数据经济学的机遇与挑战

尽管“数据经济学”这一概念目前在国际学术界尚未普遍接受,但作为一门学科,它正在迅速发展壮大。随着数据要素在现代经济活动中扮演的角色愈发关键,其重要性也日益凸显。数据独特的自然属性和经济特征表明,作为一种新型生产要素,它与传统要素有着显著的不同。这些差异为我们构建数据经济学带来了新的机遇和挑战。

首先,如何测度数据的价值是一个复杂的政治经济学问题。尽管我们可以借鉴劳动价值论,但数据的价值创造与转移过程与其他生产要素不同,特别是数据必须与传统生产要素有机结合,才能发挥其赋能作用。这是否意味着我们有机会创造新的价值理论,以更准确地描述数据要素在经济中的角色?这一问题为理论经济学家提供了一个广阔的研究空间。

其次,数据要素的规模性,尤其是数据递增的规模性,可能导致数据资源趋于垄断,这种现象使得数据要素的规制经济学成为一个重要领域。因此,如何防止数据垄断,保证数据资源的公平分配和合理使用,已经成为政策制定者和经济学家关注的焦点。

再次,如何计算数据参与生产的全要素生产率是一个复杂的问题。全要素生产率这一概念由诺贝尔奖得主罗伯特•索洛于上世纪50年代提出,其基础是柯布-道格拉斯生产函数。然而,数据作为生产要素需要与传统要素紧密结合才能有效发挥作用,因此如何描述数据经济的生产函数至关重要?如果我们对生产函数的设定不准确,那么计算出的全要素生产率将可能会误导或失真,这是经济学家必须面对的一个重要挑战。

此外,数据要素市场失灵也是一个关键挑战。数据产权不明确且具有强外部性,最终可能导致数据要素市场失灵。经济学中有许多市场机制设计的理论,如何利用这些理念构建一个功能齐全、运转良好的数据要素交易市场,是另一个亟待解决的问题。

数据要素的新特点给经济学家,特别是理论经济学家,提出了许多理论上的挑战。然而,这些挑战同时也是机遇。通过研究数据要素的独特性质,我们有机会重新定义经济学的一些基本概念和理论框架。这不仅有助于理解当前数字经济时代的一些经济现象,也为未来的经济发展提供了新的视角和方法。

未来,数据经济学将不仅涉及数据的价值测度和生产函数的设定,还会涉及数据的所有权、隐私保护、数据共享和数据要素市场的构建。数据的巨大潜力需要通过创新的理论框架和实践来实现,这将推动经济学的发展,开辟新的研究领域。正是这种不断探索和创新的过程,使得数据经济学成为现代经济学中不可或缺的重要组成部分。这不仅对构建中国经济学自主知识体系具有基础性意义,也为中国在全球数字经济竞争中占据有利位置与掌握话语权提供坚实的理论和实践基础。