来源文件:009-data-governance.md
第四编:四把尺子如何落地
建议顺序:第 9 节

第七部分:数据治理——数字时代的“所有权与使用权分离”

来源:../main.md 第 1322-1377 行

所属分编:第四编:四把尺子如何落地

建议阅读顺序:第 9 节

第七部分:数据治理——数字时代的“所有权与使用权分离”

数据,是数字时代最特殊的生产要素。它既是激励尺子的燃料——AI和算法依赖数据训练才能创造增量;又是兜底尺子的保护对象——公民的消费记录、出行轨迹、健康档案、社交网络,一旦被私有化,掌握数据的资本就掌握了定义“你能看到什么、你能成为什么”的权力。也正因为如此,数据治理从来不只是技术问题,而是在数字时代重新回答那句老问题:谁拿走收益,谁承担代价;谁握有权力,谁接受追责。

数据治理的核心原则,与资本驯服一脉相承:所有权归全民,使用权竞争性共享。它真正想做的,不是把创新关死,而是把权利收进透明边界,把义务焊在数据流动和价值变现的链条上,不再允许任何平台只拿走红利、把风险和代价留给社会。

一、数据所有权归国家平台持有

这是兜底尺子在数字时代的底盘。供水、供电、网络不可私有,数据同理。国家代表全民持有数据所有权,写入公共登记簿,不可篡改。这带来三个刚性保障:公民有权查看自己的数据被谁调用了、用于什么目的,并且有权拒绝;任何机构要使用数据,必须申请有期限、有明确用途限制的使用权证;数据安全成为国家平台的法定责任,泄露、滥用、违规开放,追溯问责到具体责任人。换句话说,数据底座不能再是一个谁都能偷着抽水、却没人对后果负责的黑箱。

二、算法运营权交给市场

国家持有数据,不等于国家自己下场写算法。平台运营商——民企、科研机构、个人开发者——可以申请数据使用权,用自己的算法在公共数据底座上跑出创新应用。

这个结构带来三个关键突破:打破数据垄断——过去是“谁拥有数据谁通吃”,现在是“数据大家都有,算法竞争上岗”,垄断的根基被制度性抽走;激励尺子的“事后买断”只在可验证增量、权属清楚、适合公共开放的模型上嵌入——用公共数据训练出突破性AI模型,创造了真实增量财富,国家才用增量货币一次性重奖,然后将符合条件的模型收归全民所有,免费开放;算法变成可竞争的公共品——不同运营商在同一数据底座上比拼算法效率、公平性、透明度,差的被淘汰,好的被社会共享。它的核心不是反市场,而是把市场放进更透明的赛道里:谁真的创造增量,谁就拿回报;谁只是靠垄断数据入口抽租,谁就失去旧时代那种躺着收割的资格。

但这里还有一条更深的底线:算法可以参与竞争,但不能接管“何为价值、何为正确、何为贡献”的最终定义权。无论是在数学研究、科学探索,还是在教育、司法、金融、平台分发这些领域,决定什么值得奖励、什么应被承认、什么风险不可接受的主体,最终都必须是能够公开辩论、能够自我修正、能够承担后果的人类共同体,而不是商业模型本身。换句话说,AI可以是工具、伙伴甚至强大助手,但不能成为价值尺度的主权者。

这意味着,凡是使用AI参与知识生产、规则判断或高影响决策的场景,都应增加三条最低护栏:第一,工具使用披露,不能把机器参与伪装成人类独立完成;第二,责任归属回到人,最终正确性、合规性与社会后果仍由人类作者、部署者和审批者承担;第三,保留可审计接口,关键过程、训练来源、版本更新、人工复核链条必须留痕,为未来争议处理、独立审计和责任回溯保留入口。只有这样,“效率提升”才不会反过来腐蚀“讲理的能力”。

三、数据所有权持有者与算法提供者的责任分离

在“国家持有数据、市场运营算法”的结构里,两方各司其职,各担其责:数据所有权持有者(国家平台)担数据安全、公民隐私、公平开放之责;算法提供者(运营商)担算法合规、不滥用数据、不制造歧视性结果之责。若算法被查出“大数据杀熟”或利用公共数据作恶,运营商失去使用权,并留下长期公开失信记录。这个结构,就是元规则在数字时代的直接落地。它要防的,正是那种最常见的甩锅模式:平台把收益装进自己资产负债表,把歧视、误导、成瘾和社会撕裂甩给外部世界。

四、平台抽成的动态监管

平台经济的抽成,本质上是对使用全民数据底座和公共流量池支付的对价。抽成监管不应一刀切,而应引入动态边界思维:平台可以因为真实创新获得阶段性更高回报,但不能把“早期激励”永久固化成“成熟期抽租权”。

探索期平台,抽成上限可适当放宽,激励创新;

成熟期平台,抽成上限压至“成本+合理利润”水平,同时强制开放数据接口和互操作性标准。

同样的原则也适用于文件格式与工业软件生态。封闭格式如果让用户的数据、设计记录和协作链条只能依附某一家软件商存在,本质上就是在用工具入口私有化用户的劳动沉淀。用户买到的表面上是软件使用权,实际失去的却是数据可迁移、可协作、可延续的控制能力。更稳妥的制度回应,不是简单否定商业软件,而是要求那些已经进入成熟期、并具有公共基础设施性质的工业工具,必须开放可互操作的标准格式与必要接口,让数据控制权留在合法使用者手里,让软件厂商在增值服务、专业支持与未成熟模块上继续竞争,而不能靠格式锁死永久抽租。

进一步说,国家确实应当把这一点上升为制度义务,而不只是行业倡议。对于承担公共采购、产业链底座、教育训练和关键制造支撑职能的软件,法律应逐步要求其提供可公开、可迁移、可审计的标准格式、导出接口和历史版本读取能力。软件可以收费,算法可以专有,服务可以竞争,但劳动者、学校、维修者和中小团队不应因为停授、停服或换平台,就失去访问自己劳动成果和继续协作的能力。

动态调节参数:订单量越大、平台边际成本越低,抽成比例自动下调。

五、全民数字账户与流量公平

数据税的分配不能是糊涂账。设立全民数字账户:每个公民的年度数字贡献折算成积分,年底按比例从数据税池中分配数字红利。你贡献的数据,变成你账户里的数字红利——这是兜底尺子在数字时代的“按人头分红”升级版。它要解决的,正是过去那种“人人都在贡献数据,只有少数平台把它变成私人矿山”的结构性失衡。

流量公平计划同步推进:平台流量本质上是公共基础设施,不能全卖给出价最高的商家。强制划出一定比例流量,按抽签或轮展方式分配给中小商家和内容创作者。这是劳动尺子在流量分配中的落地——让中小参与者的贡献有机会被看见,不因资本弱势而永远沉没。

数据资产的跨境保护。 任何将全民数据底座中的核心数据、算法模型、算力资源授权或转移给境外实体的高风险安排,都应进入“受益人合规说明”框架。数据是新时代的黄金,而全民数据底座是兜底尺子的数字形态。掏空数据底盘,等同于掏空全民资产,因此应先完成披露、说明与独立审查,再依据风险等级和审查结果按比例采取保全、限制、追缴与后续追责措施。边界在这里不能只是地理边界,更是责任边界:谁想把依托共同体形成的数据收益带走,谁就必须先把义务说明清楚、把欠账结算明白,而不是在流动中顺手切断责任关系。

AI 训练贡献权益。 到了 AI 时代,问题还要再往前走一步。很多高质量代码、公开文档、问题修复思路、讨论记录和结构化反馈,表面上像是“顺手分享”,实际上已经在持续充当模型训练的燃料。如果系统长期吸收这些贡献,最后却只把能力沉淀为平台私产,那就等于把群众智慧再次悄悄改写成单边收租。也因此,这里需要补出一个新的制度接口:AI 训练贡献权益。它要承认,高质量数据、代码、纠错、标注、思路供给与持续反馈,本身也在构成一种新型的数据劳动与知识劳动。

这项权益不意味着每一条信息都要逐条计价,也不意味着公共知识必须被重新圈地收费。更稳的做法,是建立来源留痕、贡献分层、收益回流、授权分级四件套:哪些公共内容进入了训练,应至少存在可审计的来源登记;普通公开贡献、高价值关键贡献和长期稳定贡献,应在记账与回流权重上区别对待;模型商业化后的部分收益,应回流到公共贡献池和长期权益账户,而不是只停在平台利润表里;贡献者还应拥有最基本的授权边界选择,例如“可公开阅读但不可训练”“可训练但需署名留痕”“可训练且参与回流”等不同层级。

如果再说得更直白一点,这套机制要解决的,不是“平台要不要感谢创作者”这种礼貌问题,而是“谁为 AI 的能力成长提供了真实燃料,谁就不该在价值兑现时完全消失”。对于那些显著提升模型能力的高价值贡献,制度上完全可以补出更明确的现金奖励、公开署名、贡献证明和长期分红记录;对于海量但分散的普通贡献,则可以通过全民数字账户、公共贡献积分和训练回流池来做较低颗粒度的持续返还。只有当 AI 的能力增长与人的贡献记账重新接上,前面讲的技术红利共享,才不会在训练环节重新断掉。

更进一步说,数字时代需要一套更强的穿透式登记与自动清算逻辑:无论是核心数据使用权、算法模型收益权,还是依托公共数据底座形成的股权、分红权和衍生收益安排,都应尽可能穿透到最终自然人受益主体,并把重大流转、授权、质押、转移和离境动作写入不可篡改的公共登记链。这样做的意义,不是制造繁琐备案,而是让“谁在拿走依托共同体形成的数字收益”这件事始终处在阳光下。一旦发生高风险离境或责任切断式转移,系统就应自动触发税务、合规与公共利益审查程序,而不是等问题爆炸后再靠运动式清查补锅。

---