# 第七部分：数据治理——数字时代的“所有权与使用权分离”

来源：`../main.md` 第 1322-1377 行

所属分编：第四编：四把尺子如何落地

建议阅读顺序：第 9 节

第七部分：数据治理——数字时代的“所有权与使用权分离”

数据，是数字时代最特殊的生产要素。它既是激励尺子的燃料——AI和算法依赖数据训练才能创造增量；又是兜底尺子的保护对象——公民的消费记录、出行轨迹、健康档案、社交网络，一旦被私有化，掌握数据的资本就掌握了定义“你能看到什么、你能成为什么”的权力。也正因为如此，数据治理从来不只是技术问题，而是在数字时代重新回答那句老问题：谁拿走收益，谁承担代价；谁握有权力，谁接受追责。

数据治理的核心原则，与资本驯服一脉相承：所有权归全民，使用权竞争性共享。它真正想做的，不是把创新关死，而是把权利收进透明边界，把义务焊在数据流动和价值变现的链条上，不再允许任何平台只拿走红利、把风险和代价留给社会。

一、数据所有权归国家平台持有

这是兜底尺子在数字时代的底盘。供水、供电、网络不可私有，数据同理。国家代表全民持有数据所有权，写入公共登记簿，不可篡改。这带来三个刚性保障：公民有权查看自己的数据被谁调用了、用于什么目的，并且有权拒绝；任何机构要使用数据，必须申请有期限、有明确用途限制的使用权证；数据安全成为国家平台的法定责任，泄露、滥用、违规开放，追溯问责到具体责任人。换句话说，数据底座不能再是一个谁都能偷着抽水、却没人对后果负责的黑箱。

二、算法运营权交给市场

国家持有数据，不等于国家自己下场写算法。平台运营商——民企、科研机构、个人开发者——可以申请数据使用权，用自己的算法在公共数据底座上跑出创新应用。

这个结构带来三个关键突破：打破数据垄断——过去是“谁拥有数据谁通吃”，现在是“数据大家都有，算法竞争上岗”，垄断的根基被制度性抽走；激励尺子的“事后买断”只在可验证增量、权属清楚、适合公共开放的模型上嵌入——用公共数据训练出突破性AI模型，创造了真实增量财富，国家才用增量货币一次性重奖，然后将符合条件的模型收归全民所有，免费开放；算法变成可竞争的公共品——不同运营商在同一数据底座上比拼算法效率、公平性、透明度，差的被淘汰，好的被社会共享。它的核心不是反市场，而是把市场放进更透明的赛道里：谁真的创造增量，谁就拿回报；谁只是靠垄断数据入口抽租，谁就失去旧时代那种躺着收割的资格。

但这里还有一条更深的底线：算法可以参与竞争，但不能接管“何为价值、何为正确、何为贡献”的最终定义权。无论是在数学研究、科学探索，还是在教育、司法、金融、平台分发这些领域，决定什么值得奖励、什么应被承认、什么风险不可接受的主体，最终都必须是能够公开辩论、能够自我修正、能够承担后果的人类共同体，而不是商业模型本身。换句话说，AI可以是工具、伙伴甚至强大助手，但不能成为价值尺度的主权者。

这意味着，凡是使用AI参与知识生产、规则判断或高影响决策的场景，都应增加三条最低护栏：第一，**工具使用披露**，不能把机器参与伪装成人类独立完成；第二，**责任归属回到人**，最终正确性、合规性与社会后果仍由人类作者、部署者和审批者承担；第三，**保留可审计接口**，关键过程、训练来源、版本更新、人工复核链条必须留痕，为未来争议处理、独立审计和责任回溯保留入口。只有这样，“效率提升”才不会反过来腐蚀“讲理的能力”。

三、数据所有权持有者与算法提供者的责任分离

在“国家持有数据、市场运营算法”的结构里，两方各司其职，各担其责：数据所有权持有者（国家平台）担数据安全、公民隐私、公平开放之责；算法提供者（运营商）担算法合规、不滥用数据、不制造歧视性结果之责。若算法被查出“大数据杀熟”或利用公共数据作恶，运营商失去使用权，并留下长期公开失信记录。这个结构，就是元规则在数字时代的直接落地。它要防的，正是那种最常见的甩锅模式：平台把收益装进自己资产负债表，把歧视、误导、成瘾和社会撕裂甩给外部世界。

四、平台抽成的动态监管

平台经济的抽成，本质上是对使用全民数据底座和公共流量池支付的对价。抽成监管不应一刀切，而应引入动态边界思维：平台可以因为真实创新获得阶段性更高回报，但不能把“早期激励”永久固化成“成熟期抽租权”。

探索期平台，抽成上限可适当放宽，激励创新；

成熟期平台，抽成上限压至“成本+合理利润”水平，同时强制开放数据接口和互操作性标准。

同样的原则也适用于文件格式与工业软件生态。封闭格式如果让用户的数据、设计记录和协作链条只能依附某一家软件商存在，本质上就是在用工具入口私有化用户的劳动沉淀。用户买到的表面上是软件使用权，实际失去的却是`数据可迁移、可协作、可延续`的控制能力。更稳妥的制度回应，不是简单否定商业软件，而是要求那些已经进入成熟期、并具有公共基础设施性质的工业工具，必须开放可互操作的标准格式与必要接口，让数据控制权留在合法使用者手里，让软件厂商在增值服务、专业支持与未成熟模块上继续竞争，而不能靠格式锁死永久抽租。

进一步说，国家确实应当把这一点上升为制度义务，而不只是行业倡议。对于承担公共采购、产业链底座、教育训练和关键制造支撑职能的软件，法律应逐步要求其提供`可公开、可迁移、可审计`的标准格式、导出接口和历史版本读取能力。软件可以收费，算法可以专有，服务可以竞争，但劳动者、学校、维修者和中小团队不应因为停授、停服或换平台，就失去访问自己劳动成果和继续协作的能力。

动态调节参数：订单量越大、平台边际成本越低，抽成比例自动下调。

五、全民数字账户与流量公平

数据税的分配不能是糊涂账。设立全民数字账户：每个公民的年度数字贡献折算成积分，年底按比例从数据税池中分配数字红利。你贡献的数据，变成你账户里的数字红利——这是兜底尺子在数字时代的“按人头分红”升级版。它要解决的，正是过去那种“人人都在贡献数据，只有少数平台把它变成私人矿山”的结构性失衡。

流量公平计划同步推进：平台流量本质上是公共基础设施，不能全卖给出价最高的商家。强制划出一定比例流量，按抽签或轮展方式分配给中小商家和内容创作者。这是劳动尺子在流量分配中的落地——让中小参与者的贡献有机会被看见，不因资本弱势而永远沉没。

**数据资产的跨境保护。** 任何将全民数据底座中的核心数据、算法模型、算力资源授权或转移给境外实体的高风险安排，都应进入“受益人合规说明”框架。数据是新时代的黄金，而全民数据底座是兜底尺子的数字形态。掏空数据底盘，等同于掏空全民资产，因此应先完成披露、说明与独立审查，再依据风险等级和审查结果按比例采取保全、限制、追缴与后续追责措施。边界在这里不能只是地理边界，更是责任边界：谁想把依托共同体形成的数据收益带走，谁就必须先把义务说明清楚、把欠账结算明白，而不是在流动中顺手切断责任关系。

**AI 训练贡献权益。** 到了 AI 时代，问题还要再往前走一步。很多高质量代码、公开文档、问题修复思路、讨论记录和结构化反馈，表面上像是“顺手分享”，实际上已经在持续充当模型训练的燃料。如果系统长期吸收这些贡献，最后却只把能力沉淀为平台私产，那就等于把群众智慧再次悄悄改写成单边收租。也因此，这里需要补出一个新的制度接口：`AI 训练贡献权益`。它要承认，高质量数据、代码、纠错、标注、思路供给与持续反馈，本身也在构成一种新型的数据劳动与知识劳动。

这项权益不意味着每一条信息都要逐条计价，也不意味着公共知识必须被重新圈地收费。更稳的做法，是建立`来源留痕、贡献分层、收益回流、授权分级`四件套：哪些公共内容进入了训练，应至少存在可审计的来源登记；普通公开贡献、高价值关键贡献和长期稳定贡献，应在记账与回流权重上区别对待；模型商业化后的部分收益，应回流到公共贡献池和长期权益账户，而不是只停在平台利润表里；贡献者还应拥有最基本的授权边界选择，例如“可公开阅读但不可训练”“可训练但需署名留痕”“可训练且参与回流”等不同层级。

如果再说得更直白一点，这套机制要解决的，不是“平台要不要感谢创作者”这种礼貌问题，而是“谁为 AI 的能力成长提供了真实燃料，谁就不该在价值兑现时完全消失”。对于那些显著提升模型能力的高价值贡献，制度上完全可以补出更明确的现金奖励、公开署名、贡献证明和长期分红记录；对于海量但分散的普通贡献，则可以通过全民数字账户、公共贡献积分和训练回流池来做较低颗粒度的持续返还。只有当 AI 的能力增长与人的贡献记账重新接上，前面讲的技术红利共享，才不会在训练环节重新断掉。

更进一步说，数字时代需要一套更强的`穿透式登记与自动清算`逻辑：无论是核心数据使用权、算法模型收益权，还是依托公共数据底座形成的股权、分红权和衍生收益安排，都应尽可能穿透到最终自然人受益主体，并把重大流转、授权、质押、转移和离境动作写入不可篡改的公共登记链。这样做的意义，不是制造繁琐备案，而是让“谁在拿走依托共同体形成的数字收益”这件事始终处在阳光下。一旦发生高风险离境或责任切断式转移，系统就应自动触发税务、合规与公共利益审查程序，而不是等问题爆炸后再靠运动式清查补锅。

---