Wirestock 获 2300 万美元融资：当创意者的“数字矿藏”成为 AI 训练的新石油

在 AI 模型日益“饥渴”的今天，数据早已不再是冰冷的字节，而是驱动智能进化的血液。传统的大规模爬虫数据正在面临版权纠纷、质量参差和伦理争议的多重拷问——此时，一家名叫 Wirestock 的初创公司拿到了 2300 万美元的融资，试图用一种更体面、更高效的方式，打通创作者与 AI 实验室之间的“数据高速公路”。这不仅是商业故事，更是一场关于 AI 训练数据话语权的重塑。

## 从“摄影作品集市”到“多模态数据银行”

Wirestock 这个名字，对不少创意工作者来说并不陌生。它最初是一个帮助摄影师、插画师和视频创作者将作品一键分发到 Shutterstock、Adobe Stock 等图库平台的聚合工具。如今，它给自己的身份加上了一个更性感的标签：“创意多模态数据供应商”。

这笔 2300 万美元的 A 轮融资由 **Index Ventures** 领投，**Y Combinator** 等老股东跟投。根据 TechCrunch 的报道，Wirestock 计划利用这笔资金扩建其数据基础设施，并招募更多机器学习工程师——直白地说，就是要把平台上数百万创作者的图片、视频、甚至 3D 模型，打包成 AI 实验室可以直接喂给模型的“结构化训练集”。

关键区别在于：传统上，AI 公司获取训练数据要么靠爬虫（风险高、版权模糊），要么花高价向图库巨头购买（过程冗长、格式不灵活）。Wirestock 做的是“中间人”升级版——它不卖单张图片，而是卖**经过清洗、标注、并附带明确商业使用许可的批量数据集**。创作者依然保留所有权，每售出一份数据集就能获得分成；AI 实验室则省去了自己爬取、清洗、法律审查的巨大成本。

## 为什么是“多模态”？为什么是“现在”？

Wirestock 的融资时间点，恰好踩在 AI 行业的一个关键转折上。

过去两年，大语言模型和扩散模型主要依赖文本和静态图像训练。但进入 2026 年，**多模态 AI** 成为绝对的焦点——从视频理解、3D 生成，到能够“看、听、读”的智能体，模型需要同时理解图像、视频、音频、文本等多种信息形态的相互关系。而这类训练数据的稀缺程度，远超纯文本或纯图片。

Wirestock 平台天然具备多模态基因：摄影师上传的不仅是静态照片，还有延时摄影视频、360 度全景、逐帧序列；插画师的作品往往附带风格标签和创作过程记录。将这些异构数据统一成“时间步+空间坐标+语义描述”的多模态序列，正是当前 AI 实验室愿意溢价购买的服务。

另一个关键变量是**版权合规**。2025-2026 年间，全球多起针对 AI 公司的版权诉讼让行业风声鹤唳。Stability AI、OpenAI 等巨头的训练数据来源屡遭质疑，法院的判例正在向“未经授权使用创作者作品训练 AI 属于侵权”倾斜。这迫使 AI 实验室不得不寻找拥有清晰授权链的数据源。Wirestock 的策略正好卡位：每一份数据集都明确标注了创作者书面授权，且数据使用范围限缩在“训练非商业化内部模型”或“特定商业场景”——这种法律上的透明度，让大公司愿意支付 10 倍于爬取数据的单价。

## 创作者经济的新“出口”？还是新一轮剥削？

Wirestock 的商业模式，让不少创作者又喜又忧。喜的是，那些躺在硬盘里无人问津的素材，突然变成了一条生财之道——摄影师 Aaron 在采访中说，他去年通过 Wirestock 的数据合作拿到超过 1.2 万美元的分成，远高于传统图库的零散收益。

忧的则是深层隐忧：当 AI 模型用这些数据学得“像”创作者风格后，是否会反过来抢夺他们的活计？毕竟，AI 生成的内容已经在冲击插画、平面设计甚至视频剪辑市场。创作者参与数据训练，某种意义上是在“给自己未来的竞争对手喂弹药”。

Wirestock 的 CEO 在接受采访时承认这一矛盾，但他给出的答案是：**“我们正在建立一种以知情人同意和市场化定价为基础的秩序，比被动被爬虫席卷好一万倍。”** 这种说法是否成立，取决于分成比例是否公平、创作者是否拥有退出权——以及，AI 最终是否会创造足够多的新岗位来补偿被取代的旧角色。目前来看，这更像是一种“软着陆”实验：让创作者在 AI 浪潮中至少能分到一杯羹，而不是被碾过。

## 商业竞争：数据“中间商”的战国时代

Wirestock 并不孤单。这个赛道正在迅速变得拥挤：**Scale AI** 早已是数据标注领域的巨无霸，但其模式偏“众包标注”，而 Wirestock 强调的是“原生创意数据”；**Shutterstock** 和 **Adobe** 也在推出自己的 AI 训练许可方案，但它们更倾向于卖自家图库的封闭数据；还有一些区块链驱动的去中心化数据市场（如 **Vana**）试图让创作者直接对等交易。

Wirestock 的独特护城河在于**创作者生态的粘性**。它已经积累了超过 200 万注册创作者，这些人习惯于用它进行多平台分发，现在又多了“数据变现”这一新选项。对 AI 实验室来说，与其和分散的个体逐一签约，不如通过 Wirestock 一个接口拿到海量授权数据——这种聚合价值很难被短期复制。

## 未来：AI 训练数据可能变成“订阅制”

这笔融资释放的另一个信号是：**优质训练数据正在从“一次性买卖”走向“持续性服务”**。Wirestock 计划在其平台上推出“动态数据集”产品——即随着创作者每天上传新作品，数据集会持续更新，AI 实验室可以按月订阅。“模型需要不断学习新事物，比如 2026 年的时装趋势、街头文化变迁、气候变化纪实，” Wirestock 的 CTO 解释道，“静态数据集只能教出过时的模型。”

如果这种订阅模式落地，意味着 AI 训练数据的商业模式将彻底改变：不再是“挖一吨矿石炼完就扔”，而是像灌溉农田一样，需要持续的、多元的水源。这对 Wirestock 的估值逻辑也是重大利好——ARR（年度经常性收入）的故事永远比一次性数字性感。

## 结语：数据民主化的一小步，AI 生态的一大步

Wirestock 的 2300 万美元，本质上是一笔押注于“数据供应链专业化”的赌注。它试图回答一个根本问题：当 AI 需要全世界创意者的劳动成果来滋养时，我们能否建立一套既尊重个体创作者权益、又满足技术发展速度的交易体系？

现在说成功还为时过早。但至少，它提供了一条比“爬虫—诉讼—和解”更体面的路径。对创作者而言，这是一个将作品变成“数据矿藏”的机会；对 AI 实验室而言，这是一个拿到合规、高质量多模态训练数据的捷径；对整个行业而言，这可能是从野蛮生长走向规则重建的开始。

数据是新的石油，而 Wirestock 正在试图成为那个既开矿又修管道的服务商。至于最终是共赢还是新殖民主义，时间会给出答案。但我们至少可以说：**在 AI 的饕餮盛宴上，终于有人开始给厨师发工资了。**

Wirestock 获 2300 万美元融资：当创意者的“数字矿藏”成为 AI 训练的新石油

暂无评论