AI前沿 2026-05-15

Wirestock 获 2300 万美元融资:当创意者的“数字矿藏”成为 AI 训练的新石油

在 AI 模型日益“饥渴”的今天,数据早已不再是冰冷的字节,而是驱动智能进化的血液。传统的大规模爬虫数据正在面临版权纠纷、质量参差和伦理争议的多重拷问——此时,一家名叫 Wirestock 的初创公司拿到了 2300 万美元的融资,试图用一种更体面、更高效的方式,打通创作者与 AI 实验室之间的“数据高速公路”。这不仅是商业故事,更是一场关于 AI 训练数据话语权的重塑。

## 从“摄影作品集市”到“多模态数据银行”

Wirestock 这个名字,对不少创意工作者来说并不陌生。它最初是一个帮助摄影师、插画师和视频创作者将作品一键分发到 Shutterstock、Adobe Stock 等图库平台的聚合工具。如今,它给自己的身份加上了一个更性感的标签:“创意多模态数据供应商”。

这笔 2300 万美元的 A 轮融资由 **Index Ventures** 领投,**Y Combinator** 等老股东跟投。根据 TechCrunch 的报道,Wirestock 计划利用这笔资金扩建其数据基础设施,并招募更多机器学习工程师——直白地说,就是要把平台上数百万创作者的图片、视频、甚至 3D 模型,打包成 AI 实验室可以直接喂给模型的“结构化训练集”。

关键区别在于:传统上,AI 公司获取训练数据要么靠爬虫(风险高、版权模糊),要么花高价向图库巨头购买(过程冗长、格式不灵活)。Wirestock 做的是“中间人”升级版——它不卖单张图片,而是卖**经过清洗、标注、并附带明确商业使用许可的批量数据集**。创作者依然保留所有权,每售出一份数据集就能获得分成;AI 实验室则省去了自己爬取、清洗、法律审查的巨大成本。

## 为什么是“多模态”?为什么是“现在”?

Wirestock 的融资时间点,恰好踩在 AI 行业的一个关键转折上。

过去两年,大语言模型和扩散模型主要依赖文本和静态图像训练。但进入 2026 年,**多模态 AI** 成为绝对的焦点——从视频理解、3D 生成,到能够“看、听、读”的智能体,模型需要同时理解图像、视频、音频、文本等多种信息形态的相互关系。而这类训练数据的稀缺程度,远超纯文本或纯图片。

Wirestock 平台天然具备多模态基因:摄影师上传的不仅是静态照片,还有延时摄影视频、360 度全景、逐帧序列;插画师的作品往往附带风格标签和创作过程记录。将这些异构数据统一成“时间步+空间坐标+语义描述”的多模态序列,正是当前 AI 实验室愿意溢价购买的服务。

另一个关键变量是**版权合规**。2025-2026 年间,全球多起针对 AI 公司的版权诉讼让行业风声鹤唳。Stability AI、OpenAI 等巨头的训练数据来源屡遭质疑,法院的判例正在向“未经授权使用创作者作品训练 AI 属于侵权”倾斜。这迫使 AI 实验室不得不寻找拥有清晰授权链的数据源。Wirestock 的策略正好卡位:每一份数据集都明确标注了创作者书面授权,且数据使用范围限缩在“训练非商业化内部模型”或“特定商业场景”——这种法律上的透明度,让大公司愿意支付 10 倍于爬取数据的单价。

## 创作者经济的新“出口”?还是新一轮剥削?

Wirestock 的商业模式,让不少创作者又喜又忧。喜的是,那些躺在硬盘里无人问津的素材,突然变成了一条生财之道——摄影师 Aaron 在采访中说,他去年通过 Wirestock 的数据合作拿到超过 1.2 万美元的分成,远高于传统图库的零散收益。

忧的则是深层隐忧:当 AI 模型用这些数据学得“像”创作者风格后,是否会反过来抢夺他们的活计?毕竟,AI 生成的内容已经在冲击插画、平面设计甚至视频剪辑市场。创作者参与数据训练,某种意义上是在“给自己未来的竞争对手喂弹药”。

Wirestock 的 CEO 在接受采访时承认这一矛盾,但他给出的答案是:**“我们正在建立一种以知情人同意和市场化定价为基础的秩序,比被动被爬虫席卷好一万倍。”** 这种说法是否成立,取决于分成比例是否公平、创作者是否拥有退出权——以及,AI 最终是否会创造足够多的新岗位来补偿被取代的旧角色。目前来看,这更像是一种“软着陆”实验:让创作者在 AI 浪潮中至少能分到一杯羹,而不是被碾过。

## 商业竞争:数据“中间商”的战国时代

Wirestock 并不孤单。这个赛道正在迅速变得拥挤:**Scale AI** 早已是数据标注领域的巨无霸,但其模式偏“众包标注”,而 Wirestock 强调的是“原生创意数据”;**Shutterstock** 和 **Adobe** 也在推出自己的 AI 训练许可方案,但它们更倾向于卖自家图库的封闭数据;还有一些区块链驱动的去中心化数据市场(如 **Vana**)试图让创作者直接对等交易。

Wirestock 的独特护城河在于**创作者生态的粘性**。它已经积累了超过 200 万注册创作者,这些人习惯于用它进行多平台分发,现在又多了“数据变现”这一新选项。对 AI 实验室来说,与其和分散的个体逐一签约,不如通过 Wirestock 一个接口拿到海量授权数据——这种聚合价值很难被短期复制。

## 未来:AI 训练数据可能变成“订阅制”

这笔融资释放的另一个信号是:**优质训练数据正在从“一次性买卖”走向“持续性服务”**。Wirestock 计划在其平台上推出“动态数据集”产品——即随着创作者每天上传新作品,数据集会持续更新,AI 实验室可以按月订阅。“模型需要不断学习新事物,比如 2026 年的时装趋势、街头文化变迁、气候变化纪实,” Wirestock 的 CTO 解释道,“静态数据集只能教出过时的模型。”

如果这种订阅模式落地,意味着 AI 训练数据的商业模式将彻底改变:不再是“挖一吨矿石炼完就扔”,而是像灌溉农田一样,需要持续的、多元的水源。这对 Wirestock 的估值逻辑也是重大利好——ARR(年度经常性收入)的故事永远比一次性数字性感。

## 结语:数据民主化的一小步,AI 生态的一大步

Wirestock 的 2300 万美元,本质上是一笔押注于“数据供应链专业化”的赌注。它试图回答一个根本问题:当 AI 需要全世界创意者的劳动成果来滋养时,我们能否建立一套既尊重个体创作者权益、又满足技术发展速度的交易体系?

现在说成功还为时过早。但至少,它提供了一条比“爬虫—诉讼—和解”更体面的路径。对创作者而言,这是一个将作品变成“数据矿藏”的机会;对 AI 实验室而言,这是一个拿到合规、高质量多模态训练数据的捷径;对整个行业而言,这可能是从野蛮生长走向规则重建的开始。

数据是新的石油,而 Wirestock 正在试图成为那个既开矿又修管道的服务商。至于最终是共赢还是新殖民主义,时间会给出答案。但我们至少可以说:**在 AI 的饕餮盛宴上,终于有人开始给厨师发工资了。**

配图

← Startup Battlefield 200 申请进入倒计时:为什么这可能是你今年最重要的一次点击? 思科裁员4000人:一场“断臂求生”式的AI豪赌,换来历史最高营收 →

暂无评论