万字详解生成式 AI 与 Web3
撰文:Joel John 编译:DeFi 之道
图片来源:由 Maze AI 生成
自 2022 年末 OpenAI 面向公众推出 ChatGPT 以来,人工智能(AI)的热度一直居高不下。圣诞老人来得很早,他给人类带来了一台能回答大多数问题的机器! ChatGPT 是增长到一亿用户用时最快的应用,就像许多由 VC 投资的初创公司一样,它每天都在燃烧数百万美元。
当然,这不再是引起关注的原因,因为微软刚刚决定向 OpenAI 投资 100 亿美元。结合 Azure 和 Bing ,ChatGPT 的受欢迎程度已经跨越了成见鸿沟。
不过,参与竞争的不仅仅是微软。谷歌母公司 alphabet 在其生成型 AI 产品的 demo 搞砸之后,其股票市值损失了 1000 亿美元。此外,阿里巴巴和亚马逊各自宣布加入,旨在和 ChatGPT 争夺 AI 主导地位,而苹果公司很可能会利用 Siri 作为将其 AI 产品推向市场的前沿阵地。
AI 工具的爆炸性增长之所以出现,是因为人们现在可以实际使用 AI 。当 crypto 、无人机或自动驾驶汽车等趋势进入市场时,它们面临着很高的进入壁垒。而你现在可以立即使用 AI 在家庭作业上作弊。今天,ChatGPT 甚至可以让你在 Bumble 上看起来很有吸引力。相比之下,在 crypto 领域,你只能购买 token,并假装它是你个性的全部。
亚瑟·克拉克(Arthur C. Clarke)曾经说过:“任何足够先进的技术,似乎都无法与魔法区分开来。”
AI 已经转变为让足够大的社会群体相信它是魔法。仅在 2022 年第二季度,就有约 170 亿美元的资金被投入到与 AI 相关的公司中。FAANG、VC 以及散户投资者的兴趣结合在一起,这项技术似乎已经准备好吸引大众的关注。
在过去的几周中,我们一直在努力了解该行业正在发生什么,以及未来十年该行业的影响有多大。这篇文章总结了我们对该行业的(有限的)理解,以及为什么我们认为,区块链和 AI 将在未来十年混合在一起。但在我们开始之前,让我们重温一下经济学的一些基础知识。
注:我在整篇文章中在说 AI 模型和模型之间切换。为了便于阅读,文中提到的任何“模型”一词,都是指生成型 AI 模型。
坍塌的稀缺性
我们作为一个物种的故事,是由我们与稀缺的斗争所定义的。据信,人类在数万年前就开始迁徙,以寻找更绿色的牧场。一旦人类学会了利用火和农业的力量,我们的祖先就繁荣了,整个文明就出现了。人类走了很远,开始跨海进行贸易,以确保社会拥有我们需要的资源。
一旦一个文明不再需要担心食物或保护自己免受自然因素的影响,人们就会专注于争夺地位。中国的长城、埃及的金字塔、印度的泰姬陵以及欧洲复兴时期的大教堂,在各自的权利中都是地位象征,这在他们那个时代的社会经济结构中发挥了作用。人类可以进行这些需要数万人和数十年工作的努力,因为我们不再担心本周是否能吃得饱。
当我们过渡到追求地位的社会时,技能和服务变得稀缺。在政治之外,到了14世纪,我们不再为战争英雄喝彩,而是开始更多地崇拜艺人、艺术家和发明家。
想想莎士比亚、米开朗基罗或班克西的作品。这些艺术家有独特的解读世界的方式,需要数十年的文化体验。如果没有足够长的时间深入其中,你就无法创造文化。
稀缺性不再是我们用来维持体力的商品,而是激发我们精神状态的东西。一位“一代中出现一次”的艺术家,需要数十年的时间才能出现,因为产生他们的环境很难模仿。即使上世纪 90 年代,数百人在纽约布朗克斯区也有过同样的生活经历,但只有一个人成为了身价数十亿美元的说唱大亨 Jay-Z。而且很少有人知道这些异常值在哪里或如何出现。
在一个技能稀缺的社会里,杰出的人才会得到高额的报酬。我们经常听到有关在文艺复兴时期从事大教堂工作的艺术家,一次被委任多年。但在过去几个世纪的大部分时间里,经济产出与进入其中的能源是成线性关系的。我们要么燃烧能量(为工厂),要么让人类花费能量来进行生产。
财富的生产,主要取决于你能接触到的人(或资源)的数量。这就是为什么我们在历史上会出现奴隶制等痛苦事件。财富通常依赖征服的线性轨迹上增长。
而代码和服务器改变了 20 世纪的这条道路。突然间,你不再需要入侵遥远的土地,或让人们屈服于你的折磨。正如 Naval 所说,代码和媒体是新的杠杆。编写代码可以让你的机器人大军为你服务,想想 Instagram 或 Tiktok 的例子:
这些平台雇佣的人数往往与用户数量不成正比。你可以通过添加更多硬件来扩展,以支持更多用户。
20 世纪 90 年代初,互联网的出现可能标志着这个富足的时代。例如,垃圾邮件是由于沟通成本崩溃而产生的。Limewire 和 Napster 是数字存储和带宽崩溃的代表。游戏和社交网络是数百万人聚集的数字乡镇,但我们不再关心容纳这些人的“空间”的稀缺性。
只要以数字方式提供服务,满足更多人需求的边际成本就大幅下降。互联网的大部分都可以“自由”访问,这象征着随着我们的世界变得数字化,稀缺作为一个概念是如何逐渐崩溃的。Naval 在下面的视频中解释了这种新发现的“富足”(abundance)。
开发者与文艺复兴时期的熟练工匠相似。他们拥有获得杠杆作用的力量,并为他们的时间构建工具创造巨大的倍数。但这种情况正在慢慢改变。在同一周,微软同时解雇了 10000 名员工,并向 ChatGPT 背后的 OpenAI 投资了 100 亿美元,但很少有人能捕捉到这种鲜明的对比。
我并不是要煽动恐惧,并暗示开发人员很快就会被解雇。不是那样的。但我们将看到一个其他形式的工作被 AI 赋予权力的时代。这就是当今在生成型 AI 领域所发生的事情。
产生富足
在数字消费方面,我们生活在一个丰富的时期,因为分发手段的成本不高。当我写这些话时,我知道将其分配给 1,000 或 100,000 个读者会花费我同样的费用。Substack 不根据观点收费,因为为分发提供动力的基础设施可以快速扩展。因此,尽管我们有渠道将内容分发给更多的人,但由于人类注意力的限制,规模的两端都是稀缺的。
作为一名作者,我受到在一段时间内可以创造多少有意义的输出的限制。而作为一名读者,你只想从我这里读到这么多。
我们看到了诸如 ChatGPT 和生成型 AI 之类的概念的爆炸,因为围绕生产和消费的单位经济正在被破坏。我们上一次有如此深刻的东西,很可能是在印刷机出现的时候。书籍降低了人类思想的存储和传播成本。花了四个世纪后,英国的识字率从 5 %上升到 50 %,而现在人们每天阅读约 2 小时。
智力行为的这种变化直接为启蒙时代提供了动力,这是一个以科学和哲学的快速发展为标志的时期,康德、伏尔泰、勒内·笛卡尔以及亚当·斯密等人永远改变了我们的世界观。每次我们想好如何存储、共享和迭代想法时,我们都会做一些非常酷的事情。无论是洞穴绘画还是谷歌文档。
让我们从理解生成型 AI 今天可以做什么开始,看看它是如何降低生产和消费成本的。当前,诸如 ChatGPT 和 Midjourney 之类的应用可实现一个目的:它们根据已被喂养的数据创建令人信服的输出。而数据通常来自公开中已经可用的内容。
OpenAI 的 ChatGPT 使用来自书籍、维基百科和期刊的数据来创建文本响应。Stable Diffusion 是一种生成型艺术的服务,最初依赖于库存图像。Github 的 Copilot 使用平台上数十亿行代码来帮助开发人员。
本质上,生成型 AI 获取公开可用的信息,对其进行合成,并根据用户上下文对其进行处理。这里的上下文可能是“explain Bitcoin like I am five”,也可以是 “cryptocurrencies raining over Dubai”。 这些 prompt 提示词反过来又在几分钟内创建机器生成的响应。
通常情况下,输出不够令人信服,但经过充分的调整,你最终会得到一些可以用于生产的东西。只要主题是通用的,并且你不期望有个性的元素。
来自红杉资本的生成型 AI 文章
那我们走了多远?红杉博客上面的全景图对时事有很好的展望。AI 模型现在可以进行文本输入,实时编辑和更改音调。图像和代码也是如此。原因是可用于训练生成 AI 模型的大型数据集的可用性。如果我们能够在历史所用时间的一小部分时间内消费和综合多本书中的知识,或者创作艺术,我们将不可避免地达到一个消费太多的地步。对于更复杂的事情,例如编辑电影或音乐,目前仍然需要许多人的参与。但 AI 确实使这一过程变得更加高效。
具有讽刺意味的是,AI 已经被人用来总结和提供大量工作的关键见解。这里的挑战是缺乏归因和可验证的出处。例如,对于没有公共领域信息的特定查询,ChatGPT 可能会给我一个错误的答案。它没有给出用于生成响应的数据的出处。这就是当前形式的生成型 AI 的危险所在。
我们可以创造无限量的作品,而不知道是什么或是谁激发了它。在某个时刻,我们将依靠它来处理这些无限量的内容,并告诉我们其中的重要内容。
过去几周我的Twitter提要是什么
如果没有追踪来源的基础设施或验证 AI 模型的机制,生成型 AI 将模仿当今的互联网。一大堆假新闻由算法驱动,这些算法根据最能留住用户的内容推送内容。虽然生成型 AI 可以让每个人都成为艺术家,但它可能会让那些制作人工智能模型用来训练自己的最初作品的人相形见绌。这将是丰富时代的决定性挑战 —— 当每个人都从中受益时,你如何确保所使用的作品(以艺术、文本或代码的形式)得到有效的归属和商业化?
互联网已经有了这个问题的答案。Instagram 的 Reels 和 Tiktok 等平台非常依赖第三方艺术家的音乐。用户“重新混合”音频剪辑,制作出朗朗上口、时尚而简短的剪辑内容,从舞蹈动作到烹饪,无所不包。Tiktok 发布了 Soundon,以帮助艺术家上传作品并将其货币化。在这些情况下,平台应负责许可和支付版税。当介质通常是相同的(音频曲目)并且分发归你所有时,这是一项简单的任务。
你可能读到这里后,产生了一些厌倦感,这篇文章很长。因此,在我们讨论这篇文章中更复杂的部分之前,请考虑休息一下,看看我最近在 Instagram 上看到的混音。这是一件甜美的艺术作品,而它也是版权律师的噩梦。
这也是一个很好的例子,说明了当数字媒介缩小距离和重新组合作品的成本时,文化是如何“融合”的。
好吧,言归正传……
当多个工作体被平台外的用户进行和重新混合时,动态变化了。还记得我提到过用莎士比亚的风格改写《哈利·波特》吗?鉴于你只是看两个人的作品,这仍然很容易。那如果我们用莎士比亚风格的《权力的游戏》中的情节转折来改写《哈利·波特》呢?是三个人在那里分享版税。
今天,生成型 AI 所面临的挑战是,你正在研究数百人的作品,创建数千个输出,并且没有一个被识别,归因或跟踪。
通常,创建这些工作体不会产生任何成本。我可以在 ChatGPT 上每天运行数百次 prompt 提示词,直到得到符合我需要的响应。如今,社交媒体网络的功能非常强大,类似于赌场老虎机。在这一点上,用户花费数小时来寻找能给他们带来巨大多巴胺冲击的内容。
随着生成型 AI 的出现,我们鼓励人们继续运行 prompt 提示词,直到找到可以通过的输出。但有一种方法可以解决这个问题,那就是强制执行成本。 我们有 NFT 的早期变化。
可验证的真理
自 1970 年代以来,复制粘贴按钮就一直存在。滚动浏览任何千禧一代的 Instagram 标题,你会发现我们在大量使用它们。而一项简单的技术改变了我们对复制的看法,那就是 NFT。
当然,你也可以复制一只无聊猿(BAYC)的图片!但只有一种方式可以拥有它,这通常涉及在获取它时放弃财富。这种拥有独特资产的转变变得可取,即使它可以轻易复制,也是由区块链造成的。区块链使你可以在全球范围内实时验证你是否拥有真正的东西成为可能。
有人可能会说,这项技术并没有太多的实际使用案例。但一旦我们考虑到生成型 AI,这两种工具就会融合在一起。生成型 AI 很快将严重依赖版权。像迪士尼或Netflix这样的大型工作室,拥有我们在童年和青少年时期喜欢的角色的权利。
AI 将使这些工作室能够创建自定义和个性化的变体,通过利用他们最深刻,最珍贵的回忆来与观众交流。如果托尼·史塔克(Tony Stark)可以教孩子数学呢?达斯·维达(Darth Vader)提供约会技巧怎么样?也许这会让我们中的许多人摆脱单身。
当然,工作室可以拥有并发布这些 AI 生成聊天机器人或交互式角色的变体。但是结合区块链,将使他们能够跟踪、验证和索取版税。他们可以建立一个开放的市场,让任何人都可以来构建,而不是将构建的应用限制在工作室中的开发人员可以生产的范围内。实际上,任何持有大量 IP 的公司都可以通过允许衍生作品的工作,向规模化平台过渡。
让我解释一下这意味着什么。想象一下,我决定让林肯公园的切斯特·本宁顿 (Chester Bennington,已故) 阅读我为你写的这篇长文是个好主意,拥有他的 IP 的人和拥有他声音合成版本的工作室很快就会将他的声音授权给我。但这将是一个漫长而费力的过程,涉及到律师以及令人难以置信的大量文书工作。这可能看起来很愚蠢,但整个行业已经在围绕着死去的名人和 IP 在展开。
让我们想象一下,切斯特的声音权是在链上的。它可以被授权给全世界数百人。当然,担心声音可能被滥用是有原因的。也许会有 deep fake 的东西。或者对于已故艺术家可能不想看到他们的声音与之相关的输出。但如果版权定价足够高,进入壁垒将过滤掉大多数不良行为者。
这已经在一个地方发挥作用了,那就是 meme(模因)。我最近在 Instagram 上看到了 Stoa 创始人之一 Raj Kunkolienkar 的一系列帖子。这个家伙用他的图像重新制作了几个流行的 meme(模因),这是一个生成型 AI 所能做的有趣的用例。
Meme 是一种文化,是公有的。有一些尝试将它们制成 NFT。但如果我们要以自己的身份“重塑”文化,我认为需要有可验证的来源。我们应该可以奖励我们使用的 meme(模因)背后的原始面孔。
Raj 是否应该“授权”重新制作这些图像?文化应该货币化吗?我不知道。这家伙可能在周六早上在美丽的果阿闲逛,但似乎有办法做到这一点。
抱歉,Raj - 我只是想找到一种方法来兑现我在 Stoa 的投资。 这算作增值……对吧?
从历史上看,代表超级英雄和游戏角色的 IP 被认为很容易与他们的观众产生共鸣。没有人会觉得人们在动漫展上打扮成蝙蝠侠或达斯维达很奇怪!而且,我们不太可能创造一个世界,在这个世界里,粉丝们要购买许可证才能来打扮成他们最喜欢的角色。
但确实有可能的是,粉丝群的一个子集确实整合了资源,以获得合法翻拍和发布新作品的权利,从而增加原创创作者的想法。
你可能认为这很牵强,但这在 Web3 生态系统中已经成为现实。去年,一个社区在苏富比举办的拍卖会上筹集了 4700 万美元以用于购买美国宪法。尽管竞标失败了,但成千上万的人汇集了他们辛苦赚来的现金来为这项工作做出贡献。该项目最终允许用户申请退款或持有原生代币 $PEOPLE。在撰写本文时,约有 17,000 名用户拥有该代币,目前其市场估值约为 1.4 亿美元。
代币和链上出处使社区能够团结起来获得 IP,这些 IP 可以与 AI 一起使用来创造粉丝创作的艺术衍生品。
这种人类智慧和机器生产的产出的结合已经在大规模发生。
2022 年 6 月,Cosmopolitan 杂志发布了使用 DALL-E 创作的杂志封面。他们在杂志封面上用了达斯·维德 (Darth Vader) 的一个 AI 作品,但选择不出版。
在这种情况下,如果要激活大型社区,剧本将依赖于 DAO。工作室本身发行代表这些权利的链上工具。它可以是社区通过众筹获得的单一 NFT。代币的发行与为获取 IP 所投入的资金成正比。然后, DAO 决定如何管理和处理许可证的使用。
社区可以规定使用许可证所需的 token 的最小数量。创建生成艺术等更复杂的功能可能需要 DAO 投票。DAO 可以通过要求将所述 IP 收入的一部分返还给 DAO 来产生现金流。
由于现有的大型工作室可能对这种风险做法没有足够的胃口,因此接受这种商业模式的可能是新艺术家。这可能看起来有些牵强,但每当我们找到一种新的发行形式或更好地与观众互动的方式时,艺术家都是第一个接受它的人。在过去十年中,Spotify 和 Soundcloud 一直是发现新兴艺术家的决定性工具。在接下来的十年里,艺术家们将通过链上原语和生成音乐来结合金融化,以加速他们的职业生涯。
重新思考堆栈
来自 A16z 的文章《谁拥有生成式 AI 平台》
我想了解生成式 AI 堆栈的哪些部分可能会被破坏,哪些部分已经显示出有意义的增长。上面的图来自 A16z 的《谁拥有生成式 AI 平台》文章,它对过去 18 个月的价值积累具有重要意义。
摘自文章:
“我们观察到,基础设施供应商很可能是迄今为止该市场的最大赢家,占据了整个市场的大部分资金。应用公司的收入增长非常快,但往往在留存率、产品差异化和毛利率方面苦苦挣扎。而大多数模型提供商,尽管对这个市场的存在负有责任,但尚未实现大规模的商业规模。
换言之,创造最大价值的公司(即训练生成式 AI 模型,并将其应用于新应用的公司)并没有获得大部分价值。预测接下来会发生什么,则要困难得多。但我们认为要了解的关键是,堆栈的哪些部分是真正差异化和可防御的。这将对市场结构(即横向与纵向公司发展)和长期价值驱动因素(如利润率和留存率)产生重大影响。到目前为止,我们很难在现有企业的传统护城河之外的任何地方找到结构性防御能力。
”
这篇研究文章表明,尽管多个垂直行业的收入超过 1 亿美元,但人们对盈利能力和留存率存在担忧。没有人知道当基础 AI 模型(如 Stable Diffusion 或 ChatGPT )提供给每个人时,防御能力是什么样子的。而且很难准确预测,一旦这种新奇感消失,用户会坚持多久。
大部分价值捕获发生在硬件和云平台端。AWS、Google Cloud 和 Azure 已经花了几十年时间来完善存储和计算方面的东西,以提供具有合理单位经济效益的大规模硬件。而像 Filecoin、Render 和 Akasha 等参与者已经成为 Web3 领域的等价物。
尽管如此,在目前的形式下,我很难看到众包硬件如何能够击败中心化提供商今天提供的可靠性和规模。根据 A16z 的说法,价值可以在三个地方产生:物理基础设施、AI 模型或应用程序。我们相信,在基于 Web3 的人工智能中,护城河将围绕管理利基用户(通过代币激励)、创建数据流和通过社区参与实现规模化的货币化模型而构建。
我们已经在一些地方看到了这种情况。
利基用户
Numeraire 有一个早期的 MVP,其代币背后的公司向研究人员发布了股票市场上的标准化数据集。然后,研究人员在数据上运行他们专有的 AI 和 ML 模型以返回“信号”。用简单的语言表示的信号,可以衡量他们认为资产价格的趋势。根据发出信号的人所持有的 NMR(原生代币)数量对信号进行加权。
提供虚假信号的用户会被燃烧掉他们的代币。由于这些代币在流动性市场上交易,因此用户不愿意为真实货币发出错误信号。相反,提供准确信号的研究人员会得到回报。随着时间的推移,有效发生的是,你已经使一部分具有准确预测的用户能收集更多 NMR 代币,从而影响公司部署资金的方式。这一切听起来都像是一场闹剧。
通过代币激励的去中心化研究人员群体能否击败市场?事实的确如此。自成立以来,该基金的回报率约为 48%。根据该公司的网站,价值约 5500 万美元的 NMR 代币已奖励给制作了 5000 多个模型的数据科学家。
对于 Numeraire 的例子,数据本身不是专有的。 数据科学家网络对产品有足够的信任度,愿意抵押他们的代币并分享他们模型的输出,这才是有价值的。该网络使用代币激励来创建一个特定的数据科学家社区。就其价值而言,这本身就是一条护城河。
数据流
可以在浏览器或硬件层使用插件来收集、匿名化数据并将数据传递给可以从中受益的第三方。 目前,互联网已经做到了这一点。我们的数据被收集并传递给为我们不需要的东西做广告的公司。
与谷歌或 Facebook 这样的平台垄断不同,这样的系统将依赖于一种协议,该协议将收集的数据的性质标准化并在市场上提供。 公司可以提供好处(例如高级访问权限)以换取愿意共享其数据的用户。 我们在 Pocket 上看到了一个非常早期的变体。
它背后的团队正在创建一个标准化协议,该协议代表其用户构建数据,允许企业要求 Pocket 用户以他们可以轻松使用的形式共享该数据。 用户可以根据解锁的特权选择他们分享的内容。 我们在 Brave Browser 的 BAT 奖励中有一个非常早期的变体。
模型货币化
Web3 原生产品和 AI 交互的另一种方式可能是通过出租 AI 模型。 今天,Ocean Protocol 的市场上提供了一个早期的变体。 在这种情况下,研究团体可以开发 AI 模型,并将其授权给提供硬件和数据的第三方。
部分论点是,在模型是开源的世界中,将没有原语来验证输出的来源。 而将 DAO 或代币等 crypto 经济原语与开源模型相结合,将允许通过其他方式从研究人员投入的工作中创造现金流,同时验证输出的来源。
供应方(AI 模型)通过研究人员的合作进行维护和更新,这些研究人员接收通过租赁 AI 模型产生的部分现金流。在这种情况下,将生成式 AI 模型视为 NFT,将研究人员视为艺术家。它可能适用于数据过于敏感而无法共享的情况,例如医疗保健数据、专有财务数据或用户数据。 我们在 Hugging Face 和 Replicate 等平台上可以看到早期的变体(没有任何 Web3 元素)。
A16z 发布的文章以关于价值累积的相关注释结尾:
今天,生成式 AI 似乎没有任何系统性的护城河。 作为一阶近似,应用程序缺乏强大的产品差异化,因为它们使用相似的模型; 模型面临不明确的长期差异,因为它们是在具有相似架构的相似数据集上训练的; 云提供商缺乏深度的技术差异,因为它们运行相同的 GPU。
生成式 AI 公司有意义差异化的唯一方法,是将所有权和控制权传递给用户。就目前的情况而言,数据通常是众包的。AI 模型是开源的,价值向下流动以支付硬件费用。
激励用户共享数据或 AI 模型可以减少团队的责任和开支。反过来,它可能会导致生成式 AI 平台生成的输出变得更好,同时模型由社区而不是独立的看门人管理。
这似乎有些牵强,但业内团队已经将原语(如 NFT)、版权和生成式 AI 结合起来。 我们看到了 Alethea AI 的早期变化。 但在我们到达那里之前,让你快速了解生成式 AI 同伴世界中正在发生的事情可能是件好事。
生成式 AI DApp
上周二,来自 Not Boring 的 Packy McCormick 发布了一篇关于 Replika 的文章。 这是一篇令人兴奋的读物,揭示了基于 AI 的生成产品的用户在未来几年将面临的问题。 简而言之,Replika 是一款允许人们通过聊天进行浪漫互动的应用程序。 不幸的是,在某些时候为应用程序提供支持的 GPT 模型,决定骚扰用户并将 NSFW 内容发送给 13 岁以下的儿童可能是个好主意。因此,该应用程序的开发人员在匆忙中禁用了该应用中的所有成人内容,以控制事态。
来自 Replika 的 Subreddit 帖子
该应用程序最初承诺提供陪伴和可能的热烈对话。 用户被赋予了一个期望,然后应用交付了它,但突然开发商决定不再继续为用户提供承诺。 对于很多难以与他人互动或在现实世界中建立有意义的联系的用户来说,这是一次有意义的逃避。 但突然之间,这种服务不再存在了。
它代表了生成式 AI 产品的用户在未来几年将面临的挑战。在这些应用程序上花费数小时的人们几乎不拥有其中的任何创意、模型或输入。少数具有先发优势的公司可以通过构建可公开访问的内容而获益匪浅。
它改变了权力动态,有利于发布用户所使用的生成式 AI 模型的公司。 因此,OpenAI 可以开始优先考虑他们投资的公司并阻止竞争。减轻这种风险的一种方法是专注于将模型作为公共产品开源,并将它们作为一个社区进行管理。
Alethea AI 一直致力于实现这一使命,假设你已经创建了一个尖端模型并希望只有 token 用户能够访问它。或者,你可能想要嵌入带有 AI 的 NFT,并将其从无生命的静态资产转变为能够实时对话的交互式智能资产,Alethea 的协议为开发人员和创作者提供了无需许可的访问权限。
这里有一些警告。我们正处于带有生成式 AI 的 2007 年的移动应用时代。任何时候出现一种新的媒介,都需要一段时间才能有更多的人开始发布其变体。人们仍在研究如何为利基垂直市场创建 AI 模型。我很想提供一个生成式 AI 模型,其每周分析链上活动并将其作为 Bored Ape NFT 进行讨论。 但是我缺乏这样做的技能。
就像我们看到从金融科技应用到 DeFi 的逐渐演变一样,将会有一个中心化的、闭源的供应商主导市场的阶段。只有当团队认识到将所有权传递给更大的用户群,才能以中心化公司通常无法实现的方式解锁网络效应和数据源时,我们才会看到更多开源、社区管理的模型。围绕利基生成式 AI 模型形成一个集体,加入集体(或访问 AI 模型)的唯一方法是上传你的数据。 就像流动性挖矿一样,但适用于生成式 AI 的时代。
Alethea 去年展示了它的样子,他们通过苏富比拍卖会发布了一款 iNFT(智能NFT),它以接近 50 万美元的价格售出。这个 NFT 是一种艺术形式,其可以使用 OpenAI 的 GPT-3 与你进行对话。 长期以来,Web3 原生公司已经习惯了在中心化拥有的平台上进行构建的风险。游戏、钱包和交易所通常都是从应用商店中去平台化的。
而依赖 OpenAI 的 NFT 也存在同样的风险。因此,该项目背后的团队开发了名为 CharacterGPT 的 GPT 模型。与你今天在 ChatGPT 上获得的基于文本的回复不同,他们开发的模型能够生成合成语音、面部动画以及个性,但目前这个 CharacterGPT 也是私有和中心化的。
可能的是模型治理的逐渐去中心化。像 Alethea (ALI) 这样的原生代币可以决定模型在特定情况下的响应方式。 这并不一定意味着该模型会避免自我监管。 如果社区成员出于自身利益而工作,他们很可能会推掉会造成很多麻烦的边缘用例。但这仍然是一个更加去中心化的过程。亚当·斯密的无形之手掌控着一切。 即使在技术前沿,我建议 DAO 也可以管理生成式 AI 模型。
Alethea 本身只提供智能合约、CharacterGPT 以及将链上原语(如 NFT )与生成式 AI 连接的协议。人们相信,在某个时候,第三方开发人员会创建 DApp,在其之上提供多种服务。你可以通过基于 Polygon 构建的第三方 dApp 进行尝试——名为 Mycharacter。它可以让你创建一个合成角色,其属性可以被调整并将其铸造为链上 NFT。你可以在此处与 Sandeep Nailwal 的数字化身(他的声音非常准确)交谈。
这个 AI 机器人能以 Sandeep 的声音说话
另一个展示 AI 服务和链上原语如何结合的 dApp 是诺亚方舟(Noah’s Ark),少数预选 NFT 的用户可以使用该产品,并将其作为 AI 角色进行交互。让我解释一下这是如何工作的。用户将他们的 NFT 与平台上的所谓的 pod “融合”。在撰写本文时,每个 pod 在 OpenSea 上的售价为 300 美元。从本质上讲, pod 是 Alethea AI 服务的访问卡。你将一个 pod 与一个 NFT 连接起来,以启用诸如朗诵歌曲或告诉你天气情况等功能。
这些东西目前看起来依旧像是玩具,当然,没有人对整天和 NFT 交谈会感到兴奋。我对消费品使用的基准之一是它是否让我兴奋。我期待着使用我的 PS-VR 设备。但与一个 NFT 机器人进行交谈?可能并没有那么多,这有助于理解创始人正在建设的项目的含义。
Alethea 的主要使命不是单独构建对话界面,就目前的情况而言,实际上大多数 Web2 都是为 OpenAI 收集数据的前端,即使是使用 ChatGPT 或 Stable Diffusion 的用户,也在不知不觉中为其增长做出了贡献,但没有获得任何价值。论点是,我们将看到用户拥有的多种模型在未来出现,并且没有任何协议可以轻松发现它们并将其嵌入现有的链上原语,这就是 Alethea 目前在追求的东西。
但是这样的未来会涉及什么? 要理解这一点,我们需要回到我们开始这篇文章的地方——富足时代的稀缺性。
就像我们在互联网出现时看到的一样,通过种子和 P2P 文件共享,我们将经历一段版权侵犯和混乱的时期。建立一个类似于希特勒的 AI 模型是否合乎道德? 如果第三方开发者使用了工作室拥有的 IP ,版税应该如何分配?在此期间,这将有助于将 IP 权上链。 做这件事的工具现在已经存在了,那就是 NFT。
工作室和创作者都将从中受益。突然间,你有机会从闲置的资产中创造现金流。另一方面,(基于 AI 的生成工具)的创造者可以在不怀疑自己是否违法的情况下扩大规模。Github 的 Copilot 功能可以让你在今天的编码中借助 AI 的帮助。但是,如果你可以复制你最喜欢的开发人员的风格呢? Rick Rubin 对你制作的节拍的输入如何?
有人使用了 Paul Graham 的所有文章来构建一个像他一样回应的机器人。你可以在下面的推文中看到它的演示。
在这种情况下,你如何确保版权访问以及版税支付?
生成式 AI 是关于人类才能的可扩展性。 文本和艺术是我们在该技术周围看到的突出用例,因为它们是训练模型的两种最有记录和最容易获得的工作媒介。随着创建模型的难度和输入模型的复杂性的提高,我们将看到个人发布自己的 AI 服务。这反过来会减少人们回答基本问题的时间。可能是我的 AI 版本向创始人推荐风投基金,或者解释与他人合作的危险。
启用模型所需的智能和知识模式越少,用户访问这些服务的成本就越高。 现实世界以类似的经济学运作,因为你支付过高的保费才能获得越来越小众的提供商的服务,例如专门从事 Web3 的律师或对游戏足够了解的 VC 。
社区 Vs 公司
我经常想知道,为什么 DeFi 在 20 世纪 20 年代初会如此迅猛地发展。事后看来,原因是人们受到了代币等 crypto 经济原语的激励,从而出资并使用这些产品。从历史上看,从事交易或贷款的金融科技公司的资本成本,远远高于发行代币并将其作为奖励的成本。
反过来,将代币用于这些 DeFi 产品的管理,会给人们一种主人翁感。这在一家私营企业中是不容易复制的。当然,你可以通过声称拥有所有权来购买股票并赔钱,但这与通过使用产品获得的所有权不同。
Blur 和 OpenSea 之战的核心是相同的主题,但是在 NFT 的背景下。通过代币激励以及向用户传递治理来外包流动性。Web3 和 AI 发生碰撞的原因也是一样的。
社区将聚集在一起,获取他们所推崇的 DAO 创作者的 IP 权利。迈克·希诺达(Mike Shinoda)和史努比狗狗(Snoop Dogg)等创作者已经成为 Web3 生态系统的一部分。Snoop Dogg 可以使用像诺亚方舟这样的工具将他的声音与他的无聊猿(BAYC)结合。 一旦 IP 被代币化并上链,它就可以嵌入到模型中,而模型又可以从公众那里获取数据。
这可能会让人觉得牵强——但考虑到 Stable Diffusion 是一个开源项目,它现在因使用来自 Getty 的库存图片而遇到麻烦。如果他们决定允许用户上传他们多年来创作的艺术品,以换取模型的治理,这可能会是一个好主意?
数以百万计的创作者本可以在这个过程中不感到麻烦的情况下做出贡献。基于区块链的 Stable Diffusion 可以轻松跟踪谁的作品用于生成图像,并向下载该作品的人收取费用。然后,版税可以与贡献该作品的艺术家分摊。
(我不是在这里播种想法,但这是下一个类似 OpenSea 的机会。一个由艺术家治理的,基于 stable diffusion 的图像网站,如果你正在构建它,请联系我们)
上面的模型分解了它可能看起来的样子。这是 A16z 提出的生成式 AI 堆栈当前外观的混合。Web3 原生 AI 平台可以从众包数据集(如图像)中获益,以换取代币激励。像艺术家一样,贡献者可以分享他们的作品,而这些作品又可以通过返回特定艺术风格的模型运行。
如果进行查询的人决定使用一件作品,他们可以制作一个NFT,显示所使用的模型和其中的数据。这种生成式艺术作品将与过去的 NFT 一样有价值,因为它们的出处是可验证的。
下一个 OpenSea 可能会结合这种形式的生成艺术、提供数据或运行查询的贡献者以及链上原语来证明进入工作主体的组件。 这同样适用于 AI 模型。 维护和优化模型的合作社可以将其出租给用户想要铸造 NFT 的市场。 或者,数百万人使用的大型 AI 模型可以自行开源并作为 DAO 运行。 这使人们能够在如何维护和扩展生成式 AI 工具方面拥有更多发言权。
你可能认为这无关紧要 - 这是一个寻找问题的解决方案。 但是询问 Replika 的用户,他们对在没有咨询他们的情况下在应用程序中做出的产品决策有何看法。
如今,训练这些工具只需要少量数据。因此,最初为创作这些作品做出贡献的艺术家最终可能会变得多余。确保公平结果的一种方法,是根据他们的工作被使用的比例给予他们 token。
想象一下,如果在早期为 OpenSea 的知名度做出贡献的艺术家,能在平台中获得股权或 token 奖励。那么,也许他们就不必像今天这样担心版税了。
我尝试在下面列出 Web2 和 Web3 之间的 AI 方法在哲学上的差异。
Web3 原生 AI 乍一看是一种寻找问题的解决方案。 这就是我过去几个月的想法。但请注意 OpenAI 在过去几个月里是如何演变的。你会明白我们缺乏工具来对抗另一个平台垄断。在代币、 NFT 和链上来源之间,该行业创造了大量的工具集,以应对未来几年我们将看到的大量假新闻和失业。这不再是关于 crypto 的,它是关于执行适当的系统,以避免 AI 产生的胡言乱语造成混乱。
我们需要在 AI 的背景下使用 Web3 的原则,因为它是一项太强大的技术,不能留在少数公司手中。当网络出现时,我们没有工具来验证出处或管理平台垄断,我们大部分时间都花在这上面。现在情况不同了,像 Uniswap 这样的 DeFi 平台已经向我们展示了一个分布式的、社区拥有的去中心化方案可以运行。在我们看到生成式 AI 模型出现相同情况之前,这只是时间的问题。
Joel。
披露:
我是 Pool Data 的投资者——上述公司之一。
Siddharth Jain 是 Alethea AI 的代币持有者。 我们的政策是在文章发布前后三天内不交易文章中提到的任何资产。
AI 是一个新兴主题,其中价值累积没有明确定义。 这些都不是财务建议。 不要用损失不起的资金购买资产。