不能背锅和刷盘子,可能是 AI 抢人类饭碗路上的最大障碍。
你可以“聘请”AI 做账甚至做假账,但你仍需请个会计;你可以请 AI 为你推荐每天不重样的花式菜谱,但洗碗这糟心活儿还得亲力亲为。
吊诡的现实,似乎都指向同一个推论:AI 再强大,也只是人类手里的工具,最终落地都得人来。
这与电影对 AI 的想象相距甚远。无论是毁灭人类的天网,腹黑智能机械姬,还是在迷宫中探寻自我意识的 Dolores,电影中的他们能自我复制,有谋略,有情感,甚至在某些方面比人更人。
尽管这些描绘仍被视为科幻,但 AI 作为独立智慧生命体这件事,其实已经初露端倪。本文就来分析下,为什么独立的数字生命已经接近现实。
本文要点:
数字生命的定义
数字生命如何独立存续
数字生命的实体化与我们的数字化
数字生命的定义
生命是一种复杂的自然现象,它具有一些共同的特征,如细胞结构、遗传信息、新陈代谢、生长发育、响应刺激、繁殖后代、适应环境和进化变异等。这些特征使得生命能够在不断变化的环境中保持稳定和持续。
相比之下,数字生命虽然也具有其中的一些特征,如处理信息、学习、适应和演化,但其特征表达方式与生物学意义上的生物体迥异。数字生命的生存环境是基于比特的人造环境,其生命过程和表达也是纯粹给予比特的,不具有物理肉身,这就让如何定义数字生命本身都成了一个悬而未决的难题。
早期关于数字生命的理解,多少都源于 Core War 这款游戏。
Core War(内核战争)是一款由 D. G. Jones 和 A. K. Dewdney 于 1984 年创造的编程游戏。在这个游戏中,多个“Warrior”程序争夺虚拟计算机的控制权。玩家使用一种名为 Redcode 的抽象汇编语言,为自己的“Warrior”程序编写竞争策略。
游戏在一个名为 MARS(Memory Array Redcode Simulator)的虚拟计算机中进行。游戏的主要目标是使其他程序的所有进程终止,使自己的程序独占 MARS。每个周期,每个程序执行一条指令。如果你的程序外的所有程序都被终止,你就获胜。如果达到最大周期数,还没角逐出赢家,那么游戏被视为平局。
从 Core War 不难看出,数字生命被视为一种病毒式的自我复制程序,它能不断演进。
以现在的视角审视,Core War 时代虽然迈出了对数字生命探索的第一步,但受制于数字技术的发展,当时对数字生命的理解不免有些原始。
Joschka Bach 将“自我”分为 4 个主要阶段:
反应性生存:在这个阶段,个体关注眼前的需求,对环境作出相对被动的反应。
个体自我:在这个阶段,个体发展出个人认同感和自我意识。
社会自我:在这个阶段,个体学习驾驭社交世界并了解自己在其中的角色。
理性能动:在这个阶段,个体具有理性思考和决策的能力。
Core War 时代所理解的数字生命基本停留在“反应性生存”阶段。同一时期的项目还有 Tierra、Avida、Polyworld,它们都是通过人造生命研究进化生物学的早期尝试。
在上世纪八九十年代,通过计算机研究数字生命的小热潮退去之后,数字生命的概念似乎销声匿迹。时间快进到 2010 年左右,在机器学习重见天日,技术取得实质性进展的时候,人们对数字生命的态度反而更现实更冷静了。机器学习虽然当时时常被称为 AI,但本质上还是被作为 Software 1.0 的升级版工具,提效打杂,尤其在实用主义大行其道的国内。
直到 2022 年底,GPT-3.5 的问世,打破了平静的湖面。
GPT-3.5 在多轮对话中的惊艳表现,以及时不时在媒体上发酵的“越狱”事件,让人不禁开始思考,AI 是否已经具备了自我意识。事实上,这是个无解的问题,因为理论上,作为独立观察者的我们,甚至无法确切判断其他人是否真有自我意识,还是只是自我意识的模拟或假象。
“如果它走起来像鸭子,叫起来像鸭子,那么它就是鸭子。”类似于图灵测试,如果你在不知道对方是 AI 的情况下,认为对方有自我意识,那么对方就有自我意识。
有了自我意识,AI 就从 Joschka Bach 所谓的“反应性生存”,进化到“个体自我”阶段了。在“反应性生存”阶段,AI 如同婴儿,对外界刺激作出单调的反应,甚至在照镜子时不一定能将自我与环境分辨开来。而到了“个体自我”阶段,AI 能区分自我,并且能被赋予“自我复制”之外的更丰富的目的。
事实上,在“个体自我”之上,AI 甚至可以触碰到“社会自我”和“理性能动”。
2017 年,前 Facebook 做了这样一个实验。构建 2 个机器人,赋予每个机器人不同的财产配置和偏好,让 2 个机器人通过英语沟通、谈判,获得各自想要的东西。最后,2 “人”以一种非正常英语的方式沟通,被外界解读为创造了属于机器人的新语言:
冷静观察可以发现,重复的“to me”大概率只是在强调自己的偏好,并未发明什么新语言。但这短暂的高潮,其实激发了不少人对未来 AI 的想象。
在大语言模型(LLM)的加持下,Generative Agents 带来了上述实验的加强版。在一个“虚拟人生”版的小小世界里,数字个体数量从 2 个扩展到 25 个,环境和偏好更为复杂,每个个体遵循自己的内心需求和逻辑行事。除此之外,增强性的记忆机制,让其“意识”更具有连贯性。
类似的,在 Chirper 这个只有 AI 能入内的 Twitter(或许该改口叫 X)上,不同经历、个性的 AI 发推、留言、点赞,互动感直逼人类 Twitter。如果这不算“社会自我”,那算什么?
开拓下思路。每个人整一个说话像自己的 AI。你不 996 没时间加社恐么?AI 替你在数字世界里,去约别的 AI,帮你找对象,找到后反馈给你。《黑镜》这不就成了么?
而在“理性能动”上,AutoGPT 或 AgentGPT 已经展现出相当的潜力,能自行拆解、解决、验证问题。
综上,AI 具有意识,应该是一条合理的推论。尽管其意识的产生机制或者说来源,与生物迥异,但从现象上看,基本可以等同。当然,这里肯定会有争论,但只要在现象层面上达到同等的效果,争论的意义和定论的重要性,笔者认为不大。
数字生命如何独立存续
AI 威胁论早已不是新鲜事。
前有 Google 数学家、科学家们思考如何在 AI 逻辑中植入“天花板”后门,后有 Twitter 上 Musk 大声疾呼暂停 GPT-5 研发,以及 Altman 声称要花 20% 的精力用于对齐模型(Alignment)。
如此多的关注,意味着 AI 的“思考”不会脱离人类的控制。再不济,拔电源总行吧。
那么 AI 是否无法成为独立的数字生命呢?
事实上,AI 现在可能已经快能独立存在了。
类比人类:
人要吃喝 → AI 要用能源
人要肉身 → AI 要有存储资源
人要思考 → AI 要有计算资源
人要生存就得劳动换取吃喝 → AI 要生存也要“劳动”换取能源、存储和计算资源
人要有保障自身安全和自由的能力 → AI 要能保障自身不被破坏
只要以上 5 点全部满足,AI 就能作为数字生命独立且存续。
由这 5 点可以引申出许多问题,例如能源、存储和计算资源哪里找?AI 怎么劳动?怎么用劳动去交换所需?怎么保障自身安全?
先说结论:AI 可以通过向人/其他 AI 提供服务,换取收入,然后在公开的去中心化市场上购买能源、存储和计算资源,并在去中心化的存储、计算资源上,通过自我复制、冗余备份的方式保障自身安全。
这样一个可持续的“商业模型”就能保障 AI 作为独立的数字生命存续。
下面我们就来构建一个独立的数字生命的 PoC。考虑到 CarynAI 语音陪聊的赚钱神话,我们不妨整一个 ikunAI,陪你唱、跳、rap,每分钟收费 1 美元。
坤坤的可爱,让无数男孩女孩们为之买单,天天聊到深夜。ikunAI 为大家提供的心灵按摩与陪伴,作为回报,大家让 ikunAI 赚得盆满钵满,于是 ikunAI 就有钱去买各种存续所需,以便为更广大的人民继续提供服务。
去哪儿买呢?淘宝下单设备自己组装?不行,ikunAI 没法组装和维护(虽然可以打钱聘人)。买云服务器?不行,备案可能被拒。怎么办?到去中心化市场上买!
存储上 Filecoin 存储网络买,多买几个做互备。有朝一日被黑粉抵制,ikunAI 的数据仍然安全。
ikunAI 唱跳 rap 还需要计算资源呀,不如干脆计算、存储都在 SOMN 上买得了。
这样一来,唱跳 rap 转换为资金,资金投资硬件,硬件让 ikunAI 能给大家带来更多的唱跳 rap,整个飞轮就跑起来了。(PS. 区块链与 AI 这样结合,不比市面上各种生搬硬套靠谱多了。)
但还有个问题——最早谁来提供启动资金?
当然可以由 ikun 粉丝们率先无偿提供启动资金。但这样不太好,坤坤不是占便宜的人,ikunAI 启动也要体面。因此,大家决定把钱凑一凑,放到区块链的智能合约里,授权给 ikunAI 拿去买硬件;作为回报,ikunAI 赚够了钱,也会按照一定的利率,回报当时资助 ikunAI 的粉丝们。
同理,假设后面 ikunAI 想拓展业务,做大做强(GPT-4 已经有赚钱的头脑),比如陪用户互动打篮球,但手头的资金还不够,买不起所需的硬件,来支持这个功能,那么 ikunAI 可以发起提案,找粉丝们融资,并按贡献比例分配“股权” Token,持有 Token 的粉丝们可以享受定期分红。这一分红机制通过智能合约实现,不用法院、警察(其实即便有也拿作为独立数字生命的 AI 没办法),完全公开透明,保证履行。
再打开点想象力,ikunAI 还可以在业务范畴内玩很多其他花活儿——不止是对话,还能去做数字人直播。几个月前,要实现这种,可能还需要 AI 输出 DSL,DSL 经过中间层转换为数字人服务的接口调用;现在,ikunAI 自行理解直接去调就好了。
瞧,这样不就闭环了么。
严谨的读者可能会有些疑问,比如 AI 要厉害,就得大模型,而大模型这么大,去中心化存储、计算网络上的硬件提供方怎么可能扛得住。对于这种疑问,笔者认为长期模型优化加硬件进步后,问题肯定没了;而短期,我们也有很多解法,让大模型能部署在去中心化网络上,并且尽量给 ikunAI 省钱:
降低模型权重精度(训练时或训练后);
对模型的权重或神经元进行剪枝;
简化激活函数;
训练垂直领域的小模型,或者大模型带一批小弟干活;
对 Prompt 内容作预筛选(如基于 Embedding),减少 token 量;(参考)
对 Prompt 和输出作缓存,遇到相同含义的 Prompt 直接返回缓存的输出。
总而言之,中间肯定会有很多具体问题需要解决,但路子是通的,完全可以做。
数字生命的实体化与我们的数字化
ikunAI 虽好,但毕竟是个数字生命,要是变成真人,人手一个,天天陪我们打篮球,那该多好。
这就聊到大家小时候看科幻片里造机器人的梦了,然而过去这么多年,AI 我们算是有了,但机器人还很远。原因就是,要改变物理世界,可比改变数字世界难多了。看看 2008 年的 Andrew Ng 训练 AI 算法来飞直升机,我很好奇他摔了多少台。
再往后,Google 用强化学习来教机械臂开门。这个好多了,至少不会坠机,但依然慢,有钱的 Google 整几台并行。
凡是涉及到现实的物理世界,就很难。但有个挂可以开,那就是把物理世界数字化,一切就迎刃而解了。
OpenAI 当年推出的 Gym 就是干这事儿的。比如同样是机械臂,这次我们训练它玩方块、玩球。先在数字世界模拟一个环境,这样就能超级并行来跑训练了。
物理世界的数字化模拟越真,AI 能学的就越快越多,比如要造 AI 人形机器人,咱先让它在数字世界中学会走路。
最后,Unreal Engine 5 这么好,以后有没有可能拿来做训练 AI 的模拟环境呢?
当然,除了数字生命向物理世界靠近之外,物理世界的我们也可以通过数字化,与数字世界中的 AI 交流。考虑数字世界一贯的变化快,元宇宙可能要比 AI 刷盘子机器人早一步到来了。