古生物学家与人工智能的较量
捍卫史前真相:人工智能如何威胁古生物学的艺术与准确性
亚历杭德罗·伊斯基尔多·洛佩兹,博士
由Mistral Le Chat创作的人工智能恐龙。有许多错误,但最明显的就是额外的一条腿。五条腿的恐龙有人要吗?
曾经,我问过ChatGPT:人工智能取代古生物学家的可能性有多大? 它的回答是:4/10。
然而,在古生物学界,存在一种恐惧感。在目睹人工智能迅速崛起后,我知道这台机器并没有告诉我全部的真相。
问题不在于人工智能本身,而在于人工智能的误用,令人担忧。如今,人工智能正威胁着古生物学中最古老、最珍贵的群体,甚至彻底扭曲了我们对生物多样性应有的认知。原因如下:
从化石到现实
从化石到现实:奥达拉虫,这是一种生活在5亿年前、现今位于加拿大落基山脉的节肢动物。右侧是古生物艺术家丹妮尔·杜福特的“生命”重建图 ©ROM/Danielle Dufault。
如果没有“生命”重建,古生物学将无从谈起。我们并非仅仅展示一堆骨骼或模糊不清的岩石,而是将我们观察的最终结果呈现给公众:这只动物在生前的模样。
这可不是件容易的事。如何从几块骨头复原出一只完整的动物?又如何从一只被压在岩石上的动物复原出三维结构?
古生物学家经过多年训练,才能将这一过程做到完美,但当是时候将这些知识转化为图纸并画出“活生生”的生物时……我们的艺术天赋可能就没那么出色了。这就是为什么我们需要借助一个非常特殊的群体:古生物艺术家。
古生物艺术家将他们的艺术技巧与基于古生物学家工作的解剖学知识结合在一起。这些艺术家自古生物学学科开始就一直与我们同行。从1853年水晶宫花园的雕像,到1993年的《侏罗纪公园》,没有古生物艺术家,几乎就没有“生命”重建,古生物学的发展历程也将大不相同。
这个群体——无论是专业人士还是业余爱好者——字面意义上让化石动物与古生物学“复活”。他们的作品将古生物学直接带入主流,吸引了投资和成千上万的年轻(以及不那么年轻的人)科学家,这些人曾经玩过恐龙玩具,或翻阅过恐龙插图书。
但现在,古生物艺术家的生计正面临一个竞争对手:人工智能生成的图像。
人工智能:这是什么怪物?
任何人将一只人工智能生成的T-雷克恐龙印在新T恤上是没有问题的(或者我该说T-T恤?)。但是当它被作为专业作品展示时……我们就有问题了。
从科学家的角度来看,人工智能在制作“生命”重建图时并不擅长。让我列举一些我在过去一年中看到的例子,这些例子被实际的研究人员和科学传播者使用,看看它们如何未能正确呈现这些动物:
“生命”重建图,上面的图是人工智能生成的蛇颈龙,下方的图侧是古生物艺术家Hyrotrioskjan创作的图像。下方的不仅更准确,而且将动物置于其实际的古环境中,甚至展示了动物之间的关系,它们正在食用喂养的尸体。
第一个例子是一只蛇颈龙,这是一种生活在恐龙时代的海洋爬行动物。这里有许多错误:比如它的鳍被放在了腹部(而不是尾部附近),鳍的方向错误(这样它就会倒着游泳),还有像流苏一样的牙齿,蛇颈龙从未发现过这样的牙齿。甚至蛇颈龙周围也很奇怪,有些游动的动物(?)完全颠覆了我们对动物王国的认知,更像是萨尔瓦多·达利的作品。
人工智能可能在画猫、画大象方面做得很好……但在画一些不常见(或者在互联网上不流行)的东西时,做得极差,包括一些今天仍然活着的动物。
上面是人工智能生成的弹尾虫(由MidJourney生成),不幸的是,它被发布在一份科普杂志上。下方那一副则是一只真实的弹尾虫,它那具有跳跃尾巴的特征由Stephen Moore拍摄。
我的第二个例子是一只弹尾虫,它是林地底层中最重要的昆虫之一。显然,这里的人工智能没有接触到好的信息。它有10条腿(而不是6条),两对触角(而不是1对),并且没有尾巴(弹尾虫正是靠尾巴进行跳跃的),如果这个人工智能创作的动物是真实的,我们就得重新写关于昆虫进化的书籍。
但人工智能的问题不仅仅是准确性。
我无法与我的聊天机器人对话
2022年,古生物艺术家休戈·萨莱斯帮助我复原“寒武纪的猎犬”,一种像虾/蜈蚣的动物叫Balhuticaris。当我们回顾他的重建时,休戈意识到有些地方不对劲:“这些节段在动物体内是不同的。”
他说道。起初,我并不感到惊讶;这种动物的头部和尾部节段通常较短,但这完全是另一回事。 我仔细测量了Balhuticaris的110个节段,并意识到休戈的眼光是正确的。像虾这样的动物其身体分为不同的节段,每个节段都有不同的功能。Balhuticaris的前15个节段与其他节段不同,这是我们已知的该类动物中最早的身体专业化案例之一。
Balhuticaris的化石,两个个体(一个在上面,另一个在下面)。靠近动物的顶部,虽然模糊,但可以看到它的节段,就像蜈蚣一样!
这个故事仅仅说明了一个概念:使用人工智能,我们失去了一个对话的机会。古生物艺术家和古生物学家之间的对话,每个人在自己的领域都是专家,这种对话推动了新的发现。
它会变得更好吗?人工智能的大数据问题
人工智能能否解决它的准确性问题?甚至能进行一场“对话”,帮助古生物学家进行重建?我认为它做不到……
人工智能依赖于它接收到的数据的数量和质量。即便它能够仅选取好的数据(例如避免使用人工智能生成的图像),现实是,大多数动物,无论是现存的还是灭绝的,都只有很少的图片,甚至没有它们的图像。
像Balhuticaris这样的动物,我们只通过10个化石来了解,成千上万的恐龙和其他动物也仅仅通过几块骨头来了解。如果人工智能目前能够绘制任何图像,那是因为它正在汲取古生物艺术家之前制作的数千幅图像。
即使有大量数据,结果也未必是最好的。以三叶虫为例,这些是地球上最丰富的化石之一。人工智能目前无法创建一个准确的三叶虫图像,更不用说创建某一特定种类的三叶虫,这正是古生物学家或科学传播者所需要的。
上面的图是人工智能生成的“三叶虫”,它与真实的三叶虫没有任何相似之处。下方的则是古生物艺术家Phaulactis重建的极为罕见的三叶虫物种Pandaspinapyga tumida。
什么是真实,什么不是?
此外,已知有近100万种动物,其中许多有公开的图片,我的主要问题是:为什么?为什么我们要用这些来取代自然世界的美丽?
随着越来越多的人工智能生成的动物出现在互联网上,我感觉我们开始侵蚀我们对生物多样性样貌的认知。我一直希望通过展示奇特的动物来提高公众对我们所生活的惊人世界和其中生物的认知。我们大多数人都不知道地球上大多数动物的存在,而与算法抗争以促进它们的展示,极其困难。
现在,我还得与人工智能图像作斗争,这些图像虽然流行,但可能缺乏准确性,缺乏关于动物栖息地甚至进化历史的信息。
我们如何做得更好?
尽管如此,人工智能仍然可以在古生物学研究中发挥作用。专门为古生物重建而设计的人工智能,配备良好的输入数据,或许可以成为经验较少的古生物艺术家的工具。人工智能图像识别可能帮助古生物学家在庞大的博物馆藏品中找到化石,人工智能算法也可能帮助我们进行进化模型的研究,未来时间会证明许多其他应用。
我们必须支持古生物艺术家,但也要走得更远。我们必须促进古生物学图像的获取,许多图像目前受到收费墙或深奥期刊的限制,并公开推广它们。我们需要在社区中保持活跃,反对人工智能的误用,致力于准确性,同时欣赏那些真实存在过或曾经存在过的动物,而非那些从未存在过的。