为了在地球上的物种灭绝之前对其进行记录,研究人员和公民科学家已经收集了数十亿条记录。大多数记录要么来自博物馆中的物理标本,要么来自数字实地观察,但两者都可用于检测一个地区物种数量和丰度的变化。然而,斯坦福大学的一项新研究发现,这两种记录类型都有缺陷,它们充斥着覆盖差距和偏见的程度取决于数据集的类型。
早在查尔斯·达尔文的时代,直到最近,博物学家通过收集和保存一个地区的植物、昆虫、鱼类、鸟类和其他动物的样本来记录一个地区的物种,以供博物馆和教育收藏。今天,大多数生物多样性记录通常以照片,视频,GPS坐标和其他数字记录的形式出现,没有相应的物理样本,它们在博物馆或植物标本馆中代表的生物体。
“随着技术的兴起,人们很容易借助移动应用程序观察不同的物种,”斯坦福大学人文与科学学院生物学助理教授Barnabas Daru说。
例如,如果有人发现了一只有吸引力的蝴蝶或植物,他们可以通过拍照并将其上传到生物多样性应用程序来轻松记录它,其中包含物种名称、位置、日期和时间等详细信息。这些信息成为有价值的现场观察。
“这些观察结果现在超过了来自物理标本的主要数据,”该研究的主要作者Daru说,该研究于1月<>日发表在Nature Ecology & Evolution上。“由于我们越来越多地使用观测数据来调查物种如何应对全球变化,我想知道:这些数据可用吗?”
虽然其他研究探讨了生物多样性数据的全球覆盖率和偏差,但这是首次已知的对样本与观测记录在多个维度上的覆盖率差距和偏差的全球评估。
数字博物馆
Daru和合著者Jordan Rodriguez使用包含1亿条陆生植物,蝴蝶,两栖动物,鸟类,爬行动物和哺乳动物记录的全球数据集,测试了每种类型的数据在分类学,地理,时间和功能特征轴上捕获实际全球生物多样性模式的能力。
“我们对探索倾向于偏向数据的采样方面特别感兴趣,比如公民科学家更有可能捕获开花植物而不是旁边的草,”俄勒冈大学研究生罗德里格斯说,他开始与德克萨斯A&M-Corpus Christi的Daru合作本科生。
例如,为了测试分类空间中实际生物多样性模式的覆盖率,他们将不同大小(50、100、200、400、800和1600公里)的网格覆盖在世界数字地图上。在每个网格单元内,对于每个科(例如,鸭子,鹅和水禽是一个鸟类“家族”),他们根据专家意见评估了记录的物种数量与该地区或家族的预期物种数量相比。
如果每个数据点是随机收集的,则通过将网格单元的标本和观察值的数量与预期数量进行比较来评估数据收集中的偏差。
他们的研究表明,仅观察记录的过多并没有导致更好的全球覆盖。此外,这些数据是有偏见的,有利于某些地区(北美和欧洲)、时间段和生物体。
这是有道理的,因为在移动设备上捕获观测生物多样性数据的人通常是公民科学家,记录了与附近地区物种的偶然相遇,例如路边、远足径、社区公园和社区。
观测数据也偏向于某些具有吸引力或引人注目特征的生物。
“人们一直在践踏蚂蚁,但如果大象在街上漫步,每个人都想知道发生了什么,”达鲁说。
相比之下,保存标本的收集者通常是训练有素的专业人员,他们在偏远和荒野地区收集植物、动物和其他生物的样本,作为工作的一部分。
有偏见,但仍然有用
我们能用两个有缺陷的生物多样性数据集做什么?相当多,达鲁解释道。
了解生物多样性标本和观测数据集不足的地区以及它们之间的比较,可以帮助研究人员和公民科学家改进未来收集的生物多样性数据。
“我们的采样偏差和差距地图可以纳入越来越多的新生物多样性工具,如iNaturalist或eBird,”达鲁说。“这可以指导用户,这样他们就不会在过度采样的区域收集更多记录,并将用户引导到采样不佳的地方甚至物种。所以,我设想了一个你可以使用的应用程序,有点像Pokémon GO来搜索稀有物种。
Daru解释说,为了提高观测数据的质量,生物多样性应用程序可以提示收集者让专家验证他们上传的图像的识别。
另一方面,保存的标本正变得越来越稀缺,这项研究强调了它们对生物多样性研究的持久价值。为了进一步强调这种逐渐减弱的做法的潜力,研究人员还解释了这些标本对于可能出现的新研究路线的重要性,例如研究微生物共生体和需要过去和现在物理标本的新兴疾病。
“这是一个非常有用的资源,一直躺在全球各地的橱柜里,”达鲁说。“用这些标本做一些事情的可能性是如此令人兴奋。