前几天有个做科研的朋友跟我吐槽,说他在网上搜了半天“cnrds数据库”,结果出来一堆乱七八糟的教程,要么是英文看不懂,要么是操作步骤跳来跳去,他干脆放弃了。这事儿让我挺有感触。cnrds全称是中国自然资源数据库,听起来挺高大上,但说白了就是官方整理好的资源数据合集,包括土地、气候、水资源、植被等,搞地理、生态、农业研究的人经常要用。可问题是,它的入口藏得有点深,界面也像十年前的网站,很多人一打开就蒙了。今天就跟你聊聊这玩意儿到底怎么用,顺便分享几个我自己踩过的坑。

先说说怎么找到它。别去百度搜“cnrds”,那会跳出一堆广告和盗版链接。正确的姿势是直接输入网址,这是中国科学院地理科学与资源研究所的官方平台。进去后你会看到一个很朴素的首页,左边是分类导航,右边是搜索框。我第一次用的时候愣是没找到入口,后来才发现要先点右上角的“注册”按钮,用邮箱或手机号注册一个账号。这里有个坑:验证码经常发不成功,尤其是163邮箱,建议用QQ邮箱或直接手机号注册。注册完登录,首页上“数据资源”的标签页才是正经入口。
进去后,你会看到数据分成了十几个大类,比如土地利用、气象气候、土壤植被、地形地貌等。每个大类点开还有子类,例如土地利用下面又分全国土地利用数据、城市土地利用数据、重点区域数据。这里有个窍门:别直接点大类,因为下面数据太多,找起来像大海捞针。最好先用搜索框,比如想找“黄河流域的土壤数据”,直接搜“黄河流域 土壤”,系统会过滤出相关数据集。我试过,比翻目录快三倍。不过要注意,搜索框不支持模糊搜索,关键词要尽量精确,例如“土壤”不要写成“土质”。
下载数据时,你会遇到第二个坑:数据格式。cnrds大部分数据是栅格格式,如GeoTIFF、GRID,也有矢量格式的Shapefile。如果你不是搞遥感的,可能连这些格式都没听过。举个例子,你下载了一个土地利用的GeoTIFF文件,用普通图片软件打开是黑的,因为那是多波段数据。正确的打开方式是用ArcGIS或QGIS这类专业软件。没有软件的话,有个取巧的办法:用在线平台,比如Google Earth Engine,直接把文件拖进去就能看。但如果你只是想看个大概,我建议选那些Excel或CSV格式的数据,虽然精度低一点,但打开方便。
还有个容易忽略的细节是数据的时间范围。cnrds的数据跨度很大,从上世纪八十年代到现在都有。比如土地利用数据每隔五年更新一次,但不同区域的更新频率不一样。你搜“北京 土地利用”,可能出现的是2015年的数据,实际最新是2020年的。这时要手动筛选“数据年份”这个参数。我吃过一次亏:做论文需要2018年的耕地数据,下载了2015年的凑合用,结果被导师打回来重做。所以一定记得在下载前确认时间戳,页面右下角有个“数据说明”的链接,点开能看到具体的采集时间和更新日志。
讲完基础操作,再聊聊数据权限的问题。cnrds大部分数据是免费的,但有些高精度数据需要申请。比如30米分辨率的全球地表覆盖数据,点“下载”会弹出申请表单,要填写单位、用途、项目名称。别嫌麻烦,填“科研教学”基本都能通过,审核大概1‑2个工作日。但有个例外:涉及国家安全的数据,例如1:1万的地形图,普通用户根本下不了。这时别硬刚,去国家地理信息公共服务平台找替代数据。另外,下载时注意流量限制,免费用户每天最多下500 MB,超过就要等第二天。如果要下几十GB的大数据,建议用他们的FTP服务,那个不限速。
在使用过程中,我摸索出几个省力的技巧。比如数据预览功能:在数据集页面点“预览”,系统会生成一张缩略图,能大致看到覆盖范围和分类情况,省得下载后才发现不对。还有“数据目录”功能,可以按省份、流域、生态系统来筛选。比如想研究长江中下游的湖泊变化,直接选“流域”下的“长江流域”,再选“湖泊湿地”,系统会帮你整理好相关数据。这个功能藏得比较深,在首页的“专题服务”栏目里,很多人不知道。
说到专题服务,cnrds其实还提供一些实用的工具。比如“数据在线分析”,可以直接在网页上做简单统计,不用下载数据。我试过用它算某区域的耕地面积变化率,选了2000年和2020年的土地利用数据,系统自动算出转化矩阵,还能导出图表。虽然功能比不上专业软件,但胜在方便,尤其适合快速验证猜想。还有“数据关联”功能,能把不同类型的数据叠在一起。比如把气候数据和土壤数据叠加,看降水对土壤侵蚀的影响,这在ArcGIS里要做好几步,cnrds直接帮你完成。
说到数据质量,cnrds的数据来源主要是国家科技基础条件平台,权威性有保证,但也不是百分百完美。有些老数据分辨率很低,例如上世纪八十年代的土壤数据,可能只有1 公里网格,直接用于现在的研究误差会很大。还有坐标系统的问题,部分数据使用北京54坐标系,而不是现在通用的WGS84。如果要做空间分析,必须先进行坐标转换,否则结果会偏移几公里。我建议下载后先用QGIS检查元数据,页面上的“元数据”文件会写清楚坐标信息。如果发现问题,可以直接给cnrds客服发邮件,他们回复挺快,一般两天内会给出解决方案。
写这篇文章时,我特意回想了自己第一次使用cnrds的经历。当时觉得这个数据库又老又难用,但熟悉后才发现它其实是个宝藏,尤其是那些独家的长期跟踪数据,别的地方根本找不到。所以如果你刚开始接触,别被界面吓到,多试几次就会习惯。提醒一句:下载数据时注意版权声明,有些数据虽然免费,但发表论文时要注明出处,否则可能被认定为学术不端。说到底,工具是死的,人是活的,摸透这些细节,cnrds就能成为你研究路上的好帮手。


