doi-banner
CSTR标识符编码规则

根据国家标准《GB/T32843—2016科技资源标识》,标识符由中国科技资源代号(以下简称“标识代号”)、注册机构代码、类型代码和内部标识符(以下简称“内部代码”)四部分组成。科技资源标识符编码结构见下图。

科技资源标识符编码结构示意图

通用规则

一个标识符应对应唯一一个科技资源实体,如一个数据集、一台科研仪器、一个生物种质资源等。标识符一经确定,永久不变,且标识符所对应的科技资源应保持不变。

中国科技资源代号与科技资源标识注册机构代码之间用半角符号“:”分隔, 其余各部分之间用半角符号“.”进行分隔,分隔符应统一采用半角字符,其他字符应采用UTF-8编码字符集,取值范围为A-Z、a-z、0-9,不区分大小写。

标识代号

标识代号是纳入标识体系的所有科技资源的统一代号,采用中国科技资源的英文缩写“CSTR”表示。

注册机构代码

注册机构代码是标识主管机构为通过审核的标识注册机构分配的唯一代码,长度为5位半角字符,取值范围为A-Z、a-z、0-9,不区分大小写。

示例:标识注册机构代码可为数字型或数字字母型,如11101或21GED。

类型代码

类型代码按科技资源分类标识,见下表。

科技资源类型代码表

内部代码

编码规则

内部代码由字母、数字、分隔符的不定长组合表示,一般最大长度不超过50个字符,应尽量简短明了。应确保在同一科技资源标识注册机构注册的每个科技资源具有唯一一个内部代码。

内部代码可采用层级编码方式、项目类型编码方式等,也可根据实际需求采用其他自定义编码方式。内部代码编码方案需具有可持续性和可扩展性。在内部代码中,可通过分隔符半角符号“.”隔开的多个字符串来反映等级信息或粒度层次。

编码示例

示例1:

采用层级编码方式为2019年2月1日注册的数据集标识内部代码如下:

CSTR: XXXXX.11.gscloud.ds.20190201.0032

其中,“gscloud.ds.20190201.0032”为内部代码,“gscloud”为该数据集名称,“ds”表示数据集,“20190201”为该数据集注册日期,“0032”为该数据集序列号。

示例2:

采用项目类型编码方式为某国家自然科学基金项目支持的于2020年5月1日注册的数据集标识内部代码如下:

CSTR:XXXXX.11.NSFC.db.20200501.0012

其中,“NSFC.db.20200501.0012”为内部代码,“NSFC”为国家自然科学基金项目代码,“db”表示数据库,“20200501”为该数据集注册日期,“0012”为该数据集序列号。

示例3:

采用自定义编码方式为某数据集标识内部代码如下:

CSTR:XXXXX.11.1.xifaljfiauw

其中,“1.xifaljfiauw”为内部代码,“1”为版本号,“xifaljfiauw”为该数据集自定义编码。

示例4:

采用自定义编码方式为某植物种质资源标识内部代码如下:

CSTR:XXXXX.08.snl01

其中,“snl01”为内部代码,为该资源自定义编码。