发表于2024-12-22
中国工程科技知识中心元数据规范(1) pdf epub mobi txt 电子书 下载
由中国工程院承担建设的中国工程科技知识中心,是经国家批准建设的国家工程科技领域公益性、开放式的知识资源集成和服务平台建设项目,是国家信息化建设的重要组成部分,旨在为国家工程科技领域重大决策、重大工程科技活动、企业创新与人才培养等提供科技大数据支撑和专业化知识服务,助推国家科技创新驱动发展战略。
自2012年该项目启动建设5年来,中国工程科技知识中心已建立化工、农业、医药、能源和卫生等近30个专业知识服务分中心系统,通过自建、联盟、采购、网络开放获取等方式,汇聚了二十多个主题领域的资源,包括文献、数值数据、工具(事实)、行业报告和政策法规等,资源总量超过44亿条,数据容量达到84TB,资源建设初具规模,实现了工程科技领域各类数据汇集的重大突破。
为建成中国工程科技领域的“元数据海”,元数据标准规范至关重要。为此,项目组提出要在参考借鉴国内外标准规范基础上,研究构建一套与知识中心建设目标相一致的元数据标准规范,以此指导和规范中国工程科技知识中心各类数字资源元数据汇交、元搜索服务和系统互操作,从根本上实现工程科技全领域资源的汇聚打通和互联互通,实现海量资源一站式、全方位搜索和发现服务。
《中国工程科技知识中心元数据规范(1)》编写组在广泛调研和参考国内外大量元数据标准规范基础上,经过多层次、多方面的专题研讨与专家咨询,并广泛向参建分中心、技术研究中心和平台组征求意见,经过多轮修订完善,建立了一套具有较好适用性、实用性和可扩展性的中国工程科技知识中心元数据标准规范。
1 引言
2 编制范围
3 编制思路及原则
3.1 编制思路
3.2 编制原则
4 引用文件
5 术语和定义
5.1 元数据
5.2 元素
5.3 属性
5.4 容器类元素
5.5 通用容器
5.6 编码体系
5.7 数据集
5.8 期刊
5.9 图书
5.10 期刊论文
5.11 会议论文
5.12 学位论文
5.13 专家学者
5.14 科技机构
5.15 科研项目
5.16 科技成果
5.17 专利
5.18 标准
5.19 产业政策
5.20 新闻资讯
5.21 图片
6 领域资源关联模型
7 元数据描述框架
8 通用容器描述规范
8.1 管理通用容器描述规范
8.2 主题通用容器描述规范
8.3 责任者通用容器描述规范
8.4 责任机构通用容器描述规范
8.5 国别(地区)通用容器描述规范
8.6 会议通用容器描述规范
8.7 收录类别通用容器描述规范
8.8 基金项目通用容器描述规范
8.9 成果产出通用容器描述规范
8.10 参考文献通用容器描述规范
8.11 附件通用容器描述规范
8.12 扩展通用容器描述规范
9 数据集元素集描述规范
9.1 内容结构
9.2 描述细则
10 资源元素集描述规范
10.1 期刊元素集描述规范
10.2 图书元素集描述规范
10.3 期刊论文元素集描述规范
10.4 会议论文元素集描述规范
10.5 学位论文元素集描述规范
10.6 专家学者元素集描述规范
10.7 科技机构元素集描述规范
10.8 科研项目元素集描述规范
10.9 科技成果元素集描述规范
10.10 专利元素集描述规范
10.11 标准元素集描述规范
10.12 产业政策元素集描述规范
10.13 新闻资讯元素集描述规范
10.14 图片元素集描述规范
附录
附录1 元数据规范编码体系
附录2 XMLSchema典型示例
1引言
为指导和规范中国工程科技知识中心(以下简称:知识中心)各类数字资源元数据汇交、元搜索服务、资源集成整合和系统间互操作,从根本上实现知识中心资源的汇聚打通,迫切需要建立一系列与知识中心建设目标相适应的元数据标准规范。
元数据(Metadata)是描述数据的数据,即根据特定的目的定义描述规则来描述特定类型的资源,是对数据进行组织和管理的基础。利用元数据对数字化信息资源进行描述、管理、交换和共享,已成为当前数字信息资源建设的重要手段。元数据的开发与应用,倡导遵循标准化、规范化和开放性原则,从而为各类信息管理系统和知识服务系统的互操作和开放性奠定基础。
知识中心标准规范编委会在充分借鉴国际上相关元数据研究应用成果基础上,根据知识中心的应用需求,研究制订了用于知识中心和各分中心相关资源描述、交换、复用、转换、整合和打通要求的元数据规范,有助于进一步规范各类资源的揭示、汇聚和共享服务。
2编制范围
2编制范围
知识中心元数据标准规范是描述知识中心各类资源的元数据标准,是根据各类资源特点确定的元数据集合。基于这些元素实现对各类资源的描述、定位、管理、检索、交互、集成和打通。
《中国工程科技知识中心元数据规范(Ⅰ)》建立了知识中心领域资源关联模型和元数据描述框架,抽象、归纳了管理、主题、责任者、责任机构、国别(地区)、会议、收录类别、基金项目、成果产出、参考文献、附件和扩展共12类通用容器,并对1个数据集元素集和期刊、图书、期刊论文、会议论文、学位论文、专家学者、科技机构、科研项目、科技成果、专利、标准、产业政策、新闻资讯、图片等14类资源,以及23个规范编码体系做了详尽的元数据规范描述和约定。
本标准规范针对各类资源的内容和外观特征进行规定,也针对知识中心各类资源中涉及的共性通用属性进行描述,对于其他未包括在内,以及在应用发展中可能会出现的元素,可在本标准规范框架基础上进行扩展。
3编制思路及原则
3编制思路及原则
3��1编制思路
紧密围绕知识中心总体建设目标和阶段重点建设任务,在梳理知识中心和各专业分中心亟须建设的多类型资源基础上,借鉴和参考国内外相关标准,结合知识中心建设特点进行自定义扩展,同时面向人和计算机多场景应用需求,研究制定知识中心的元数据规范体系。
3��2编制原则
3��2��1模块化
模块化是元数据最重要特征,其关键是根据实际使用需要,将资源对象区分为若干个实体,对资源的描述即是对多个不同实体的组合和描述。本规范是在对知识中心各类资源进行调研分析和综合对比基础上,将其分为通用容器、数据集元素集、资源元素集模块和规范编码体系四个部分。
3��2��2可复用可扩展
支持对通用容器的组装复用,也可在本规范制定的元数据基础基础上,进行相关通用容器和元素集的复用、继承和扩展,支持根据专业特色资源和个性化应用需求,进行其他类型资源元数据规范的扩展。
3��2��3计算机可识别可理解
面向计算机和网络化应用,将元数据规范文本转化为XML Schema形式化描述文件,并基于XML Schema将各类资源元数据转化、封装为XML文件,支持计算机对XML文件的自动识别、理解和验证。
注:本规范对应的XML Schema形式化描述文件及XML样例数据,将单独提供。
4引用文件
4引用文件
本规范广泛借鉴和参考了《都柏林核心元数据元素集》、美国国家生物技术信息中心(NCBI)的JATS、国家科技图书文献中心《NSTL文献资源加工规范》、科技文献书目本体(BIBO)、研究社区语义网本体(SWRC)和可交换图像文件(EXIF)等现有国内外著名的标准规范。
引用的元数据描述标准和规范主要有:
GB/T 25100#2010 信息与文献——都柏林核心元数据元素集
DCMI抽象模型�盵DCMI]
DCMI 元数据术语集�盵DCMI-TERMS]
ISO 639—2 Codes for the representation of names of languages�盇lpha-3code�盵ISO 639—2]
[ISO 639—2]语种名称代码表:3位代码[ISO 639—2]
日期与时间格式,W3C注释[W3CDTF]
www�眞3�眔rg/TR/NOTE-datetime
《NSTL文献资源加工规范》
http://spec�眓stl�眊ov�眂n/specification/namespace
ANSI/NISO Z39��96 Journal Article Tag Suite(JATS)
http://jats�眓lm�眓ih�眊ov/archiving/tag-library/1��0/
书目本体(Bibliographic Ontology,BIBO)
语义网研究社区本体(Semantic Web for Research Communities,SWRC)
可交换图像文件元数据规范(Exchangeable Image File,EXIF)
JEITA CP-3451B,Exif Version 2��3 [S]�盝EITA & CIPA, 2010��
5术语和定义
5术语和定义
本部分内容用于描述本规范的元素属性涉及的术语和定义。
5��1元数据
“元数据”(Metadata)是定义和描述其他数据的数据。[GB/T 1839��1—2009,术语和定义3��2��18]。
5��2元素
“元素”是XML术语,是元数据的基本单元。
5��3属性
“属性”是XML术语,有属性名和属性值,可对元素进行描述、限定、说明。
5��4容器类元素
“容器类元素”是包含其他元素的元素,与其他元素的关系为父子或祖先/后代的关系。
5��5通用容器
“通用容器”是指数据集和其他类型资源元素集中涉及的共性元素,将这些共性元素提取并形成通用集合。
5��5��1管理通用容器
“管理通用容器”是指各类资源的管理性通用信息,侧重于对数据唯一标识、追踪溯源和增量更新,如:资源类型、来源机构、唯一标识符、创建时间和修改时间等。
5��5��2主题通用容器
“主题通用容器”用于描述各类资源中涉及的自由关键词,或经过知识标引和组织后的范畴、学科分类、主题、概念及对应编号,以及描述专家学者、科技机构的研究方向、专业领域和专利的分类号等。
5��5��3责任者通用容器
“责任者通用容器”主要用于描述图书、期刊论文、会议论文、学位论文、标准、专利等各类资源中涉及的作者、著者、编者、导师,以及项目参与者和成果完成人等。
5��5��4责任机构通用容器
“责任机构通用容器”主要用于描述图书、期刊论文、会议论文、学位论文、标准、专利等资源中涉及的出版商、论文作者机构、专家学者工作单位、科技机构上级部门、科研项目资助机构、科技成果完成机构等。
5��5��5国别(地区)通用容器
“国别(地区)通用容器”主要描述各类资源中与国家或地区相关的信息。
5��5��6会议通用容器
“会议通用容器”描述资源中相关联的会议名称、会议日期、会议地点等信息,主要来源于会议论文、期刊论文等资源。
5��5��7收录类别通用容器
“收录类别通用容器”是指期刊、期刊论文、会议论文等资源被SCI、EI、CSCD、核心期刊等收录情况。
5��5��8基金项目通用容器
“基金项目通用容器”是指会议论文、期刊论文、科技成果等资源中接受资助的基金项目等相关信息。
5��5��9成果产出通用容器
“成果产出通用容器”是指专家学者、科技机构、科研项目等资源中描述相关科研成果产出的相关信息。
5��5��10参考文献通用容器
“参考文献通用容器”是描述期刊论文、学位论文、图书、专利等资源中的参考文献信息。
5��5��11附件通用容器
“附件通用容器”是描述与数据集、期刊论文、学位论文、专家学者、专利等各类资源元数据相对应的PDF、图片、压缩文件等附件文件的信息。
5��5��12扩展通用容器
“扩展通用容器”是描述在数据集及各类资源元素集元数据标准中未涉及的元素描述及定义的扩展信息。
5��6编码体系
“编码体系”是元数据修饰的一种方式,用来规范元素或属性取值范围的受控词表或规范名称列表。
5��7数据集
“数据集”是指具有相同或相似数据结构的同类资源数据集合,可以是数据库,也可以是数据库的一个(逻辑)部分。本规范中的数据集是指知识中心中同类资源的数据集合,既包括本规范明确制定元数据规范的图书、期刊论文、专家学者、科技机构、基金项目、产业政策等类型资源,也包括其他未制定元数据标准规范的资源类型(如各类科学数据、统计数据、地图数据等)。来自于不同分中心的同类型资源属于不同数据集。
5��8期刊
“期刊”是指经过同行评审的期刊,发表在期刊上的文章通常涉及特定的学科。期刊展示了研究领域的成果,并起到了公示的作用,其内容主要以原创研究、综述文章、书评等形式的文章为主。
5��9图书
“图书”主要是指由出版社(商)出版的不包括封面和封底在内49页以上的印刷品,具有特定的书名和著者名,编有国际标准书号,有定价并取得版权保护的出版物称为图书。
5��10期刊论文
“期刊论文”是发表在期刊文献上的学术文章(通常不含简介、致谢、编者按、广告等)。除论文内容以外,期刊论文还包含作者姓名、作者所属机构等信息。
5��11会议论文
“会议论文”是指在学术会议上提交的论文,在会议上宣读或交流,而后以印刷版或电子版方式出版,典型的是以会议论文集(会议录)方式出版。
5��12学位论文
“学位论文”是为申请学位而撰写的学术论文,是学位申请者获得学位的必要条件之一。
5��13专家学者
“专家学者”是指取得重要学术成就和有影响力的院士、科学家和科技创新人员等。
5��14科技机构
“科技机构”是以科学研究为目的,以技术服务为目标,有组织、有一定规模、有固定场所的,并有固定工作人员的,符合一定条件的,主要包括科研机构、高等院校、公司企业、行业学/协会等。
5��15科研项目
“科研项目”即开展科学技术研究的一系列独特的、复杂的并相互关联的活动,这些活动有着一个明确的目标或目的,必须在特定的时间、预算、资源限定内,依据规范完成。
5��16科技成果
“科技成果”是指由法定机关(一般指科技行政部门)认可,在一定范围内经实践证明先进、成熟、适用,能取得良好经济、社会或生态环境效益的科学技术成果,其内涵与知识产权和专有技术基本相一致,是无形资产中不可缺少的重要组成部分。
5��17专利
“专利”是指一项获得专利机构批准的发明创造。它是由专利机构依据发明申请所颁发的一种文件。这种文件叙述发明的内容,并且产生一种法律状态,即该获得专利的发明在一般情况下只有得到专利所有人的许可才能利用(包括制造、使用、销售和进口等),专利的保护有时间和地域的限制。
5��18标准
“标准”是为了在一定范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件。它以科学、技术和实践经验的综合成果为基础,经有关方面协商一致,由主管机构批准,以特定形式发布,作为共同遵守的准则和依据。
中国工程科技知识中心元数据规范(1) 电子书 下载 mobi epub pdf txt
中国工程科技知识中心元数据规范(1) pdf epub mobi txt 电子书 下载