High-Quality Life Science Dataset Standards

高质量生命科学数据集标准体系

统一规范、提升可用性、促进共享与复用,打造面向 AI 时代的生命科学数据基础设施。

  • 对标国际
  • 开放共享
  • AI AI 就绪
  • 社区共建

生命科学数据集与技术标准矩阵

标准体系架构

  • 数据模块层 针对不同组学数据指定专用表用
  • 方向模板层 面向四大方向的标准化模板
  • 通用底座层 跨领域通用底层与核心元信息
通用底座、方向模板、数据模块三层结构
  • 可组合复用 模块化设计,按需拼装组合形成解决方案
  • 可扩展 标准化接口,基于业务演进不断扩展
  • AI 赋能 面向不同方向提供智能分析与优化底座

AI-ready数据格式

查看规范详情

高质量数据集采用Croissant元数据组织方式,提升数据的可理解性与机器可读性。

Dataset 模块图标 Dataset 数据集总览
FileSet 模块图标 FileSet 文件集合
RecordSet 模块图标 RecordSet 记录集合
Field 模块图标 Field 字段
Semantic Layer 模块图标 Semantic Layer 语义层