欢迎来到寰标网! 客服QQ:772084082 加入会员
当前位置: 首页 > 标准详情页

ISO/IEC DIS 23092-5:2020过渡

Information technology — Genomic information representation — Part 5: Conformance

出版:International Organization for Standardization

获取原文 如何获取原文?问客服 获取原文,即可享受本标准状态变更提醒服务!

专家解读视频

基本信息
标准编号: ISO/IEC DIS 23092-5:2020
标准类别:Draft
出版单位:International Organization for Standardization
标准页数:0
标准简介

高通量测序(HTS)技术的出现有可能促进基因组信息在日常实践中的应用,从生物学研究到临床个性化的基因组医学。因此,在过去几年中,生成的数据量急剧增加,预计在不久的将来还会有更显著的增长。 目前,基因组信息主要通过多种数据格式进行交换,如FASTA/FASTQ用于未对齐的测序读取,SAM/BAM/CRAM用于对齐的读取。关于这种格式,ISO/IEC 23092系列为基因组测序信息的表示和压缩提供了一种新的解决方案: ——指定排序数据的抽象表示,而不是直接实现的特定格式。 ——在技术和用例更加成熟的时候被设计。这允许解决文本SAM格式的一个局限性,对于这种局限性,随着时间的推移,会增加一些特别的特性,从而导致总体冗余和次优的格式,同时不会导致一般和不必要的复杂。 ——从标准基因组数据表示中规范地分离没有明确语义的自由域用户定义信息。这允许在不同的数据生产者之间进行完全互操作和自动的信息交换。 ——允许将相关元数据信息与数据复用,因为数据和元数据在不同的概念级别上被划分。 ——在过去的30年里,在数字媒体的传输格式、文件格式、压缩表示和应用程序接口方面,遵循了一个严格的、有监督的开发过程。 本文件提供了使能技术,使社区能够在基因组信息处理领域创建一个新的、可互操作的解决方案生态系统。特别是,它提供: ——致的、通用的和适当设计的格式定义和数据结构,用于存储排序和对齐信息。一个鲁棒的框架,可以作为实现不同压缩算法的基础。 ——通过新设计的数据聚类和优化存储方法,选择性地访问编码数据的速度和灵活性。 -基于实时应用程序域启发的传输协议,数据传输的低延迟和远程位置的快速可用性。 ——内置的隐私和敏感信息的保护,由于一个灵活的框架,允许在数据层次结构的所有层的可定制的,安全的访问。 ——技术的可靠性以及工具和系统之间的互操作性,这是因为提供了一个标准程序,以在详尽的数据集上评估对本文件的符合性。 ——通过提供涵盖ISO/IEC 23092系列全部内容的标准参考实施,支持实现一个完整的兼容设备和应用生态系统。 您可以联系您的国家成员对本国际标准草案发表意见。意见征集于2020年5月3日结束。