FASTQ格式

✍ dations ◷ 2025-09-10 10:55:17 #生物信息学,文件格式

FASTQ格式是一种保存生物序列（通常为核酸序列）及其测序质量得分信息的文本格式。序列与质量得分皆由单个ASCII字符表示。

该格式最初由维尔康姆基金会桑格研究所（英语：Wellcome Trust Sanger Institute）开发，旨在将FASTA格式序列及其质量数据集成在一起。而目前，FASTQ格式已经成为了保存高通量测序结果的事实标准。

FASTQ文件中，一个序列通常由四行组成：

以下为一个包含单个序列的FASTQ文件示例：

@SEQ_IDGATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT+!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65

其中!为最低质量、~则为最高质量。以下字符从左到右代表从低到高的质量得分的：

!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ^_`abcdefghijklmnopqrstuvwxyz{|}~

字符与对应的ASCII码如下：

最初桑格研究所的FASTQ格式允许序列与质量信息分成多行保存。但一般不推荐采用这种方式，因为第一、第三行开头的@与+符号同样也可能出现在质量信息中，可能会造成信息提取的困难。

相关

Am5f7 7s22, 8, 18, 32, 25, 8, 2主条目：镅的同位素镅（Americium，台湾译作鋂）是一种放射性超铀元素，符号为Am，原子序为95。镅属于锕系元素，在元素周期表中位于镧系元素铕之下。镅是以
卡车载货汽车，小型的通常称货车，大型的称做卡车。指主要用于运送货物的汽车，有时也指可以牵引其他车辆的汽车，属于商用车辆类别。一般可依造车的重量分为重型和轻型两种。绝大部分货
瓦连京·亚宁瓦连京·拉夫连季耶维奇·亚宁（俄语：Валентин Лаврентьевич Янин，1929年2月6日－2020年2月2日），俄罗斯历史学家，考古学家。1929年生于维亚特卡，在家族悲剧的
生物界生物系统层级关系：生物圈 > 生态系统 > 群落 > 种群 > 个体生物圈（Biosphere）是指地球上所有生态系的统合整体，是地球的一个外层圈，其范围为海平面上下垂直10公里。它包括地球上
2001太空漫游2001太空漫游可以指：
黄明昊黄明昊（Huang Ming-hao，2002年2月19日－），艺名：Justin，浙江温州人，中国大陆男歌手。2017年参加韩国Mnet选秀节目《PRODUCE 101 第二季》，并于2018年4月6日在爱奇艺《偶像练习生》最终
米哈伊尔·普罗霍罗夫米哈伊尔·德米特里耶维奇·普罗霍罗夫（俄语：Михаи́л Дми́триевич Про́хоров；1965年5月3日－）是俄罗斯富豪及从政者。他是美国篮球队布鲁克林篮网的前
卡雷利卡雷利（Kareli），是印度中央邦Narsimhapur县的一个城镇。总人口25035（2001年）。该地2001年总人口25035人，其中男性13170人，女性11865人；0—6岁人口3354人，其中男1796人，女1558人；识字率7
广东体育职业技术学院广东体育职业技术学院，简称广东体育职院，位于广东省广州市，学校代码:12578。广东体育职业技术学院创建于1956年8月，前身是广东省体育运动学校。2003年5月经广东省人民政府批准，升
思练河思练河，位于中国广西壮族自治区中部，是北之江（青水河）右岸支流，发源于忻城县大塘镇木林村东北，向南流经思练镇，在思练镇石龙村转东流，进入来宾市兴宾区，转东南流，至七洞乡春归村以东注