教学文库网 - 权威文档分享云平台
您的当前位置:首页 > 文库大全 > 外语考试 >

生物序列的数据库信息检索

来源:网络收集 时间:2026-04-15
导读: 生物信息学第五章:生物序列的数据库信息检索 本章内容提要 1,序列数据库 2,功能数据库 3,检索系统 4,双序列Blast比对实例 5,序列数据信息检索实例 1, 序列数据库 核酸序列数据库 国际三大核酸序列数据库:GenBank, EBML, DDBJ RefSeq: The Reference Sequen

生物信息学第五章:生物序列的数据库信息检索

本章内容提要 1,序列数据库

2,功能数据库 3,检索系统

4,双序列Blast比对实例 5,序列数据信息检索实例

1, 序列数据库 核酸序列数据库 国际三大核酸序列数据库:GenBank, EBML, DDBJ

RefSeq: The Reference Sequence Database dbEST: Expressed Sequences Tags数据库 UniGene等

蛋白质序列数据库 UniProt (Swiss-prot & TrEMBL, PIR)

基因组数据库: Ensembl

NCBI数据资源

Nucleotide: 核酸序列数据库 PubMed: 生物医学科学文摘数据库 GEO:基因表达谱数据库。收集存储微阵列基因 表达数据 Protein: 蛋白质序列数据库 SNP: 单核苷酸多态性数据库 Taxonomy: 物种分类学数据库 Gene: 基因数据库。提供序列及基因描述信息 Structure: 大分子三维结构数据库 3D Domains: 特定功能域的三维结构数据库 UniGene: GenBank分离的非冗余基因簇。包含 已确定基因和EST。每个簇包含唯一的非冗余的 基因序列、表达的组织类型和基因图谱位点。

UniSTS: 序列标签位点数据库,用于作图位点 PopSet: 人口研究数据库 Books: 在线生物医学图书数据库 OMIM: 在线人类孟德尔遗传目录数据库 Conserved Domains: 保守结构域数据库 Cancer Chromosomes: 癌症染色体数据库 Homologene: 基因同源物数据库 Journals: 杂志及出版社信息数据库 Genome: 基因组数据库,提供完成的基因组/染色 体图形 GDS: GEO的基因表达实验与生物芯片数值结果数 据库

NCBI主要基因序列数据库 GenBank:包含了所有已知的核酸序列和蛋白质 序列,以及与它们相关的文献著作和生物学注释。 其数据直接来源于测序工作者提交的序列,为原始 数据积累的开放数据库,数据可能存在重复以及不 准确。 UniGene:对核酸序列数据库的数据进行适当处理 ,剔除冗余部分后,同一基因包括表达序列标签的 序列簇,多用于研究基因的转录图谱。 RefSeq:提供非冗余的,高质量的,经检验校正 的序列信息;包括染色体、基因组(细胞器、病毒、 质粒)、蛋白质、RNA等。

Nucleotide database including GenBank, RefSeq, TPA and PDB. Genome, gene and transcript sequence data provide the foundation for biomedical research and discovery.

Entres-Gene数据库 序列来源于Refseq数据库; 详尽的注释信息,包括基因在基因组的定位, 基因名称、蛋白质名称,基因结构等; 基因的命名主要来自权威命名委员会的官方 符号以及Refseq记录中的基因名,由NCBI工 作人员进行数据收集并注释。NLM的索引部 门对基因功能进行阐述。 沿用人类孟德尔遗传网(OMIM)中的疾病名 称并与NCBI其他

数据库形成交互链接。

NCBI Gene

http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene

UniProt Universal Protein Resource: Swiss-prot(TrEMBL), PIR两大蛋白数据库 的整合体; 收录蛋白质序列目录最广泛、功能注释最全 面的数据库; 包含三个子库: UniProtKB(UniProt Knowledgebase) UniRef(UniProt Reference Clusters) UniParc(Uniprot Archive)

PROSITE 收集了生物学有显著意义的蛋白质位点和 序列模式; 根据这些位点和模式快速和可靠地鉴别一 个未知功能的蛋白质序列应该属于哪一个 蛋白质家族; 序列模式包括酶的催化位点、配体结合位 点、与金属离子结合的残基、二硫键的半 胱氨酸、与小分子或其它蛋白质结合的区 域等;

PROSITE

http://www.expasy.ch/prosite/

2, 功能数据库 相互作用的蛋白质数据库 DIP 转录调控区数据库 TRRD … Gene Ontology (GO)

相互作用的蛋白质数据库 DIP 收集了由实验验证的蛋白质-蛋白质相互作 用; 包括蛋白质的信息、相互作用的信息和检测 相互作用的实验技术三个部分; 用户可以根据蛋白质、生物物种、蛋白质超 家族、关键词、实验技术或引用文献来查询 DIP数据库; http://dip.doe-mbi.ucla.edu/

转录调控区数据库 TRRD 在不断积累的真核生物基因调控区结构-功 能特性信息基础上构建; 每一个TRRD的条目里包含特定基因各种结 构-功能特性:转录因子结合位点、启动子、 增强子、静默子、以及基因表达调控模式等; http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/

Gene Ontology (GO) 基因功能归类注释; 最基本的概念是term;每个term都有一个唯 一的数字标记(GO:nnnnnnn)和一个term名, 比如“signal transduction”。每个term都属 于一个ontology。 一个基因或蛋白质可从三个Ontology层面来 注解 : molecular function; cellular component; biological process;

…… 此处隐藏:740字,全部文档内容请下载后查看。喜欢就下载吧 ……
生物序列的数据库信息检索.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.jiaowen.net/wenku/117010.html(转载请注明文章来源)
Copyright © 2020-2025 教文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:78024566 邮箱:78024566@qq.com
苏ICP备19068818号-2
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)