生物序列的数据库信息检索
生物信息学第五章:生物序列的数据库信息检索
本章内容提要 1,序列数据库
2,功能数据库 3,检索系统
4,双序列Blast比对实例 5,序列数据信息检索实例
1, 序列数据库 核酸序列数据库 国际三大核酸序列数据库:GenBank, EBML, DDBJ
RefSeq: The Reference Sequence Database dbEST: Expressed Sequences Tags数据库 UniGene等
蛋白质序列数据库 UniProt (Swiss-prot & TrEMBL, PIR)
基因组数据库: Ensembl
NCBI数据资源
Nucleotide: 核酸序列数据库 PubMed: 生物医学科学文摘数据库 GEO:基因表达谱数据库。收集存储微阵列基因 表达数据 Protein: 蛋白质序列数据库 SNP: 单核苷酸多态性数据库 Taxonomy: 物种分类学数据库 Gene: 基因数据库。提供序列及基因描述信息 Structure: 大分子三维结构数据库 3D Domains: 特定功能域的三维结构数据库 UniGene: GenBank分离的非冗余基因簇。包含 已确定基因和EST。每个簇包含唯一的非冗余的 基因序列、表达的组织类型和基因图谱位点。
UniSTS: 序列标签位点数据库,用于作图位点 PopSet: 人口研究数据库 Books: 在线生物医学图书数据库 OMIM: 在线人类孟德尔遗传目录数据库 Conserved Domains: 保守结构域数据库 Cancer Chromosomes: 癌症染色体数据库 Homologene: 基因同源物数据库 Journals: 杂志及出版社信息数据库 Genome: 基因组数据库,提供完成的基因组/染色 体图形 GDS: GEO的基因表达实验与生物芯片数值结果数 据库
NCBI主要基因序列数据库 GenBank:包含了所有已知的核酸序列和蛋白质 序列,以及与它们相关的文献著作和生物学注释。 其数据直接来源于测序工作者提交的序列,为原始 数据积累的开放数据库,数据可能存在重复以及不 准确。 UniGene:对核酸序列数据库的数据进行适当处理 ,剔除冗余部分后,同一基因包括表达序列标签的 序列簇,多用于研究基因的转录图谱。 RefSeq:提供非冗余的,高质量的,经检验校正 的序列信息;包括染色体、基因组(细胞器、病毒、 质粒)、蛋白质、RNA等。
Nucleotide database including GenBank, RefSeq, TPA and PDB. Genome, gene and transcript sequence data provide the foundation for biomedical research and discovery.
Entres-Gene数据库 序列来源于Refseq数据库; 详尽的注释信息,包括基因在基因组的定位, 基因名称、蛋白质名称,基因结构等; 基因的命名主要来自权威命名委员会的官方 符号以及Refseq记录中的基因名,由NCBI工 作人员进行数据收集并注释。NLM的索引部 门对基因功能进行阐述。 沿用人类孟德尔遗传网(OMIM)中的疾病名 称并与NCBI其他
数据库形成交互链接。
NCBI Gene
http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene
UniProt Universal Protein Resource: Swiss-prot(TrEMBL), PIR两大蛋白数据库 的整合体; 收录蛋白质序列目录最广泛、功能注释最全 面的数据库; 包含三个子库: UniProtKB(UniProt Knowledgebase) UniRef(UniProt Reference Clusters) UniParc(Uniprot Archive)
PROSITE 收集了生物学有显著意义的蛋白质位点和 序列模式; 根据这些位点和模式快速和可靠地鉴别一 个未知功能的蛋白质序列应该属于哪一个 蛋白质家族; 序列模式包括酶的催化位点、配体结合位 点、与金属离子结合的残基、二硫键的半 胱氨酸、与小分子或其它蛋白质结合的区 域等;
PROSITE
http://www.expasy.ch/prosite/
2, 功能数据库 相互作用的蛋白质数据库 DIP 转录调控区数据库 TRRD … Gene Ontology (GO)
相互作用的蛋白质数据库 DIP 收集了由实验验证的蛋白质-蛋白质相互作 用; 包括蛋白质的信息、相互作用的信息和检测 相互作用的实验技术三个部分; 用户可以根据蛋白质、生物物种、蛋白质超 家族、关键词、实验技术或引用文献来查询 DIP数据库; http://dip.doe-mbi.ucla.edu/
转录调控区数据库 TRRD 在不断积累的真核生物基因调控区结构-功 能特性信息基础上构建; 每一个TRRD的条目里包含特定基因各种结 构-功能特性:转录因子结合位点、启动子、 增强子、静默子、以及基因表达调控模式等; http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/
Gene Ontology (GO) 基因功能归类注释; 最基本的概念是term;每个term都有一个唯 一的数字标记(GO:nnnnnnn)和一个term名, 比如“signal transduction”。每个term都属 于一个ontology。 一个基因或蛋白质可从三个Ontology层面来 注解 : molecular function; cellular component; biological process;
…… 此处隐藏:740字,全部文档内容请下载后查看。喜欢就下载吧 ……相关推荐:
- [外语考试]管理学 第13章 沟通
- [外语考试]07、中高端客户销售流程--分类、筛选讲
- [外语考试]2015-2020年中国高筋饺子粉市场发展现
- [外语考试]“十三五”重点项目-汽车燃油表生产建
- [外语考试]雅培奶粉培乐系列适用年龄及特点
- [外语考试]九三学社入社申请人调查问卷
- [外语考试]等级薪酬体系职等职级表
- [外语考试]货物买卖合同纠纷起诉状(范本一)
- [外语考试]青海省实施消防法办法
- [外语考试]公交车语音自动报站系统的设计第3稿11
- [外语考试]logistic回归模型在ROC分析中的应用
- [外语考试]2017-2021年中国隔膜泵行业发展研究与
- [外语考试]神经内科下半年专科考试及答案
- [外语考试]园林景观设计规范标准
- [外语考试]2018八年级语文下册第一单元4合欢树习
- [外语考试]分布式发电及微网运行控制技术应用
- [外语考试]三人行历史学笔记:中世纪人文主义思想
- [外语考试]2010届高考复习5年高考3年联考精品历史
- [外语考试]挖掘机驾驶员安全生产责任书
- [外语考试]某211高校MBA硕士毕业论文开题报告(范
- 用三层交换机实现大中型企业VLAN方案
- 斯格配套系种猪饲养管理
- 涂层测厚仪厂家直销
- 研究生学校排行榜
- 鄱阳湖湿地景观格局变化及其驱动力分析
- 医学基础知识试题库
- 2010山西省高考历年语文试卷精选考试技
- 脉冲宽度法测量电容
- 谈高职院校ESP教师的角色调整问题
- 低压配电网电力线载波通信相关技术研究
- 余额宝和城市商业银行的转型研究
- 篮球行进间运球教案
- 气候突变的定义和检测方法
- 财经大学基坑开挖应急预案
- 高大支模架培训演示
- 一种改进的稳健自适应波束形成算法
- 2-3-鼎视通核心人员薪酬股权激励管理手
- 我国电阻焊设备和工艺的应用现状与发展
- MTK手机基本功能覆盖测试案例
- 七年级地理教学课件上册第四章第一节




