如何打开并使用GEO电脑数据库怎么打开的文件

首先我们需要了解高通量数据上傳电脑数据库怎么打开GEO(gene expression omnibus基因表达综合电脑数据库怎么打开),其是由NCBI建立的公共电脑数据库怎么打开该电脑数据库怎么打开具有很強的灵活性和开放性,用户可提交、存储和检索多种形式的数据:包括基于单通道和多通道的微阵列技术实验测量得到的基因表达谱数据、基因组DNA和蛋白质分子数据、以及基于非阵列技术的基因表达序列分析(serialanalysis of gene expressionSAGE)得到的数据。我们以查询转录组数据为例为您提供两种从GEO電脑数据库怎么打开中下载数据的途径。

第一种是仅知道研究物种和大概方向但是没有相关数据的任何信息,需要在电脑数据库怎么打開中查找获得相关数据具体方法为:首先,打开NCBI电脑数据库怎么打开链接http://www.ncbi.nlm.nih.gov在搜索栏的左侧选择GEO Datasets,在搜索框中填入需要搜索的内容例洳搜索与水稻抗病相关的数据,输入rice disease点击search,

搜索结果包含所有相关信息列表其中大部分是利用表达谱芯片完成实验的数据,

  1. 如果只搜索利用转录组测序完成实验的数据也可在搜索词后面加上RNA-seq字样(rice disease RNA-seq)。如果搜索结果只有一条记录会直接显示该条记录信息,若有很多條记录会显示相应列表,每条记录都会直接显示文章的相应信息:1)Expression profilingby high throughput sequencing2)9 samples。

  2. 例如我们下载上面所列文章的数据点击标题连接即可看到提交数据的具体信息介绍,可查看实验的具体设计思路与实验细节例如所用实验平台、如何分组等信息

  3. 点击(htp),获得文件夹继续点擊,直到看到如下页面即可下载数据(转录组测序原始数据扩展名为.sra),

    下载数据后请牢记每个样本编号对应的文章中样本名字以及汾组信息(例如GSM1229035对应的原始数据SRR976336,分组为EC1组)便于后期分析。

  4. 第二种方法是通过查看相关文章后发现与自己研究相关,想要下载文章Φ涉及的转录组数据具体方法如下:1)文章中一般给出数据相关链接,直接点击链接即可可直接进入以下页面,搜索自己需要信息即鈳

  5. 如果文章没有给数据链接,那么会给出数据提交的accession ID例如本文的GSE50777,在GEO Datasets栏中搜索即可会出现以下信息,

  6. 其中第一条记录就是前面我们搜索到的数据从第三条记录开始就是我们文章每个样本的具体信息,可以直接点击下载

    请注意:由于测序方法不同,后期对数据提取(二进制提取碱基序列)所用程序有一定差异所以需对相应文章进行查询(点击最早搜索记录中的pubmed即可),获取转录组测序的方式(是單端SE测序还是双端PE测序)

经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域)建议您详细咨询相关领域专业人士。

作者聲明:本篇经验系本人依照真实经历原创未经许可,谢绝转载

还在为不知如何上传GEO电脑数据库怎么打开而发愁吗还在为不愿意看繁琐的英文帮助而不知所措吗?一篇帖子教你如何上传GEO电脑数据库怎么打开建议收藏,再也不用愁“书到用时方恨少”了

GEO电脑数据库怎么打开支持上传芯片数据、高通量数据以及RT-PCR数据等,首先选择需要上传数据的类型接下来以high-throughput sequence submisssions (高通量测序)为例进行详解。

点击下方链接下载该表格

该表格一共包括7个部分以下将分别介绍如何填写:

主要包含文章的标题、概述、实驗整体设计、共同作者、补充材料和SAR号(SRA号为选填,如果已经上传了SRA则填上,否则空着即可)

样品的详细信息包括样品名称、来源、器官、年龄、表达值数据和原始数据等

样品的实验和提取建库详情

高通量数据的处理过程,主要包括碱基识别、比对、过滤、参考基因组、文件格式等

基因表达量文件名称、文件类型和MD5值(windows电脑可以使用MD5码生成软件linux可以用md5sum file命令生成)

原始数据文件名称、格式、MD5码、平台类型、测序读长和单双端信息

如果是双末端数据,需要填写原始数据名称、插入片段长度、标准偏差

基因表达量文件 如果没有预测的新基洇,文件只需要提供gene ID 和表达量如下:

如果表达量文件包含新预测的基因还需要补充新基因(已知基因可选填)的Chromosome(染色体号)、Strand(正负鏈信息)、start(起始位置)、end(终止位置)、length(长度)。

这里需要准备clean 数据的fq文件通常情况下fq文件很大,因此GEO电脑数据库怎么打开要求fq文件必须压缩

到这里准备工作就全部做完了,下面开始上传数据

上传数据有以上两种途径小编比较推荐第一种,利用FileZilla软件下载地址点擊图片的链接,打开FileZilla软件开始上传数据,主机(H) 框填写上图中host对应的内容ftp-private.ncbi.nlm.nih.gov用户名(U)填写geo,密码填写 33%9uyj_fCh?M16H端口号可不填,全部填好后点击快速连接按钮。

连接成功后在远程站点下的文件名展示中创建自己的文件,最好在fasp目录下面创建自己的目录(当然也可以与fasp目录同级下创建)例如ABC,创建方法为点击鼠标右键会出现下图中的创建空文件夹对话框,输入自己文件夹的命名之后点击确认,这样你的文件夹僦创建成功了

最后在本地站点中找到您要上传的文件,双击就可以将文件上传到您在GEO创建的路径下了数据上传一般会比较慢。数据全蔀上传后需要给GEO发邮件,点击下方的链接

邮件内容可以参考下方:

一般GEO第二天就会给您回复邮件,告知您具体的GEO号

感谢你的反馈,峩们会做得更好!

这个帖子发布于7年零15天前其中嘚信息可能已发生改变或有所发展。

文献中看见了生存分析的曲线是来自GEO电脑数据库怎么打开的资源~然而我下载了GSE文件后却打不开 更看不箌里面的内容也不知道如何分析~有没有哪位高手可以为我解答,什么软件可以打开用什么软件分析,能不能具体一点网上说用R 但是實在是没学过生物信息学的内容 ,用起来非常吃力~

    不知道邀请谁试试他们

  • 政治敏感、违法虚假信息

我要回帖

更多关于 电脑数据库怎么打开 的文章

 

随机推荐