如何分析GEO数据库中某一疾病的差异基因？

2026-02-16 09:38:55

1、一、查找数据（以骨肉瘤数据为例）

1、打开GEO数据库，如pic1所示，输入osteosarcoma搜索。

如何分析GEO数据库中某一疾病的差异基因？

2、出现pic2所示对话框，点击“There are 4359 results for "osteosarcoma" in the GEO DataSets Database”数字处进入。

如何分析GEO数据库中某一疾病的差异基因？

3、物种选择“Homo sapiens” ,如pic3所示，点击选择。

如何分析GEO数据库中某一疾病的差异基因？

4、数据选择

查看题目及简介，确定是否为所需内容。然后查看“Samples”的数量是否合适（大于20且小于1000为宜），“Type”是否为芯片数据，如pic4。

如何分析GEO数据库中某一疾病的差异基因？

5、点击进入，查看其中内容,如pic5：

①Platforms （平台）是否可用（可用平台为：illuminaHumanv1，illuminaHumanv2，illuminaHumanv3，illuminaHumanv4，hgu133a，hgu133a2，hgu133b，hgu95a,hgu95av2, hgu133plus2, hgu219，hugene10st, InfiniumMethylation）。

②查看有无 “Processed data”（必有）及 “Raw data”（可有可无），

③点开“Samples”处确认有对照组，本例中为“Bone ”与“Osteosarcoma cell line”为对照，

④满足以上条件，记录数据号备用。

如何分析GEO数据库中某一疾病的差异基因？

1、二、本地化处理

1、搜索平台基因云馆，登录系统（或注册后登录）,如pic6。

如何分析GEO数据库中某一疾病的差异基因？

2、在左侧模块栏选择“数据库”（pic7）中的GEO数据库（pic8），在queryNAME*处输入对应的数据号“GSE36001”，type处选择“处理后的数据”，点击“运行”。

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

3、运行结束，生成RData文件(pic9)及报告等内容。点击html文件查看报告（pic10）：列名称有无空格，若有则参照预处理步骤进行更改。

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

1、三、预处理

1、表达集数据信息（此步骤在数据信息需要更改时配合“基因表达集生成器”使用，以确保修改后PData的行名称和RData的列名称保持一致），

在预处理模块选择“表达集数据信息”，将本地化生成的RData文件放入input_eSet中，点击“运行”（pic11），

运行结束会生成两个“csv”文件及报告等（pic12）。点击html文件查看报告（pic13），

将生成的“pDatamatrix.csv”保存（如pic14、pic15所示）后根据需要进行更改（第一个csv文件的列名称与第二个csv文件的行名称对应且无空格；分组列中名称后无空格且分组名称尽量简单）（如pic16），修改完成后保存备用。（如PData的行名称更改，则exprsmatrix.csv的列名称也要做相应的改变）。

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

2、基因表达集生成器

在预处理模块选择“基因表达集生成器”，将修改好的“exprsmatrix.csv”文件放入matrix*；“pDatamatrix.csv ”文件放入pData*中，根据需要填写保存名称，运行即可,如pic17所示，

运行结束生成一个新的RData文件及报告等（如pic18所示）。点击html文件查看报告（如pic19所示）。

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

3、芯片数据预处理

在预处理模块选择“芯片数据预处理”，将新生成的RData文件放入eSetPath*，在platform*处选择相应平台（pic5中已给出），groupName*处填入分组列的列名称，点击运行，如pic20，

运行结束会生成新的RData文件及报告（如pic21），点击html文件查看报告（如pic22），此时表达谱列名称已转换为基因名称。

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

1、四、差异基因分析

在inputset*处放入新生成的RData文件，colselect*处填写分组信息的列名称，根据需要更改阈值，点击运行（pic23），

运行结束，生成html报告等内容（pic24），

点击html查看报告如pic25，可知差异基因等，

点击报告中某一差异基因，可查看该基因的具体信息，如pic26。

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

如何分析GEO数据库中某一疾病的差异基因？

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。

相关推荐

利用SPSSAU怎样进行Delong检验？

阅读量：178

如何给word折线图添加标准误差线？

阅读量：162

科研/NCBI/根据蛋白序列查找某菌种同源基因信息

阅读量：189

初学者如何用RevMan5.3制作森林图和漏斗图

阅读量：191

T检验和方差分析的区别

阅读量：32

猜你喜欢

猜你喜欢