水稻(Oryza sativa)是禾本科稻属的一种,是重要的粮食作物。水稻是二倍体植物,自花授粉,易培养,生长较快;其基因组在禾谷类作物中最小,且遗传转化系统比较成熟,被认为是单子叶植物功能基因组学研究的模式生物。拟南芥(Arabidopsis thaliana)属于被子植物门,双子叶植物纲。拟南芥的基因组是目前已知植物基因组中最小的,是双子叶植物研究的模式生物[4]。目前拟南芥和水稻两个亚种的基因组测序工作已经完成[5-8],这为在基因组水平上鉴定出某一家族的全部基因并研究其功能提供了可能。目前有关RIO激酶的研究还只局限于酵母和人类,而在高等植物中的成员及其功能还不明确。本研究采用生物信息学分析方法对水稻和拟南芥基因组中的RIO基因进行了系统鉴定,通过基因复制事件和系统发育分析研究了其进化历程与机制,采用EST和芯片数据对其在不同组织器官中的表达特征进行了分析。这些结果为水稻和拟南芥RIO基因的功能研究奠定了重要基础。
2 材料与方法
2.1 序列检索及亚细胞定位分析
为了鉴定水稻和拟南芥RIO基因家族成员,利用已知的RIO蛋白质序列在水稻基因组注释数据库(Rice Genome Annotation Project,RGAP,http://rice.plantbiology.msu.edu/analyses_search_blast.shtml)和拟南芥基因组注释数据库(http://www.arabidopsis.org/)中进行BLAST搜索,选取E≤10-10的序列作为候选蛋白,再利用候选蛋白序列在Pfam数据库(http://pfam.xfam.org/search)中进行验证。如果存在RIO结构域,则认为该候选蛋白属于RIO家族,并下载其CDS和蛋白质序列。基因的基本信息如外显子数、蛋白质氨基酸数、蛋白质分子量、转录方向等从RGAP和拟南芥基因组注释数据库中获取。蛋白质亚细胞分布利用WoLF PSORT网站(http://www.cbs.dtu.dk/services/TargetP/)进行预测。
2.2 染色体分布和复制事件分析
利用MapChart软件绘制OsRIO基因染色体分布图并进行手工编辑。AtRIO基因在拟南芥染色体上的分布位置图则通过拟南芥基因组数据库中的Map工具(http://www.arabidopsis.org/jsp/ChromosomeMap/tool.jsp)自动生成。如果两个基因在染色体上相距很近,间隔不超过5个基因,则认为它们起源于串联重复事件。
2.3 多序列对比和系统发育分析
得到水稻和拟南芥RIO蛋白的氨基酸序列后,利用MEGA5.1软件进行多序列比对,采用邻接法(Neighbor-Joining method)构建系统发育树,bootstrap重抽样进行了1000次,其他参数设为默认[9, 10]。
2.4 基因表达分析
将OsRIO基因和AtRIO基因的CDS序列依次输入NCBI网站(http: / /www. ncbi.nlm.nih.gov/)的EST数据库中进行Blastn比对,选取匹配率大于>95%、长度>200bp,并且E≤10-10的结果作为对应的EST序列,获取RIO基因在不同组织器官中的表达模式信息[9, 10]。将OsRIO基因的座位号输入RiceGE Gene Expression Atlas网站(http://signal.salk.edu)进行检索,得到不同组织器官的芯片数据值。通过检索AtGen Express Visualization网站(http://jsp.weigelworld.org/expviz/)获取拟南芥RIO基因的芯片表达值。利用Excel软件绘制柱状图。
3 结果分析源]自=优尔^`论\文"网·www.youerw.com/
3.1 水稻和拟南芥中的RIO基因
通过BLASTP比对搜索,共鉴定出水稻基因组中2个RIO基因,基本信息见表1。根据这两个基因在染色体上的位置,分别命名为OsRIO-1和OsRIO-2。这2个基因分别含有13和14个外显子,说明它们均不是起源于逆转录转座事件。OsRIO-1蛋白氨基酸长度为492 aa,而OsRIO-2蛋白氨基酸长度为525 aa。蛋白质等电点分析表明,OsRIO-1为酸性蛋白,OsRIO-2为碱性蛋白。OsRIO-1基因为正向转录,而OsRIO-2基因为反向转录。根据亚细胞定位分析得知,OsRIO-2蛋白定位在叶绿体内,OsRIO-1蛋白定位在其它位点。