1。3 Trihelix转录因子的结构特点
Trihelix转录因子的结构主要包含以下三个部分:DNA结合域、转录激活域和连接区,而有些转录因子仅含有两个结构域。以生物信息学方法为手段,对其可能存在的转录因子进行了序列重建,并在序列重建结果的基础上分析了这些转录因子的基因结构。结果表明,它们来自相同的祖先结构域,祖先结构域经自身加倍后形成了这两个结构域。此类基因又在进化过程中经历了结构域的丢失和变异,由此引发了一些功能适应性的变化[8]。
研究者以首次发现学者的名字命名了Trihelix亚家族,在拟南芥中该家族被分为了五个不同的亚家族分别是:GT-1、GT-2、GTγ、SH4和SIPS1 [5]。GT-1是最早被鉴定的成员,目前在拟南芥、水稻和烟草中都有相关成员被克隆[12-17],并且拟南芥中的GT-2亚家族成员均已被克隆和功能鉴定[5]。除此之外,在水稻、豌豆、大豆以及白杨中均有该家族成员被克隆[18-23]。而亚家族基因SH4仅在水稻种被鉴定出[25],经过系统而全面的分析,Fang等人又鉴别出新的亚家族GTγ。目前,已发现的只有水稻OsGTγ-1、OsGTγ-2、OsGTγ-3和OsGTγ-4基因被克隆[3]。对于SIP1亚家族来说,仅在拟南芥和烟草中有一些SIP1亚家族成员被克隆[4,6]。
1。4 Trihelix转录因子的功能
在研究初期,Trihelix转录因子被发现能和GT元件特异性地结合[6],调控光应答反应,接下来的研究显示,该转录因子不仅调控光应答元件基因[6],还负责调控部分植物某些阶段的生长发育如花和气孔、胚胎以及种子的发育[25-27],并且在生物和非生物胁迫中也到起一定作用[14]。同样的标准,按照Trihelix家族结构域特点的不同进行亚家族分类,在拟南芥中可被分为5个不同亚家族——GT-1,GT-2, SH4, GTγ和 SIP1[25]。豌豆GT-1能够和启动子上的GT元件发生特异性结合[6]并且参与基因表达调控,随后陆续在烟草[28]、拟南芥[13]和水稻[29]中克隆出它的同源基因。同时,在水稻中发现一个与GT-1因子相似的DNA结合蛋白存在,后期研究发现,该蛋白与水稻光敏色素对光应答反应有一定的关联[29],与之前的GT-1因子作比较,该蛋白含有2个重复的保守结构域。因此,该蛋白被命名为GT-2因子[30,31]。在GT-2家族中被鉴别出能对拟南芥花瓣和萼片的生长进行调控是拟南芥中PETAL LOSS (PTL)[26,27,32]。存在于水稻中的SHA1基因负责编码SH4类型,主要参与调控细胞分化及激活,该基因突变后在栽培水稻中导致种子落粒性的消失[1]。
随着一些模式植物如拟南芥、二穗短柄草、高粱和水稻等的全基因组测序的完成[33,34],本研究对水稻和二穗短柄草进行了综合分析,并对Trihelix转录因子的家族结构、进化、染色体分布、在短柄草自身及作物之间的染色体复制情况进行系统分析,讨论了其在不同物种中的数量分布及亚家族分类。后期利用生物信息学软件对该转录因子的各项分析结果进行了聚类图示化。本研究对植物Trihelix基因的克隆以及功能预测和鉴定具有重要的意义。
2 材料与方法
2。1 植物Trihelix转录因子数据获取与鉴定
为获取水稻Trihelix转录因子家族序列,先从水稻基因组数据库(TIGR)中下载水稻全基因组序列,在Pfam数据库中找到拟南芥Trihelix家族独有的蛋白结构域[35]作为模板,利用MEME软件搜索带有独特结构域的序列[36]。用SMART程序检测去掉不包含目标结构域的序列,即可得到水稻中Trihelix转录因子家族的序列[37]。
在TIGR基因组数据库中下载水稻全基因组数据库,利用上文提到的Pfam方法在水稻中检测是否存在此家族蛋白的特征结构域,借助同样的方法,完成对含有Trihelix特殊结构域的序列的筛选,除去没有独特结构的序列,即可得到包含有Trihelix家族的全部序列[37]。同时利用ExPASy数据库(http://www。expasy。org/)对水稻Trihelix蛋白的分子量、染色体位置、等电点等基本信息进行了分析[38]。