功能位點(diǎn)基因芯片是指芯片設(shè)計(jì)所包含的位點(diǎn)全部是能夠影響轉(zhuǎn)錄水平或蛋白活性的功能突變;相比普通的標(biāo)記位點(diǎn)基因芯片,功能位點(diǎn)基因芯片在位點(diǎn)選擇上更科學(xué),直接影響生命調(diào)控過(guò)程,位點(diǎn)攜帶的功能信息含量更高。
標(biāo)記位點(diǎn)基因芯片,其標(biāo)記位點(diǎn)效應(yīng)取決于與之連鎖的功能突變,由于連鎖緊密程度在不同世代、不同群體中都會(huì)不同,導(dǎo)致了標(biāo)記位點(diǎn)效應(yīng)不穩(wěn)定,難以實(shí)現(xiàn)數(shù)據(jù)聯(lián)合分析,不利于基因組育種效率提升。功能位點(diǎn)基因芯片,攜帶的是功能突變,能夠有效擺脫連鎖不平衡的限制,突變位點(diǎn)效應(yīng)在不同群體中相對(duì)穩(wěn)定,這對(duì)于多世代、多群體數(shù)據(jù)整合分析非常有利,能夠有效提高關(guān)鍵基因挖掘和基因組育種效率。
相比標(biāo)記位點(diǎn)基因芯片,功能位點(diǎn)基因芯片更接近“理想基因芯片”。理想基因芯片是指芯片位點(diǎn)正好為所研究表型全部QTN位點(diǎn)的芯片,然而,育種目標(biāo)性狀往往較為復(fù)雜,且受微效多基因效應(yīng)影響,獲取所研究表型的全部QTN來(lái)設(shè)計(jì)一款理想基因芯片是很難的。但QTN一定是功能突變,這一點(diǎn)是確定的。因此,相比標(biāo)記位點(diǎn)基因芯片,功能位點(diǎn)基因芯片理論上包含更多QTN位點(diǎn),更接近理想芯片。另外,相比全基因組測(cè)序,功能位點(diǎn)基因芯片包含的QTN數(shù)量會(huì)少一些,但其無(wú)效的噪音位點(diǎn)也大大減少,而且在存儲(chǔ)和計(jì)算成本方面有很大的優(yōu)勢(shì)。理想基因芯片、功能位點(diǎn)基因芯片、標(biāo)記位點(diǎn)基因芯片、全基因組測(cè)序之間的關(guān)系如下:

1、基因組組裝
主要針對(duì)沒(méi)有參考基因組的物種。依據(jù)要求設(shè)計(jì)測(cè)序方案,以二倍體核型物種為例,如僅進(jìn)行一致性基因組組裝,即篩選同源染色體中的一份拷貝作為代表組裝到染色體水平,至少需要聯(lián)合PacBio HiFi+Hi-C+WGS技術(shù);如需進(jìn)行單體型基因組組裝,除了一致性基因組組裝數(shù)據(jù)外,還需引入父本和母本的高深度WGS數(shù)據(jù)。
2、基因組遺傳變異檢測(cè)
如果所研究物種沒(méi)有高質(zhì)量遺傳變異數(shù)據(jù)庫(kù),或者已有遺傳變異信息不能有效囊括某些特有品種時(shí),則需從頭鑒定基因組遺傳變異。具體方法:通過(guò)高質(zhì)量群體基因組重測(cè)序數(shù)據(jù)鑒定所研究物種/品種的SNV、Indel及SV。鑒于二代測(cè)序數(shù)據(jù)檢測(cè)SV存在敏感性低的問(wèn)題,可挑選代表性個(gè)體進(jìn)行三代PacBio HiFi重測(cè)序,提高群體SV的檢測(cè)效率。
3、功能基因組注釋
(2)基因組進(jìn)化保守元件:基于保守的概念,在多個(gè)物種基因組集合中檢測(cè)不同保守閾值(完全保守、極為保守、顯著保守)的基因組序列。
4、芯片候選功能位點(diǎn)篩選
注釋全基因組遺傳變異并賦予特征標(biāo)簽,如基因間區(qū)、內(nèi)含子、同義突變、錯(cuò)義突變、無(wú)義突變、移碼突變、群體最小等位基因頻率分位數(shù)、調(diào)控元件、進(jìn)化保守、候選功能突變。聯(lián)合所有基因組特征權(quán)重,逐一計(jì)算全基因組遺傳變異特征總得分。依據(jù)遺傳連鎖信息,計(jì)算基因組單倍型組,并從每個(gè)單倍型塊中挑選特征總得分最高的遺傳變異作為該單倍型的標(biāo)簽遺傳變異和芯片候選變異位點(diǎn)。
5、全基因組捕獲探針設(shè)計(jì)及評(píng)測(cè)
綜合考慮探針序列長(zhǎng)度、GC含量及特異性,設(shè)計(jì)全基因組探針序列庫(kù),并通過(guò)深度學(xué)習(xí)模型預(yù)測(cè)所有探針捕獲效率。
6、確定芯片功能位點(diǎn)及捕獲探針序列
全面考慮芯片位點(diǎn)特征分值、基因組代表性、芯片探針捕獲效率、芯片探針密度、芯片大小等信息設(shè)計(jì)該物種第一版本功能基因芯片。
7、育種評(píng)估及迭代優(yōu)化
結(jié)合第一版本功能基因芯片群體實(shí)測(cè)結(jié)果,包括實(shí)際探針捕獲特異性和效率、位點(diǎn)完整性、多態(tài)信息含量及基因組評(píng)估準(zhǔn)確性等信息,迭代優(yōu)化芯片位點(diǎn)和探針序列。
