第二百零八章 AI和計算生物學(第2/3頁)
章節報錯
鄭理鼓掌道:“很好。”
其實計算生物學的進化路線, 和現代法師的研究有很多相似之處。
法師們透過生物雲的高頻計算能力,對基因、蛋白質等構成生命的基本要素進行定性定量分析。
法師們的優勢不僅在碳基計算機的運算能力和上限比矽基更高,而且來源於他們可以直接透過意志干涉物質世界。
能有更多的特殊樣本和針對性誘導樣本進行研究。
鄭理繼續問道:“其實你們目前主要使用的還是神經網路對吧?”
“卷積神經網路、迴圈神經網路、自動編碼機這些。”
研發主管深知鄭理的科研能力和所涉及領域之廣泛,因此對於鄭理一語把他們的關鍵點透絲毫不意外:
“是的,主要還是神經網路在計算生物領域的應用。”
涉及到研發層面,鄭理從來都是有話直說:
“深度學習在計算生物層面的應用很早之前就開始了。”
“Bengio早在2012年就開始用神經網路研究基因組學和生物影象分析,將序列變異和分子特徵聯絡到一起了。”
“也就是說我們使用的技術,如果是外行來聽,會覺得很先進,深度學習、人工智慧,但是實際上這已經是十年前別人就在玩的東西。”
“我們自己有什麼突破?別告訴我只是把別人的方法拿來用。”
“如果只是做到這個程度”
鄭理沒說完,他轉頭看向李渺渺:“渺渺,江城研發中心每年投入的預算是多少?”
李渺渺不假思索道:“今年給他們編的預算是17.4億元。”
鄭理點頭道:“好的,如果你們只是這個水平,那今年的預算把零頭砍掉。”
李渺渺問道:“砍掉7.4億元嗎?”
“嗯。”
鄭理說完直視坐他對面的研發主管。
每年各個研發中心的預算不僅是錢和資源,而且代表著你在公司內部的重要程度。
鄭理砍預算,不代表會把他們今年的研發目標降低。
研發主管連忙道:“鄭董, 我們有很多自主的研發。”
他知道自己拿出來的東西一定不能糊弄。
鄭理太懂了,當你的上司對你的業務過於瞭解的時候, 上班摸魚的難度被提升到了極點。
“我們最佳化了從DNA序列對分子特徵最佳化的神經網路演算法。”
“鄭董, 這是個體的 DNA 序列和基因組的分子反應變數。”
“在傳統的調控基因組學方法中主要需要考慮個體之間的差異,而我們最佳化之後的深度學習演算法允許透過將基因組平鋪到以個體特徵為中心的序列 DNA 視窗中。”
“然後利用個體內部的差異,從而從單個樣本中產生大量的訓練資料集。”
“這是用於從原始 DNA 序列預測分子特徵的一維卷積神經網路。”
“第一個卷積層的過濾器掃描輸入序列中的圖案。隨後的池化減少了輸入維度,並且額外的卷積層可以模擬前一層中DNA序列的互動。”
“再看這裡,C圖由B圖中所示的神經網路預測的野生型和突變序列的響應變數被用作另一個神經網路的輸入,該網路預測變體分數並允許區分正常與有害變體。”
“D 再透過對齊最大程度地啟用過濾器的基因序列並建立序列基序來視覺化卷積過濾器。”