今天給大家推薦的文章是最近發(fā)表在Macromolecules上的A Recommender System for Inverse Design of Polycarbonates and Polyesters,文章的通訊作者是IBM研究所的Nathaniel H. Park與Dmitry Yu. Zubarev。
在新材料研究和開發(fā)的過程中,時(shí)間成本和不成功的實(shí)驗(yàn)損耗始終是一項(xiàng)重大投入。為了改善這項(xiàng)問題,傳統(tǒng)的勞動(dòng)力密集型的研究“流水線”正在逐漸被自動(dòng)化、高通量、高性能計(jì)算、人工智能的實(shí)驗(yàn)取代,以實(shí)現(xiàn)實(shí)驗(yàn)結(jié)果質(zhì)量與研究推進(jìn)速率的提升。由此,高分子材料的新型自動(dòng)合成平臺在對實(shí)驗(yàn)結(jié)果的程序性控制,以及對單體轉(zhuǎn)化率(MC),聚合度(DP),分子量分布(?),結(jié)構(gòu)等聚合物特征信息的控制中,就顯得十分重要。而將自動(dòng)系統(tǒng)與聚合物特征及性質(zhì)相結(jié)合,毫無疑問能夠?qū)π滦筒牧仙虡I(yè)化的迅速發(fā)展以及性能提升做出貢獻(xiàn)。
對內(nèi)酯或環(huán)狀碳酸酯的開環(huán)聚合(ROP)而言,實(shí)驗(yàn)條件的選擇至關(guān)重要。不合適的實(shí)驗(yàn)條件將導(dǎo)致實(shí)驗(yàn)反應(yīng)器污染,分子量分布展寬,甚至根本不發(fā)生聚合反應(yīng)。也即,內(nèi)酯與環(huán)狀碳酸酯的活性ROP十分依賴單體以及催化劑的種類與活性。即便對這類ROP的熱力學(xué)與動(dòng)力學(xué)進(jìn)行了深入的研究,至今為止也無法保證,即沒有普適的理論框架能夠確保能夠?yàn)樘囟ǚ磻?yīng)預(yù)測最合適的催化劑。尤其是,即便單體結(jié)構(gòu)只發(fā)生了些微的變化,也可能對反應(yīng)活性產(chǎn)生極大影響。因此,采用統(tǒng)計(jì)的方法,根據(jù)前人研究的經(jīng)驗(yàn)進(jìn)行單體及催化劑條件的設(shè)計(jì),所耗費(fèi)的工作量依然不小。
針對單體-催化劑相互作用的傳統(tǒng)計(jì)算策略主要是評價(jià)熱力學(xué)與動(dòng)力學(xué)參數(shù),然而,當(dāng)這一計(jì)算方式涉及聚合物時(shí),計(jì)算量將呈現(xiàn)爆炸式增長。相反地,基于統(tǒng)計(jì)學(xué)習(xí)的,以數(shù)據(jù)為中心的方法在此時(shí)能顯現(xiàn)出區(qū)別于傳統(tǒng)方法的特點(diǎn)。在化學(xué)領(lǐng)域,主要的機(jī)器學(xué)習(xí)(ML),包括深度學(xué)習(xí)(DL)研究,依賴于構(gòu)效關(guān)系以及結(jié)構(gòu)-活性關(guān)系。而大多數(shù)聚合物為隨機(jī)大分子,對這些聚合物鏈,尤其是具有交聯(lián)或網(wǎng)絡(luò)滲透性質(zhì)的聚合物鏈的整體結(jié)構(gòu),采用分析化學(xué)結(jié)構(gòu)的方法進(jìn)行計(jì)算,進(jìn)而篩選合適的單體與催化劑體系,計(jì)算量過于龐大,因而是不切實(shí)際的。由此,作者以新的建模思路,假設(shè)內(nèi)酯或碳酸酯保持一致的開環(huán)方式,由實(shí)驗(yàn)條件的一致性即可保證材料特性的可重復(fù)性,從而實(shí)現(xiàn)以數(shù)據(jù)為中心的建模。該方式除了能夠規(guī)避聚合物的隨機(jī)性帶來的問題,優(yōu)勢還在于能夠避免構(gòu)效關(guān)系建模中常見的瓶頸,即合成候選材料途徑的選擇問題。相比而言,實(shí)驗(yàn)條件-性質(zhì)關(guān)系建模得到的結(jié)果足夠?qū)嶒?yàn)人員直接進(jìn)行實(shí)驗(yàn)操作。
在確定實(shí)驗(yàn)條件-性質(zhì)映射建模的思路后,作者還需要選擇正向或逆向設(shè)計(jì)模型。其中正向模型指的是將聚合物結(jié)構(gòu)與性質(zhì)一一映射,其中的結(jié)構(gòu)可以是原子的三維結(jié)構(gòu),也可以是制備聚合物的實(shí)驗(yàn)流程;而逆向模型則主要指由聚合物性質(zhì)映射結(jié)構(gòu)。顯然,采用逆向設(shè)計(jì)的計(jì)算效率更高,因此在本文中,作者主要采用逆向方法進(jìn)行實(shí)驗(yàn)條件范圍的確定,而正向設(shè)計(jì)主要被用來對逆向建模獲得的結(jié)果進(jìn)行驗(yàn)證。如圖1所示,本文研究中材料的性能主要包含MC與?,映射結(jié)果中的單體與引發(fā)劑被簡化壓縮,稱為“單體束”,催化劑與助催化劑條件統(tǒng)稱為“催化劑束”。通過這樣的簡化,最終能夠得到雙組份映射關(guān)系,如圖1C。
圖1. 以數(shù)據(jù)為中心的逆向設(shè)計(jì)簡化思路
對35k個(gè)已有的實(shí)驗(yàn)結(jié)果進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,繪制以上述雙組份,即單體束與催化劑束為橫縱坐標(biāo),分別與MC及?相關(guān)的二維熱圖,如圖2所示。對于熱圖上的每個(gè)數(shù)據(jù)點(diǎn),若MC或?滿足篩選要求,則記權(quán)重為1,若存在實(shí)驗(yàn)結(jié)果,但不滿足要求,則記數(shù)據(jù)點(diǎn)權(quán)重為0.5。最終觀察到的推薦系統(tǒng)對于MC的平均精確度(AP)達(dá)到0.65,對?的AP達(dá)到0.67。
圖2. 單體束與催化劑束為橫縱坐標(biāo),分別與MC及?相關(guān)的二維熱圖
另外,作者對系統(tǒng)推薦的實(shí)驗(yàn)進(jìn)行了如圖3所示體系的實(shí)際操作驗(yàn)證。實(shí)驗(yàn)結(jié)果如表1中所示,其中C(+)表示MC>90%,C(-)表示MC<90%;?(+)表示分子量分布在1.05?1.15,?(?)表示分子量分布大于1.15。對實(shí)驗(yàn)結(jié)果的分析可見,由系統(tǒng)推薦獲得的實(shí)驗(yàn)體系具有相對較高的新穎性,同時(shí)可以注意到,實(shí)驗(yàn)中時(shí)間等參數(shù)的調(diào)整雖然并未涵蓋在被統(tǒng)計(jì)的數(shù)據(jù)束中,但同樣能通過該系統(tǒng)實(shí)現(xiàn)調(diào)整。
圖3. 對系統(tǒng)推薦體系驗(yàn)證實(shí)驗(yàn)示意圖
表1. 對系統(tǒng)推薦體系驗(yàn)證實(shí)驗(yàn)結(jié)果與判定
綜上所述,作者在本文中開發(fā)了一種,通過并不龐大的前人的實(shí)驗(yàn)數(shù)據(jù)結(jié)果進(jìn)行聚合物材料制備條件預(yù)測的系統(tǒng),能夠較為成功地推薦制備所需的較優(yōu)的單體、引發(fā)劑、催化劑、助催化劑等條件,并進(jìn)一步預(yù)測其他相關(guān)實(shí)驗(yàn)參數(shù)。與傳統(tǒng)預(yù)測方法相比,該系統(tǒng)更加精簡,耗費(fèi)計(jì)算所需成本與時(shí)間顯著降低,最終實(shí)現(xiàn)的推薦具有較高新穎性??傮w來說,該工作揭示了人工智能系統(tǒng)在該方面的潛力,其完善及其與自動(dòng)化平臺的結(jié)合將大大加速聚合物材料的開發(fā)。
作者:ZY 審校:WS
DOI: 10.1021/acs.macromol.0c02127
Link: https://pubs.acs.org/doi/10.1021/acs.macromol.0c02127