可解釋、可通用的下一代人工智能方法重大研究計劃面向人工智能發(fā)展國家重大戰(zhàn)略需求,,以人工智能的基礎(chǔ)科學(xué)問題為核心,,發(fā)展人工智能新方法體系,,促進(jìn)我國人工智能基礎(chǔ)研究和人才培養(yǎng),支撐我國在新一輪國際科技競爭中的主導(dǎo)地位,。
一,、科學(xué)目標(biāo)
本重大研究計劃面向以深度學(xué)習(xí)為代表的人工智能方法魯棒性差、可解釋性差,、對數(shù)據(jù)的依賴性強(qiáng)等基礎(chǔ)科學(xué)問題,,挖掘機(jī)器學(xué)習(xí)的基本原理,發(fā)展可解釋,、可通用的下一代人工智能方法,,并推動人工智能方法在科學(xué)領(lǐng)域的創(chuàng)新應(yīng)用。
二,、核心科學(xué)問題
本重大研究計劃針對可解釋,、可通用的下一代人工智能方法的基礎(chǔ)科學(xué)問題,圍繞以下三個核心科學(xué)問題開展研究,。
?。ㄒ唬┥疃葘W(xué)習(xí)的基本原理。
深入挖掘深度學(xué)習(xí)模型對超參數(shù)的依賴關(guān)系,,理解深度學(xué)習(xí)背后的工作原理,,建立深度學(xué)習(xí)方法的逼近理論、泛化誤差分析理論和優(yōu)化算法的收斂性理論,。
?。ǘ┛山忉尅⒖赏ㄓ玫南乱淮斯ぶ悄芊椒?。
通過規(guī)則與學(xué)習(xí)結(jié)合的方式,,建立高精度、可解釋,、可通用且不依賴大量標(biāo)注數(shù)據(jù)的人工智能新方法,。開發(fā)下一代人工智能方法需要的數(shù)據(jù)庫和模型訓(xùn)練平臺,完善下一代人工智能方法驅(qū)動的基礎(chǔ)設(shè)施,。
?。ㄈ┟嫦蚩茖W(xué)領(lǐng)域的下一代人工智能方法的應(yīng)用。
發(fā)展新物理模型和算法,,建設(shè)開源科學(xué)數(shù)據(jù)庫,、知識庫、物理模型庫和算法庫,,推動人工智能新方法在解決科學(xué)領(lǐng)域復(fù)雜問題上的示范性應(yīng)用,。
三、2024年度資助研究方向
?。ㄒ唬┡嘤椖?。
圍繞上述科學(xué)問題,,以總體科學(xué)目標(biāo)為牽引,對于探索性強(qiáng),、選題新穎,、前期研究基礎(chǔ)較好的申請項目,將以培育項目的方式予以資助,,研究方向如下:
1.神經(jīng)網(wǎng)絡(luò)的新架構(gòu)和新的預(yù)訓(xùn)練或自監(jiān)督學(xué)習(xí)方法,。
針對圖像、視頻,、圖,、流場等數(shù)據(jù),發(fā)展更高效的神經(jīng)網(wǎng)絡(luò)新架構(gòu),,預(yù)訓(xùn)練或自監(jiān)督學(xué)習(xí)方法,,并在真實數(shù)據(jù)集上進(jìn)行驗證。
2.深度學(xué)習(xí)的表示理論和泛化理論,。
研究卷積神經(jīng)網(wǎng)絡(luò)(以及其它帶對稱性的網(wǎng)絡(luò)),、圖神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò),、低精度神經(jīng)網(wǎng)絡(luò),、動態(tài)神經(jīng)網(wǎng)絡(luò)、生成擴(kuò)散模型等模型的泛化誤差分析理論,、魯棒性和穩(wěn)定性理論,,并在實際數(shù)據(jù)集上進(jìn)行驗證;研究無監(jiān)督表示學(xué)習(xí),、預(yù)訓(xùn)練-微調(diào)范式等方法的理論基礎(chǔ),發(fā)展新的泛化分析方法,,指導(dǎo)深度學(xué)習(xí)模型和算法設(shè)計,。
3.深度學(xué)習(xí)訓(xùn)練算法的理論基礎(chǔ)。
研究神經(jīng)網(wǎng)絡(luò)損失景觀的結(jié)構(gòu)和訓(xùn)練算法的特性,,包括但不限于:臨界點的分布及其嵌入結(jié)構(gòu),、極小點的連通性,穩(wěn)定性邊緣(edge of stability)和損失尖峰(loss spike)現(xiàn)象,、算法的隱式正則化,、穩(wěn)定性和收斂性;訓(xùn)練過程對于超參的依賴性問題,、神經(jīng)網(wǎng)絡(luò)記憶災(zāi)難,、訓(xùn)練時間復(fù)雜度分析等問題;發(fā)展卷積網(wǎng)絡(luò),、Transformer網(wǎng)絡(luò),、擴(kuò)散模型,、混合專家模型等模型的收斂速度更快、時間復(fù)雜度更低的訓(xùn)練方法,。
4.大模型的基礎(chǔ)問題,。
研究多任務(wù)、多數(shù)據(jù),、大模型的基礎(chǔ)問題,,包括但不限于大模型的表示理論和泛化理論、大模型訓(xùn)練的穩(wěn)定性,、標(biāo)度率(scaling law),、涌現(xiàn)等現(xiàn)象;研究新型 (structured) state model的基礎(chǔ)性質(zhì),,包括它是否有記憶災(zāi)難(curse of memory)的困難,;理解Transformer模型的表達(dá)和泛化能力、上下文學(xué)習(xí)(In-Context learning),,Chain of Thoughts推理的有效性,,以及模型的外推能力(例如length generalization)等。
5.微分方程與機(jī)器學(xué)習(xí),。
研究求解微分方程正反問題及解算子逼近的概率機(jī)器學(xué)習(xí)方法,;基于生成式擴(kuò)散概率模型的物理場生成、模擬與補(bǔ)全框架,;基于微分方程設(shè)計新的機(jī)器學(xué)習(xí)模型和網(wǎng)絡(luò)結(jié)構(gòu),,加速模型的推理、分析神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,。
6.圖神經(jīng)網(wǎng)絡(luò)的新方法,。
利用隨機(jī)游走、多項式近似,、調(diào)和分析,、粒子方程等數(shù)學(xué)理論解決深度圖神經(jīng)網(wǎng)絡(luò)過度光滑、過度擠壓,、適用異配圖與動態(tài)圖等問題,;針對藥物設(shè)計、推薦系統(tǒng),、多智能體網(wǎng)絡(luò)協(xié)同控制等重要應(yīng)用場景設(shè)計有效的,、可擴(kuò)展的、具有可解釋性的圖表示學(xué)習(xí)方法,。
7.人工智能的安全性問題,。
針對主流機(jī)器學(xué)習(xí)問題,發(fā)展隱私保護(hù)協(xié)同訓(xùn)練和預(yù)測方法;發(fā)展面向?qū)箻颖?、?shù)據(jù)投毒,、后門等分析、攻擊,、防御和修復(fù)方法,;研究機(jī)器學(xué)習(xí)框架對模型干擾、破壞和控制的方法,;發(fā)展可控精度的隱私計算方法,,數(shù)據(jù)和模型(包括大模型)的公平性、可靠性的評估與評級方法,。
8.科學(xué)計算領(lǐng)域的人工智能方法,。
針對電子多體問題,建立薛定諤方程數(shù)值計算,、第一性原理計算,、自由能計算、粗?;肿觿恿W(xué)等的人工智能方法,,探索人工智能方法在電池、電催化,、合金,、光伏等體系研究中的應(yīng)用。
針對典型的物理,、化學(xué),、材料、生物,、燃燒等領(lǐng)域的跨尺度問題和動力學(xué)問題,,發(fā)展物理模型與人工智能的融合方法,探索復(fù)雜體系變量隱含物理關(guān)系的挖掘方法和構(gòu)效關(guān)系的數(shù)學(xué)表達(dá),,建立具有通用性的跨尺度人工智能輔助計算理論和方法,,解決典型復(fù)雜多尺度計算問題。
9.以數(shù)據(jù)為中心的機(jī)器學(xué)習(xí),。
針對數(shù)據(jù)質(zhì)量、數(shù)量和效率等因素,,發(fā)展機(jī)器學(xué)習(xí)方法為下游機(jī)器學(xué)習(xí)模型提供大量高質(zhì)量數(shù)據(jù),;針對AI for Science數(shù)據(jù)側(cè),研究和設(shè)計高效的科學(xué)數(shù)據(jù)(如對蛋白質(zhì)和藥物構(gòu)圖)構(gòu)建和預(yù)處理方式,;針對大模型數(shù)據(jù)側(cè),,從數(shù)據(jù)獲取成本和效率出發(fā),建立科學(xué)和系統(tǒng)的數(shù)據(jù)質(zhì)量評估策略,,設(shè)計高效的數(shù)據(jù)選擇方法,,構(gòu)建有效的數(shù)據(jù)配比方式,,并探索大模型輔助數(shù)據(jù)質(zhì)量提升的方法(如自動數(shù)據(jù)標(biāo)注)。
10.基于量子計算的機(jī)器學(xué)習(xí)算法,。
研究不同類型的學(xué)習(xí)方法如何映射到一般的量子過程,,提出新算法利用量子特性實現(xiàn)高效學(xué)習(xí);研究量子機(jī)器學(xué)習(xí)相對于經(jīng)典機(jī)器學(xué)習(xí)方法在表達(dá)能力以及泛化能力上的優(yōu)勢,,探索量子機(jī)器學(xué)習(xí)的可解釋性,,建立量子機(jī)器學(xué)習(xí)在量子物理和化學(xué)的應(yīng)用場景。
11.開放型項目,。
與可解釋,、可通用的下一代人工智能方法和AI for Science 領(lǐng)域相關(guān)的方法,重點支持在算法和模型方面的創(chuàng)新課題,。
?。ǘ┲攸c支持項目。
圍繞核心科學(xué)問題,,以總體科學(xué)目標(biāo)為牽引,,擬以重點支持項目的方式資助前期研究成果積累較好、對總體科學(xué)目標(biāo)在理論和關(guān)鍵技術(shù)上能發(fā)揮推動作用,、具備產(chǎn)學(xué)研用基礎(chǔ)的申請項目,,研究方向如下:
1.下一代人工智能方法。
發(fā)展結(jié)合邏輯推理,、知識和規(guī)則的人工智能方法,,建立具有可解釋和可通用性的人工智能理論框架;發(fā)展適用于連續(xù),、密集數(shù)據(jù)(如圖像)和非結(jié)構(gòu)化數(shù)據(jù)(如分子結(jié)構(gòu))的新型神經(jīng)網(wǎng)絡(luò)架構(gòu),,有效捕捉空間、結(jié)構(gòu),、語義等多維度的上下文信息,,提高對數(shù)據(jù)的建模能力。在真實數(shù)據(jù)集上進(jìn)行驗證,。
2.新一代腦啟發(fā)的人工智能模型與有效訓(xùn)練算法,。
針對大腦神經(jīng)元的物理形態(tài)和生物物理的多樣性,建立生物神經(jīng)元與人工神經(jīng)元之間的簡潔且有效的映射關(guān)系,,使人工神經(jīng)元具有生物神經(jīng)元的樹突非線性整合與計算功能,,為建立其它類型生物神經(jīng)元與人工神經(jīng)元的映射提供統(tǒng)一的理論和算法框架。結(jié)合大腦神經(jīng)元網(wǎng)絡(luò)連接結(jié)構(gòu),、腦區(qū)異質(zhì)性和宏觀梯度等特點,,設(shè)計帶生物神經(jīng)元特性約束的人工神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)記憶、決策等高級認(rèn)知功能,。實現(xiàn)不少于3種生物神經(jīng)元與人工神經(jīng)元之間的有效映射和3種重要的樹突計算功能,,與現(xiàn)有映射相比,實現(xiàn)精度,、性能和參數(shù)可解釋性上的提升,。
3.多智能體協(xié)作學(xué)習(xí)理論與方法。
針對多智能體協(xié)作時分布式數(shù)據(jù)處理所面對的挑戰(zhàn),,如泛化性能缺乏保障,、適應(yīng)性和可擴(kuò)展性弱等難題,研究高效的多智能體協(xié)作學(xué)習(xí)理論與方法,,具體包括:(1)研究提升多智能體協(xié)作學(xué)習(xí)系統(tǒng)泛化性能的算法,,分析泛化誤差界;(2)針對動態(tài)變化的環(huán)境和不斷擴(kuò)展的網(wǎng)絡(luò)規(guī)模,,研究多智能體系統(tǒng)的適應(yīng)性和可擴(kuò)展性,,確保智能體能夠有效學(xué)習(xí)并高效協(xié)作;(3)在多智能體系統(tǒng)中處理和融合多模態(tài)數(shù)據(jù)(如文本,、圖像和傳感器數(shù)據(jù))的方法,,以增強(qiáng)學(xué)習(xí)效果和提升決策質(zhì)量;(4)研究在實時或近實時環(huán)境中的協(xié)作學(xué)習(xí)和決策策略,,關(guān)注動態(tài)和不確定環(huán)境下的應(yīng)急響應(yīng)和關(guān)鍵決策,;(5)探究智能體的個性化學(xué)習(xí)策略,在保持個體優(yōu)勢的同時有效進(jìn)行集體學(xué)習(xí)和知識共享,。
4.多模態(tài)融合及生成基礎(chǔ)模型,。
研究多模態(tài)數(shù)據(jù)融合及生成的基礎(chǔ)模型,解決數(shù)據(jù)視角,、維度,、密度、采集和標(biāo)注難易程度不同而造成的融合難題,;研究模態(tài)融合過程中的模態(tài)對齊問題,,保證模態(tài)預(yù)測的一致性并減少融合過程中信息損失;研究輕量級的融合模型,,提升在模態(tài)間非完美對齊狀態(tài)下融合模型的魯棒性,;研究用易采集、易標(biāo)注模態(tài)數(shù)據(jù)來引導(dǎo)難采集,、難標(biāo)注模態(tài)數(shù)據(jù)的預(yù)訓(xùn)練與微調(diào)方法,;研究大規(guī)模多任務(wù)、多模態(tài)學(xué)習(xí)的預(yù)訓(xùn)練問題,,實現(xiàn)少樣本/零樣本遷移,發(fā)展跨模態(tài)多樣性數(shù)據(jù)生成的方法;研究多模態(tài)大模型的新型,、統(tǒng)一概率建模方法,,解決離散、連續(xù)混合數(shù)據(jù)類型的概率建模與生成難題,,提高多模態(tài)基礎(chǔ)模型的生成效率,。在多模態(tài)模型中實現(xiàn)不少于3個模態(tài)的表示學(xué)習(xí)、對齊及生成能力,,模型參數(shù)不少于7B,,探索在智能座艙、自動駕駛或多模態(tài)對話等領(lǐng)域的應(yīng)用驗證,。積累用于訓(xùn)練多模態(tài)大模型的優(yōu)質(zhì)標(biāo)注數(shù)據(jù),,并探索數(shù)據(jù)閉環(huán),采集數(shù)量超過標(biāo)注樣本不少于2個量級的非完美標(biāo)注或無標(biāo)注數(shù)據(jù),,實現(xiàn)模型迭代優(yōu)化,。
5.模型與數(shù)據(jù)融合的大模型訓(xùn)練方法。
探索系統(tǒng)性的,、自適應(yīng)數(shù)據(jù)選取方法,,以達(dá)到數(shù)據(jù)和模型的有機(jī)融合,包括:在模型訓(xùn)練過程中on-the-fly 選取下一步所采用的數(shù)據(jù)的方法,;建立數(shù)據(jù)和模型有機(jī)融合的機(jī)器學(xué)習(xí)框架,;發(fā)展替代大模型訓(xùn)練普遍采用的先處理數(shù)據(jù)、再做模型訓(xùn)練的兩步走模式的有效方法,。
6.視頻原生的自監(jiān)督學(xué)習(xí)方法,。
針對視頻數(shù)據(jù)既是時間序列又是圖像,但又不同于一般的時間序列和圖像的特點,,充分利用視頻數(shù)據(jù)的屬性和特點,,發(fā)展一套新的自監(jiān)督學(xué)習(xí)框架,類比針對時間序列的predict next token 的框架和針對圖像數(shù)據(jù)的填空框架,,并在實際視頻數(shù)據(jù)集上加以驗證,。
7.支持下一代人工智能的通用型高質(zhì)量科學(xué)數(shù)據(jù)庫。
大規(guī)模高質(zhì)量科學(xué)數(shù)據(jù)是人工智能驅(qū)動的科學(xué)研究新范式的必要條件,。研究科學(xué)數(shù)據(jù),、科技文獻(xiàn)等的知識對象標(biāo)注、抽取,、融合中的主動學(xué)習(xí)機(jī)制與自動關(guān)聯(lián)算法,;研究面向知識對象的智能編碼與機(jī)器可識讀的多元解析,支持跨領(lǐng)域知識對象的廣譜關(guān)聯(lián),,實現(xiàn)與不少于3個國際主流科技資源標(biāo)識動態(tài)互通,,支持與外部數(shù)據(jù)資源智能化融合,;研究多模態(tài)跨學(xué)科知識碎片對齊與知識對象識別方法,以及多學(xué)科領(lǐng)域數(shù)據(jù)自動生產(chǎn)與增強(qiáng)算法,,形成符合國際規(guī)范或經(jīng)同行評議的且覆蓋不少于8個學(xué)科領(lǐng)域的高質(zhì)量科學(xué)數(shù)據(jù)1PB以上,。
8.AI for Science 的基礎(chǔ)設(shè)施建設(shè)與示范應(yīng)用。
發(fā)展AI for Science的基礎(chǔ)設(shè)施方法,,包括:基礎(chǔ)物理模型的人工智能算法,;高效率、高精度的實驗表征算法,;自動化和智能化實驗平臺建設(shè),;科學(xué)文獻(xiàn)和科學(xué)數(shù)據(jù)的整合與智能應(yīng)用。發(fā)展AI for Science的創(chuàng)新應(yīng)用,,包括但不限于:復(fù)雜催化體系(催化劑動態(tài)結(jié)構(gòu)變化,、反應(yīng)網(wǎng)絡(luò)高度復(fù)雜等問題);碳達(dá)峰和碳中和中的核心催化反應(yīng),;工況條件下的電化學(xué)表征方法,;生物醫(yī)學(xué)中的高效率和高精度的成像技術(shù);有機(jī)合成的自動化和智能化解決方案,;定向進(jìn)化蛋白質(zhì)工程等,。重點支持理論和實驗相結(jié)合并形成閉環(huán)的項目。
四,、項目遴選的基本原則
?。ㄒ唬┚o密圍繞核心科學(xué)問題,鼓勵基礎(chǔ)性和交叉性的前沿探索,,優(yōu)先支持原創(chuàng)性研究,。
(二)優(yōu)先支持面向發(fā)展下一代人工智能新方法或能推動人工智能新方法在科學(xué)領(lǐng)域應(yīng)用的研究項目,。
?。ㄈ┲攸c支持項目應(yīng)具有良好的研究基礎(chǔ)和前期積累,對總體科學(xué)目標(biāo)有直接貢獻(xiàn)與支撐,。
五,、2024年度資助計劃
擬資助培育項目約25項,直接費用資助強(qiáng)度不超過80萬元/項,,資助期限為3年,,培育項目申請書中研究期限應(yīng)填寫“2025年1月1日-2027年12月31日”;擬資助重點支持項目約6項,,直接費用資助強(qiáng)度約為300萬元/項,,資助期限為4年,重點支持項目申請書中研究期限應(yīng)填寫“2025年1月1日-2028年12月31日”,。
六,、申請要求及注意事項
?。ㄒ唬┥暾垪l件。
本重大研究計劃項目申請人應(yīng)當(dāng)具備以下條件:
1. 具有承擔(dān)基礎(chǔ)研究課題的經(jīng)歷,;
2. 具有高級專業(yè)技術(shù)職務(wù)(職稱),。
在站博士后研究人員、正在攻讀研究生學(xué)位以及無工作單位或者所在單位不是依托單位的人員不得作為申請人進(jìn)行申請,。
(二)限項申請規(guī)定,。
執(zhí)行《2024年度國家自然科學(xué)基金項目指南》“申請規(guī)定”中限項申請規(guī)定的相關(guān)要求,。
(三)申請注意事項,。
申請人和依托單位應(yīng)當(dāng)認(rèn)真閱讀并執(zhí)行本項目指南,、《2024年度國家自然科學(xué)基金項目指南》和《關(guān)于2024年度國家自然科學(xué)基金項目申請與結(jié)題等有關(guān)事項的通告》中相關(guān)要求。
1. 本重大研究計劃項目實行無紙化申請,。申請書提交日期為2024年4月15日-4月22日16時,。請有意申報的學(xué)院和教師盡快與科學(xué)技術(shù)處王老師、韓老師(89733253)聯(lián)系,,務(wù)必按照通知要求準(zhǔn)備材料并在4月18日16時前完成系統(tǒng)填報,。
(1)申請人應(yīng)當(dāng)按照科學(xué)基金網(wǎng)絡(luò)信息系統(tǒng)中重大研究計劃項目的填報說明與撰寫提綱要求在線填寫和提交電子申請書及附件材料,。
?。?)本重大研究計劃旨在緊密圍繞核心科學(xué)問題,對多學(xué)科相關(guān)研究進(jìn)行戰(zhàn)略性的方向引導(dǎo)和優(yōu)勢整合,,成為一個項目集群,。申請人應(yīng)根據(jù)本重大研究計劃擬解決的核心科學(xué)問題和項目指南公布的擬資助研究方向,自行擬定項目名稱,、科學(xué)目標(biāo),、研究內(nèi)容、技術(shù)路線和相應(yīng)的研究經(jīng)費等,。
?。?)申請書中的資助類別選擇“重大研究計劃”,亞類說明選擇“培育項目”或“重點支持項目”,,附注說明選擇“可解釋,、可通用的下一代人工智能方法”,受理代碼選擇T01,,根據(jù)申請的具體研究內(nèi)容選擇不超過5個申請代碼,。培育項目和重點支持項目的合作研究單位不得超過2個。
?。?)申請人在申請書起始部分應(yīng)明確說明申請符合本項目指南中的資助研究方向,,以及對解決本重大研究計劃核心科學(xué)問題,、實現(xiàn)本重大研究計劃科學(xué)目標(biāo)的貢獻(xiàn)。
如果申請人已經(jīng)承擔(dān)與本重大研究計劃相關(guān)的其他科技計劃項目,,應(yīng)當(dāng)在申請書正文的“研究基礎(chǔ)與工作條件”部分論述申請項目與其他相關(guān)項目的區(qū)別與聯(lián)系,。
2. 依托單位應(yīng)當(dāng)按照要求完成依托單位承諾、組織申請以及審核申請材料等工作,。在2024年4月22日16時前通過信息系統(tǒng)逐項確認(rèn)提交本單位電子申請書及附件材料,,并于4月23日16時前在線提交本單位項目申請清單。
3. 其他注意事項,。
?。?)為實現(xiàn)重大研究計劃總體科學(xué)目標(biāo)和多學(xué)科集成,獲得資助的項目負(fù)責(zé)人應(yīng)當(dāng)承諾遵守相關(guān)數(shù)據(jù)和資料管理與共享的規(guī)定,,項目執(zhí)行過程中應(yīng)關(guān)注與本重大研究計劃其他項目之間的相互支撐關(guān)系,。
(2)為加強(qiáng)項目的學(xué)術(shù)交流,,促進(jìn)項目群的形成和多學(xué)科交叉與集成,,本重大研究計劃將每年舉辦1次資助項目的年度學(xué)術(shù)交流會,并將不定期地組織相關(guān)領(lǐng)域的學(xué)術(shù)研討會,。獲資助項目負(fù)責(zé)人有義務(wù)參加本重大研究計劃指導(dǎo)專家組和管理工作組所組織的上述學(xué)術(shù)交流活動,。
(四)咨詢方式,。
交叉科學(xué)部交叉科學(xué)一處
聯(lián)系電話:010-62328382