最高300萬元/項! 可解釋、可通用的下一代人工智能方法重大研究計劃2024年度項目指南
關于發布可解釋、可通用的下一代人工智能方法重大研究計劃2024年度項目指南的通告
國科金發計〔2024〕113號
國家自然科學基金委員會現發布可解釋、可通用的下一代人工智能方法重大研究計劃2024年度項目指南,請申請人及依托單位按項目指南所述要求和注意事項申請。
國家自然科學基金委員會
2024年3月14日
可解釋、可通用的下一代人工智能方法重大研究計劃2024年度項目指南?
可解釋、可通用的下一代人工智能方法重大研究計劃面向人工智能發展國家重大戰略需求,以人工智能的基礎科學問題為核心,發展人工智能新方法體系,促進我國人工智能基礎研究和人才培養,支撐我國在新一輪國際科技競爭中的主導地位。
一、科學目標
本重大研究計劃面向以深度學習為代表的人工智能方法魯棒性差、可解釋性差、對數據的依賴性強等基礎科學問題,挖掘機器學習的基本原理,發展可解釋、可通用的下一代人工智能方法,并推動人工智能方法在科學領域的創新應用。
二、核心科學問題
本重大研究計劃針對可解釋、可通用的下一代人工智能方法的基礎科學問題,圍繞以下三個核心科學問題開展研究。
(一)深度學習的基本原理。
深入挖掘深度學習模型對超參數的依賴關系,理解深度學習背后的工作原理,建立深度學習方法的逼近理論、泛化誤差分析理論和優化算法的收斂性理論。
(二)可解釋、可通用的下一代人工智能方法。
通過規則與學習結合的方式,建立高精度、可解釋、可通用且不依賴大量標注數據的人工智能新方法。開發下一代人工智能方法需要的數據庫和模型訓練平臺,完善下一代人工智能方法驅動的基礎設施。
(三)面向科學領域的下一代人工智能方法的應用。
發展新物理模型和算法,建設開源科學數據庫、知識庫、物理模型庫和算法庫,推動人工智能新方法在解決科學領域復雜問題上的示范性應用。
三、2024年度資助研究方向
(一)培育項目。
圍繞上述科學問題,以總體科學目標為牽引,對于探索性強、選題新穎、前期研究基礎較好的申請項目,將以培育項目的方式予以資助,研究方向如下:
1.神經網絡的新架構和新的預訓練或自監督學習方法。
針對圖像、視頻、圖、流場等數據,發展更高效的神經網絡新架構,預訓練或自監督學習方法,并在真實數據集上進行驗證。
2.深度學習的表示理論和泛化理論。
研究卷積神經網絡(以及其它帶對稱性的網絡)、圖神經網絡、循環神經網絡、低精度神經網絡、動態神經網絡、生成擴散模型等模型的泛化誤差分析理論、魯棒性和穩定性理論,并在實際數據集上進行驗證;研究無監督表示學習、預訓練-微調范式等方法的理論基礎,發展新的泛化分析方法,指導深度學習模型和算法設計。
3.深度學習訓練算法的理論基礎。
研究神經網絡損失景觀的結構和訓練算法的特性,包括但不限于:臨界點的分布及其嵌入結構、極小點的連通性,穩定性邊緣(edge of stability)和損失尖峰(loss spike)現象、算法的隱式正則化、穩定性和收斂性;訓練過程對于超參的依賴性問題、神經網絡記憶災難、訓練時間復雜度分析等問題;發展卷積網絡、Transformer網絡、擴散模型、混合專家模型等模型的收斂速度更快、時間復雜度更低的訓練方法。
4.大模型的基礎問題。
研究多任務、多數據、大模型的基礎問題,包括但不限于大模型的表示理論和泛化理論、大模型訓練的穩定性、標度率(scaling law)、涌現等現象;研究新型 (structured) state model的基礎性質,包括它是否有記憶災難(curse of memory)的困難;理解Transformer模型的表達和泛化能力、上下文學習(In-Context learning),Chain of Thoughts推理的有效性,以及模型的外推能力(例如length generalization)等。
5.微分方程與機器學習。
研究求解微分方程正反問題及解算子逼近的概率機器學習方法;基于生成式擴散概率模型的物理場生成、模擬與補全框架;基于微分方程設計新的機器學習模型和網絡結構,加速模型的推理、分析神經網絡的訓練過程。
6.圖神經網絡的新方法。
利用隨機游走、多項式近似、調和分析、粒子方程等數學理論解決深度圖神經網絡過度光滑、過度擠壓、適用異配圖與動態圖等問題;針對藥物設計、推薦系統、多智能體網絡協同控制等重要應用場景設計有效的、可擴展的、具有可解釋性的圖表示學習方法。
7.人工智能的安全性問題。
針對主流機器學習問題,發展隱私保護協同訓練和預測方法;發展面向對抗樣本、數據投毒、后門等分析、攻擊、防御和修復方法;研究機器學習框架對模型干擾、破壞和控制的方法;發展可控精度的隱私計算方法,數據和模型(包括大模型)的公平性、可靠性的評估與評級方法。
8.科學計算領域的人工智能方法。
針對電子多體問題,建立薛定諤方程數值計算、第一性原理計算、自由能計算、粗粒化分子動力學等的人工智能方法,探索人工智能方法在電池、電催化、合金、光伏等體系研究中的應用。
針對典型的物理、化學、材料、生物、燃燒等領域的跨尺度問題和動力學問題,發展物理模型與人工智能的融合方法,探索復雜體系變量隱含物理關系的挖掘方法和構效關系的數學表達,建立具有通用性的跨尺度人工智能輔助計算理論和方法,解決典型復雜多尺度計算問題。
9.以數據為中心的機器學習。
針對數據質量、數量和效率等因素,發展機器學習方法為下游機器學習模型提供大量高質量數據;針對AI for Science數據側,研究和設計高效的科學數據(如對蛋白質和藥物構圖)構建和預處理方式;針對大模型數據側,從數據獲取成本和效率出發,建立科學和系統的數據質量評估策略,設計高效的數據選擇方法,構建有效的數據配比方式,并探索大模型輔助數據質量提升的方法(如自動數據標注)。
10.基于量子計算的機器學習算法。
研究不同類型的學習方法如何映射到一般的量子過程,提出新算法利用量子特性實現高效學習;研究量子機器學習相對于經典機器學習方法在表達能力以及泛化能力上的優勢,探索量子機器學習的可解釋性,建立量子機器學習在量子物理和化學的應用場景。
11.開放型項目。
與可解釋、可通用的下一代人工智能方法和AI for Science 領域相關的方法,重點支持在算法和模型方面的創新課題。
(二)重點支持項目。
圍繞核心科學問題,以總體科學目標為牽引,擬以重點支持項目的方式資助前期研究成果積累較好、對總體科學目標在理論和關鍵技術上能發揮推動作用、具備產學研用基礎的申請項目,研究方向如下:
1.下一代人工智能方法。
發展結合邏輯推理、知識和規則的人工智能方法,建立具有可解釋和可通用性的人工智能理論框架;發展適用于連續、密集數據(如圖像)和非結構化數據(如分子結構)的新型神經網絡架構,有效捕捉空間、結構、語義等多維度的上下文信息,提高對數據的建模能力。在真實數據集上進行驗證。
2.新一代腦啟發的人工智能模型與有效訓練算法。
針對大腦神經元的物理形態和生物物理的多樣性,建立生物神經元與人工神經元之間的簡潔且有效的映射關系,使人工神經元具有生物神經元的樹突非線性整合與計算功能,為建立其它類型生物神經元與人工神經元的映射提供統一的理論和算法框架。結合大腦神經元網絡連接結構、腦區異質性和宏觀梯度等特點,設計帶生物神經元特性約束的人工神經網絡模型,實現記憶、決策等高級認知功能。實現不少于3種生物神經元與人工神經元之間的有效映射和3種重要的樹突計算功能,與現有映射相比,實現精度、性能和參數可解釋性上的提升。
3.多智能體協作學習理論與方法。
針對多智能體協作時分布式數據處理所面對的挑戰,如泛化性能缺乏保障、適應性和可擴展性弱等難題,研究高效的多智能體協作學習理論與方法,具體包括:(1)研究提升多智能體協作學習系統泛化性能的算法,分析泛化誤差界;(2)針對動態變化的環境和不斷擴展的網絡規模,研究多智能體系統的適應性和可擴展性,確保智能體能夠有效學習并高效協作;(3)在多智能體系統中處理和融合多模態數據(如文本、圖像和傳感器數據)的方法,以增強學習效果和提升決策質量;(4)研究在實時或近實時環境中的協作學習和決策策略,關注動態和不確定環境下的應急響應和關鍵決策;(5)探究智能體的個性化學習策略,在保持個體優勢的同時有效進行集體學習和知識共享。
4.多模態融合及生成基礎模型。
研究多模態數據融合及生成的基礎模型,解決數據視角、維度、密度、采集和標注難易程度不同而造成的融合難題;研究模態融合過程中的模態對齊問題,保證模態預測的一致性并減少融合過程中信息損失;研究輕量級的融合模型,提升在模態間非完美對齊狀態下融合模型的魯棒性;研究用易采集、易標注模態數據來引導難采集、難標注模態數據的預訓練與微調方法;研究大規模多任務、多模態學習的預訓練問題,實現少樣本/零樣本遷移,發展跨模態多樣性數據生成的方法;研究多模態大模型的新型、統一概率建模方法,解決離散、連續混合數據類型的概率建模與生成難題,提高多模態基礎模型的生成效率。在多模態模型中實現不少于3個模態的表示學習、對齊及生成能力,模型參數不少于7B,探索在智能座艙、自動駕駛或多模態對話等領域的應用驗證。積累用于訓練多模態大模型的優質標注數據,并探索數據閉環,采集數量超過標注樣本不少于2個量級的非完美標注或無標注數據,實現模型迭代優化。
5.模型與數據融合的大模型訓練方法。
探索系統性的、自適應數據選取方法,以達到數據和模型的有機融合,包括:在模型訓練過程中on-the-fly 選取下一步所采用的數據的方法;建立數據和模型有機融合的機器學習框架;發展替代大模型訓練普遍采用的先處理數據、再做模型訓練的兩步走模式的有效方法。
6.視頻原生的自監督學習方法。
針對視頻數據既是時間序列又是圖像,但又不同于一般的時間序列和圖像的特點,充分利用視頻數據的屬性和特點,發展一套新的自監督學習框架,類比針對時間序列的predict next token 的框架和針對圖像數據的填空框架,并在實際視頻數據集上加以驗證。
7.支持下一代人工智能的通用型高質量科學數據庫。
大規模高質量科學數據是人工智能驅動的科學研究新范式的必要條件。研究科學數據、科技文獻等的知識對象標注、抽取、融合中的主動學習機制與自動關聯算法;研究面向知識對象的智能編碼與機器可識讀的多元解析,支持跨領域知識對象的廣譜關聯,實現與不少于3個國際主流科技資源標識動態互通,支持與外部數據資源智能化融合;研究多模態跨學科知識碎片對齊與知識對象識別方法,以及多學科領域數據自動生產與增強算法,形成符合國際規范或經同行評議的且覆蓋不少于8個學科領域的高質量科學數據1PB以上。
8.AI for Science 的基礎設施建設與示范應用。
發展AI for Science的基礎設施方法,包括:基礎物理模型的人工智能算法;高效率、高精度的實驗表征算法;自動化和智能化實驗平臺建設;科學文獻和科學數據的整合與智能應用。發展AI for Science的創新應用,包括但不限于:復雜催化體系(催化劑動態結構變化、反應網絡高度復雜等問題);碳達峰和碳中和中的核心催化反應;工況條件下的電化學表征方法;生物醫學中的高效率和高精度的成像技術;有機合成的自動化和智能化解決方案;定向進化蛋白質工程等。重點支持理論和實驗相結合并形成閉環的項目。
四、項目遴選的基本原則
(一)緊密圍繞核心科學問題,鼓勵基礎性和交叉性的前沿探索,優先支持原創性研究。
(二)優先支持面向發展下一代人工智能新方法或能推動人工智能新方法在科學領域應用的研究項目。
(三)重點支持項目應具有良好的研究基礎和前期積累,對總體科學目標有直接貢獻與支撐。
五、2024年度資助計劃
擬資助培育項目約25項,直接費用資助強度不超過80萬元/項,資助期限為3年,培育項目申請書中研究期限應填寫“2025年1月1日-2027年12月31日”;擬資助重點支持項目約6項,直接費用資助強度約為300萬元/項,資助期限為4年,重點支持項目申請書中研究期限應填寫“2025年1月1日-2028年12月31日”。
六、申請要求及注意事項
(一)申請條件。
本重大研究計劃項目申請人應當具備以下條件:
1. 具有承擔基礎研究課題的經歷;
2. 具有高級專業技術職務(職稱)。
在站博士后研究人員、正在攻讀研究生學位以及無工作單位或者所在單位不是依托單位的人員不得作為申請人進行申請。
(二)限項申請規定。
執行《2024年度國家自然科學基金項目指南》“申請規定”中限項申請規定的相關要求。
(三)申請注意事項。
申請人和依托單位應當認真閱讀并執行本項目指南、《2024年度國家自然科學基金項目指南》和《關于2024年度國家自然科學基金項目申請與結題等有關事項的通告》中相關要求。
1. 本重大研究計劃項目實行無紙化申請。申請書提交日期為2024年4月15日-4月22日16時。
(1)申請人應當按照科學基金網絡信息系統中重大研究計劃項目的填報說明與撰寫提綱要求在線填寫和提交電子申請書及附件材料。
(2)本重大研究計劃旨在緊密圍繞核心科學問題,對多學科相關研究進行戰略性的方向引導和優勢整合,成為一個項目集群。申請人應根據本重大研究計劃擬解決的核心科學問題和項目指南公布的擬資助研究方向,自行擬定項目名稱、科學目標、研究內容、技術路線和相應的研究經費等。
(3)申請書中的資助類別選擇“重大研究計劃”,亞類說明選擇“培育項目”或“重點支持項目”,附注說明選擇“可解釋、可通用的下一代人工智能方法”,受理代碼選擇T01,根據申請的具體研究內容選擇不超過5個申請代碼。培育項目和重點支持項目的合作研究單位不得超過2個。
(4)申請人在申請書起始部分應明確說明申請符合本項目指南中的資助研究方向,以及對解決本重大研究計劃核心科學問題、實現本重大研究計劃科學目標的貢獻。
如果申請人已經承擔與本重大研究計劃相關的其他科技計劃項目,應當在申請書正文的“研究基礎與工作條件”部分論述申請項目與其他相關項目的區別與聯系。
2. 依托單位應當按照要求完成依托單位承諾、組織申請以及審核申請材料等工作。在2024年4月22日16時前通過信息系統逐項確認提交本單位電子申請書及附件材料,并于4月23日16時前在線提交本單位項目申請清單。
3. 其他注意事項。
(1)為實現重大研究計劃總體科學目標和多學科集成,獲得資助的項目負責人應當承諾遵守相關數據和資料管理與共享的規定,項目執行過程中應關注與本重大研究計劃其他項目之間的相互支撐關系。
(2)為加強項目的學術交流,促進項目群的形成和多學科交叉與集成,本重大研究計劃將每年舉辦1次資助項目的年度學術交流會,并將不定期地組織相關領域的學術研討會。獲資助項目負責人有義務參加本重大研究計劃指導專家組和管理工作組所組織的上述學術交流活動。
(四)咨詢方式。
交叉科學部交叉科學一處
聯系電話:010-62328382
? ? ???來源:國家自然科學基金委員會
單位介紹:
? ? ? ? ?我單位主要從事國家級科技成果評價、國家科技計劃項目申報咨詢(工信部、發改委、科技部等)、項目戰略研討、專家考察調研、研發平臺搭建、開展科技政策培訓、企業內訓等相關業務。利用強大的專家資源,為廣大科研工作者及科技型企事業單位提供專業化服務。
? ? ?近期相關科技培訓:
? ? ?3月20-22日成都|2024 年科技項目申報與經費使用管理、結題審計、綜合績效評價改革專題培訓班
? ? 3月20—23日上海、4月10—13日北京、4月17—20日成都、5月15—18日蘇州 |2024年國家科技計劃項目申報和科研平臺建設運行、科研經費全過程管理與信息化建設高級研修班
3月27-30日重慶、4月23-26日杭州|高價值專利布局、專利檢索分析及科技成果轉化運用能力提升培訓班
3月27-30日揚州 |科技成果轉移、轉化操作實務及商業秘密風險防范培訓班
? ? ?如有相關需求可聯系: 王主任 ,電話:13426056628(同微信)
? ? ?(微信掃描下方二維碼關注微信公眾號,及時了解最新科技政策消息及近期科技培訓計劃動態。)
本文標簽:國家自然科學基金
本文地址: http://www.qqxuanwuwg.com/6839.html/ 轉載請注明出處!