全球首個百億級遙感解譯基礎模型發(fā)布

發(fā)布日期：2024-09-22

　　第一屆空天信息技術大會9月21日開幕。大會期間，中國科學院空天信息創(chuàng)新研究院付琨研究員團隊聯合鵬城實驗室，正式發(fā)布自主研制的百億級遙感解譯基礎模型——“空天·靈眸”3.0版。這是迄今為止全球首個百億參數級空天一體遙感解譯基礎模型。

　　近年來，我國遙感數據獲取能力不斷增強，已進入遙感大數據時代，人工智能等新型數據處理方式也為數據服務模式的變革提供了可能。“空天·靈眸”是我國首個面向多模態(tài)遙感數據生成式基礎模型，也是首個專為遙感領域打造的專業(yè)基礎模型。自2022年首次推出后，中國科學院空天信息創(chuàng)新研究院研究團隊在“基礎模型+下游任務”計算范式積累上持續(xù)探索。今年3月起，研究團隊與鵬城實驗室深度合作，基于中國算力網“鵬城云腦II”樞紐節(jié)點，采用512張昇騰910顯卡，歷時數月攻關完成了在4億張國產化多模態(tài)空天遙感數據樣本上的預訓練，基礎模型參數規(guī)模首次超過百億。

　　中國科學院空天信息創(chuàng)新研究院研究員孫顯介紹，如果把基礎模型看作是一個機器人，那么，“參數”就相當于它的“記憶細胞”和“知識細胞”。如果參數規(guī)模小，則它能記住和處理的信息就相對有限，只能做一些比較簡單的任務。參數規(guī)模越大，這兩種“細胞”就越多，它就能捕捉、記憶和處理更復雜的信息，從而更加準確、精細地完成更困難、更復雜的任務。

　　“空天·靈眸”3.0版內核工作架構是基于熱傳導，這是聯合團隊自主研發(fā)的一套小而精的原創(chuàng)性架構。受傳熱學物理思想啟發(fā)，聯合團隊將場景目標間視覺語義傳播建模為熱能擴散過程，從而使該架構有效突破了遙感模型推理的性能和速度瓶頸，計算速度較傳統(tǒng)結構模型提升2.4倍以上。

　　“空天·靈眸”3.0版目前已表現出極為優(yōu)秀的泛化解譯性能，在可見光、合成孔徑雷達、熱紅外、多光譜等多傳感器衛(wèi)星數據基礎上，拓展至航空遙感飛機、無人機等不同航空平臺觀測數據的自動化、高精度解譯處理。尤其是航空大傾角成像過程中，極易出現畸變、遮擋、缺失等干擾，模型對此依然可以保持高精度的識別能力。

　　目前，“空天·靈眸”3.0版在覆蓋場景分類、目標檢測、語義分割、變化檢測等六大類任務的23個國際基準數據集上測試，比當前的主流模型，精度平均提升4%至10%，指標均達到領先水平，并已在應急、國土、海洋、住建等多個行業(yè)部署試運行，特別是在最具挑戰(zhàn)性的復雜要素精細分類、運動小目標連續(xù)跟蹤等任務上性能卓越，為天臨空地一體化應用提供了一套行之有效的解決方案。未來，研究團隊將持續(xù)推動“空天·靈眸”3.0版在國民經濟各個行業(yè)的落地應用。

編輯：