衛星雖被形象地稱為“天眼”,事實上衛星數據的應用,卻難以做到“盡收盡用”。
中國工程院院士楊小牛就曾經表示,衛星在天上飛來飛去,效能其實并不高,每天只有幾十分鐘時段內采集到的數據是地面需要的。
那些大量的被認為是無效數據的“廢片”,有沒有可能被利用起來?
近日,清華大學理學院院長、地球系統科學系主任宮鵬介紹,在高性能云計算的支持下,通過數據建模、人工智能算法等手段,清華大學地球系統科學系制作完成了首套中國30米逐日無縫遙感觀測數據集,以及逐季節土地覆蓋和逐年土地利用的數據集,讓“拼圖無解”的衛星“廢片”能夠成為高分辨率的地圖資源。
人工智能深度“補片”
“傳統的對地衛星觀測,拍下來的照片是不同時間采集的,拼在一起并不完整,使用門檻很高。”宮鵬解釋,衛星直接獲得的圖片不能拿來直接用,因為衛星圖片不是自然連續的,很可能像100塊的拼圖,有時候是少了50塊的效果,但也有可能同樣的拼圖來了好幾塊。
不止如此,衛星軌道的偏差還會造成同一地方不同時間拍攝的圖片難以重疊,云彩的遮擋、霧氣不均勻的散射都會導致大量的衛星遙感數據難以反映地表的真實情況,而成為難用的“廢片”。
基于此前完成10米分辨率全球地表覆蓋制圖數據處理過程中積累的經驗,清華大學地球系統科學系團隊自主研發了時空數據融合重建的技術。
“我們構建了人工智能需要的知識庫,其中包括世界首套全球全季節普適樣本庫和相關領域知識。庫中分為訓練樣本庫和完全獨立的驗證樣本庫。”清華大學博士生劉涵介紹,團隊設計了一套適應遙感大數據的深度遙感特征學習和分類模型,利用機器學習和數據建模對人工智能系統進行了訓練,使其能夠“理解”或者說“推斷”出缺失的圖塊,進而補缺。
“就好像現在一些APP身份驗證時,會有一個補圖的步驟,經過訓練的模型,也可以大規模分析現有的衛星圖片,自動補圖,且做到數據與真實情況相符合。”劉涵說。
通過訓練,模型可完成高性能的推理,把不完整的“拼圖”重建成時空一致的圖像庫,建立起這一深度遙感制圖模型的“超能力”,完成各種不合格“廢片”的補片工作,從而生成與真實情況相匹配的遙感觀測數據集。例如通過人工智能技術可識別路面是瀝青、土路還是水泥路面等地表覆蓋類型。
計算上云避免巨大資源消耗
“地球系統科學使用和產生的數據是極其巨大的,例如氣候模擬和預測會生成時間間隔在小時級、地面分辨率是3公里的氣候數據,這些數據的數據量級往往相當于數百萬集高清電影的量級。”宮鵬介紹,因此需要超強算力來完成。
如果為這些數據進行數據中心建設的話,需要三四百個機柜,占地成本和時間成本耗費巨大。對這些數據集中的數據進行AI處理時,如果不在云上進行而是搬運下載后再運算,那光是用來搬運的時間也可能需要幾個月。
而通過云上高性能計算,則能夠把算力部署在公共數據集周邊,圍繞數據進行計算。據介紹,亞馬遜云服務(AWS)為此次項目的完成提供了10萬核左右的云上高性能計算資源。
此外,AWS上還提供一整套完善的人工智能和機器學習的套件和服務以及自動化多層堆疊集成技術,可用于對模型結構和參數進行深度調優,并進行分布式高性能推理。
“現在中學生、小學生想拿數據做點什么,從里面拉幾條曲線,或者把一個區域拿出來做一些探測、變化、趨勢的分析,都已經變得非常容易。”宮鵬說,對于衛星公共數據的梳理、重建,讓衛星遙感圖的使用門檻大大降低,如果說之前只有專業用戶能從數據中獲得價值,那么以后更多的普通用戶也能看懂和利用這些數據。
掃一掃在手機上閱讀本文章