《全國數據資源調查報告(2023年)》發布:數據資源六大特征展示數據要素發展方向
- 時間:2024-05-29
- 來源:遠光軟件
內容來源:人民數據
5月24日,在第七屆數字中國建設峰會“數據資源與數字安全分論壇”上,正式發布了《全國數據資源調查報告(2023年)》,這是我國首次對數據資源進行“全面體檢”。
《報告》顯示,我國數據資源“產—存—算”規模優勢基本形成,數據“供—流—用”各環節主體逐漸豐富,海量數據和豐富場景優勢潛力亟需釋放,數據資源管理和利用整體處于起步階段。
當前,我國數據資源有以下幾個特征:
01、數據生產規模大,范圍廣,增長速度快
我國數據生產規模持續擴大。2023年數據生產總量達到32.85澤字節(ZB),同比增長22.44%,非結構數據爆發式增長。隨著5G、AI技術的快速發展及智能設備的規模應用,內容創作、影像視聽等非結構數據對我國數據總規模增長貢獻較大,消費民生領域新業態不斷涌現,滿足了人們不斷增長的文化娛樂消費需求。
智慧城市擴大物聯感知范圍。公共數據獲取范圍不斷擴大,設施物聯傳感數據占比超40%。城市各種基礎設施、資源、服務等加速數字化、網絡化、智能化升級,攝像頭、傳感器、無線設備等相互連接形成城市的“神經脈絡”,實時捕捉城市交通、人流等各種信息,推動海量數據從大街小巷匯入城市大腦。
智能應用推動數據產量提速。隨著技術的創新突破以及硬件的迭代更新,生產生活的數字化應用逐漸增加,推動我國數據產量快速增長。在生活方面,智能網聯車驅動車、路、網、云數據快速交換,出行數據同比增幅達到49%。在生產方面,老舊生產設備的升級改造以及智能邊緣設備、工業機器人、數控機床等智能設備的推廣應用,推動生產制造數據同比增幅達到20%。
02、數據存儲空間合理,終端存儲高于云存儲,產存轉化待提升
存儲總空間基本滿足存儲需求。2023年我國累計數據存儲總量為1.73澤字節(ZB),存儲空間利用率為59%。其中政府和行業重點企業存儲空間利用率均為70%左右。數據服務商對存儲空間提前布局,存儲空間利用率為35.29%。隨著企業算力的不斷提升,對數據存儲除性能要求外,更需高擴展性來為海量數據“礦產”的挖掘做準備。
數據終端存儲高于云存儲。數據云存儲占比約超過40%,其中,行業重點企業云存儲占比為23.49%。云存儲高靈活性和高便捷性優勢有效支撐了業務協同帶來的數據交互需求。行業重點企業數據終端存儲占比超七成,海量數據被分散存儲,數據互聯、復用難度較大,但邊緣智能化一定程度上能促進數據從存向用轉化。
數據產存轉化率較低。2023年新增數據存儲量為0.95澤字節(ZB),與年數據生產總量相比,占比為2.9%,數據價值潛力有待進一步挖掘。一方面海量數據復用價值較低,大部分過程類數據產生后即被丟棄、覆蓋。另一方面大模型、訓練工具等支撐能力不足,海量數據開發利用價值低于存儲成本,部分高價值數據在“大浪淘沙”過程中被遺棄。
03、算力規模增長快,區域算力按需布局,智算能力需求旺
算力中心規模持續增長,算力建設仍需適度超前布局。至2023年底,2200多個算力中心的算力規模約為0.23十萬億億次浮點運算/秒(ZFLOPS),同比增長約為30%。與此同時,大模型訓練算力需求高漲,科學、政務、金融、工業等行業算力需求隨之增加,一體化算力體系建設仍需加快推進,保持適度超前布局。
區域算力按需布局,東西部算力協同仍待發展。一方面,算力樞紐按需布局趨勢明顯。東部地區實時計算需求增幅較大,實時數據處理仍依賴于本地算力。京津冀、長三角、珠三角地區算力規模占比達58.61%。另一方面,東數西算仍需進一步發展。西部地區憑借綠色化和低成本的算力優勢逐步承接東部計算需求。如影視制作企業、云服務商等借助西部算力中心大幅縮減成本。然而西部地區存算利用率仍然低于東部地區。
大模型需求不斷增加,智算支撐能力仍需提升。至2023年我國智能算力占比約為30%,各行業各領域對智能算力的需求日趨強烈,而能夠支撐行業垂直領域大模型落地的算力不足,大模型與國產軟硬件的適配性問題尚需解決。
04、數據流通方式多元,交互能力有提升,交易供需不均衡
消費領域數據交互活躍度較高。2023年,四大運營商數據顯示全國數據總流量較去年同期增長7.6%,數據流量保持穩步增長。隨著汽車、家居、穿戴等智能終端品類不斷豐富和聲像視聽數據交互需求持續增加,移動互聯網數據流通活躍度不斷增加。
平臺和央企數據流通量遠超其他企業。中央企業和平臺企業成為行業領域的數據樞紐,在各自領域探索交互機制。本次調查中,平臺企業平均數據交互量為行業重點企業的249倍,各行業數據正逐漸向平臺聚攏。SaaS服務模式日益成熟,平臺提供數據產品中SaaS化產品占比超五成,訂閱式交易占比逐年增多。中央企業成為產業鏈數據樞紐。本次調查中,中央企業平均數據交互量為行業重點企業的42倍。鏈主企業正在通過產業鏈協同賦能上下游企業,匯聚全產業鏈數據。
交易機構加快建設,場內交易吸引力不足。全國各地交易所快速鋪開,19個省市建立數據交易機構。上海、浙江、深圳、海南等地數據交易機構“百花齊放”,交易模式、數商生態、技術底座各具特色。交易機構在標準、規則方面尚未達成共識,場內交易吸引力不足。
數據交易機構供給水平難以滿足旺盛的數據需求。數據需求快速增長,制造業、信息服務、批發零售等行業數據需求量較大。與此同時,交易機構數據產品成交率不高。27家交易所上架數據產品中僅有17.9%實現交易,數據場內交易活躍度較低。例如,消費民生領域數據產品購買方數量是供給方的2.4倍,但產品成交率不足一成,存在供需不匹配的現象。
05、公共數據開放共享初見成效,授權運營起步探索,政企數據融合不斷深入
公共數據體系完善,數據匯聚能力不斷提升。截至2023年12月底,全國一體化政務數據樞紐接入53個國家部門、31個省/自治區/直轄市和新疆生產建設兵團數據,掛接資源達2.06萬個,實現累計調用5361.35億次服務。
公共數據開放共享提升政務服務水平。國家行業主管部門、地方省級政府開放數據量比上年增長16%、18.5%。高頻政務服務事項實現“一網通辦”“跨省通辦”,逐步向標準化服務發展,電子證照、身份識別等已實現數據全國協同。公共數據共享滿足率僅在少數應用場景得到滿足,但大多數需求場景暫不明確的領域,與應用解耦的基礎類數據,還需進一步提升數據共享效率。
公共數據授權運營機制正初步探索。人力資源和社會保障部、文化和旅游部、國家市場監督管理總局、國家衛生健康委等國家部委開展了公共數據授權運營。北京、浙江、上海、重慶等15個地區的省級數據管理部門開始探索公共數據授權運營機制。公共數據應用場景主要為公共服務和社會管理。公共數據與企業數據加深融合應用。
公共數據在數據開發利用、流通交易中占比較大。平臺企業、數據分析企業對公共數據需求高漲。本次調查中,有18.6%的平臺企業和51%的中央企業在數據開發利用過程中應用到政府開放數據。工商、氣象、交通、地理等公共數據廣泛應用于數據開發利用中,成為釋放數據價值的催化劑。
06、數字化轉型激活企業數據,場景應用提質增效,數據外溢效應仍不足
數字化轉型沉淀海量數據,數據應用場景加速落地。隨著數字化轉型深入推進,企業獲取數據的能力顯著提升。企業積極開展數據應用,海量數據加速融入生產運營各類場景。本次調查中,96%的行業重點企業已實現數據場景化應用,其中超8成行業重點企業已經運用數據輔助運營管理優化,半數企業在生產環節實現數據驅動。
數據管理和復用水平較低,多主體數據協同難度大。企業普遍重數據設施和項目建設、輕數據資源管理,本次調查中,21.9%的大企業尚未建設數據管理系統,大多數中小企業數字化轉型產生的數據未實現復用。數據多場景、多主體協同難度大。本次調查中,開展產業鏈協同應用的企業占比不足20%,通過產業鏈數據實現風險預測的應用占比約為10%。
企業數字化投入較高,數據價值外溢效應尚不明顯。我國企業數字化投入積極性較高。本次調查中,2023年有數字化投入的行業重點企業占比超8成。企業對數據價值認識和判斷不足,數據增值的投入和能力有限,開展數字化轉型的大型行業重點企業中,僅有8.3%實現了數據復用增值,數據價值有待進一步釋放。
全國數據資源調查工作驗證了我國發展數字經濟具備超大規模市場、海量數據資源和豐富應用場景潛在優勢。