李浪子,濟邦咨詢 經理
這是【公共數據授權運營專題】的最后一期。前兩期我們綜合分析了央地兩級政策體系與執行情況,對海量信息去蕪存菁,力求對公共數據授權運營的基本概念、模式、流程以及發展展望做出清晰解讀。
本篇,我們延續公共數據授權運營的話題,聚焦在公共數據運營的終端形態——公共數據產品,對公共數據產品的關鍵底層原則、開發的兩級市場以及典型性的產品呈現形式作深入剖析,并嘗試以交通領域公共數據為例,解讀目前市場上的主要公共數據及相關產品形態。
一、公共數據產品開發的幾個關鍵前提
1. 數據產權的結構性分置
早在2022年12月,中共中央、國務院發布的《關于構建數據基礎制度更好發揮數據要素作用的意見》(簡稱“數據二十條”)中,明確要求根據數據來源和生成特征,界定數據生產、流通、使用過程中各參與方享有的合法權利,探索建立數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制。
公共數據的持有權與加工使用權指公共數據伴隨公共部門提供的公共服務而產生的數據持有權,以及相應的數據加工、治理等加工使用權。
而經營權對應著的是數據產品,因此,基于公共數據產生的數據產品經營權自然歸屬于產品的生產與加工部門,而非政府與公共部門的職責范疇,其本質具有市場屬性。數據產權的結構性分置,保障了公共數據產品在市場上的自由流通。
2. 公共數據開放程度的梯度屬性
公共數據按照對外的開放程度,分為無條件開放、有條件開放與保密數據(不予開放)。對于依法需要保密的公共數據不予對外開放,而對于在一定條件下或者通過特殊手段可以提供給社會使用的公共數據列為有條件開放,其他不涉及保密要求應當向社會主動開放的公共數據便是無條件開放數據。
因此,為了滿足社會對公共數據的使用需求,同時充分發揮公共數據的要素價值,依據合理機制并通過必要手段合法獲取、使用與開發數據是非常重要的一點。這同樣對當下公共數據資源的供給模式及產品形態產生了深遠影響。
3. 原始數據不出域、數據可用不可見
“數據二十條”中,對于公共數據的使用還有一條關鍵性原則,即在推進公共數據確權授權過程中,在確保個人隱私和公共安全的前提下,公共數據需遵循“原始數據不出域、數據可用不可見”的原則,以模型、核驗等產品和服務的形式向社會提供。
各地方試點實踐中,都明確將此項要求作為地方公共數據管理辦法、公共數據條例等地方性法規、規章的重要原則性條款。這一點便要求了公共數據產品開發需要兼顧數據安全與高效利用,通過數據的脫敏、匿名化確保數據安全,通過使用數據沙箱、API接口等多種方式實現數據的高效利用。
二、公共數據產品開發的兩級市場
各行業的分級市場常根據市場容量、經濟狀況、交易階段、行政級別等不同對市場進行區分,如資本市場針對金融資產的不同交易階段劃分為一級市場(發行市場)和二級市場(交易市場)。公共數據產品開發按照公共數據授權運營機制要求,也存在一二兩級市場。
1. 一、二級市場結構
所謂一級市場,即政府按照規范程序授權給數據運營機構,運營機構對數源單位提供的公共數據,在授權范圍內對公共數據進行整理、清洗、脫敏等處理,實現一級產品開發。并按照相關要求,依托統一的公共數據資源登記平臺登記存證,最終實現上架交易。
一級市場可以稱為數據資源市場,其產品形態是對原始公共數據的粗加工,旨在解決數據的安全性與合規性問題,主要流通方式為原始數據集或數據API接口。
所謂二級市場,是指市場主體(開發主體)將通過合規渠道獲取的一級市場開發交付的初級公共數據產品進行二次開發,融合多源數據,以提升數據產品和服務價值,滿足市場終端多樣化需求。
二級市場可以稱為數據產品市場,重心在初級數據產品的再開發及市場化,產品形態與市場需求緊密結合,應用場景、盈利模式清晰,有效發揮數據要素的乘數效應。
2. 兩級市場分置
根據國家數據局《公共數據資源授權運營實施規范(試行)》(公開征求意見稿)的有關要求,運營機構應在授權范圍內依法依規開展業務,不得直接或間接參與授權范圍內已交付的公共數據產品和服務的再開發工作。鼓勵其他經營主體對運營機構交付的公共數據產品和服務再開發。
這里所謂的其他經營主體,便是運營機構以外的其他市場開發主體。這就意味著,待正式稿發布后,大有可能一級市場、二級市場將會嚴格分開,兩級市場的主體不得重合。
運營機構授權運營,意味著將對某一行政范圍內或某一特定領域擁有數據一級產品開發的專營權。按照各地方的運營實踐來看,運營機構甚至還承擔著一定的市場培育、市場維護的政府職能。因此,公共數據產品開發的兩級市場機制,重點在維持再開發環節的市場競爭性,充分激發市場活躍度,防止權力濫用導致的競爭受限和市場壟斷現象出現。
圖1 地方常見兩級市場結構
三、數據產品有哪些類型
以上內容我們介紹了塑造公共數據產品交易機制的幾條關鍵原則,也通過一、二級市場的辨析對兩個階段數據產品的差異做了解釋。一級市場的產品具有程式化特征,只是對公共數據的粗加工,解決的是公共數據資源的合規供給問題。對于市場來說,二級市場產品的開發才具有較高的可參與空間與商業價值。那么,當前有哪些數據產品活躍在市場交易中?
通過整理各大數據交易所數據,我們發現,市場上公開上架交易的數據產品中,數據集、數據工具(應用)、數據服務以及綜合數據產品是最為常見的類型。例如,上海數據交易所對目前上市數據產品便分為數據集、數據服務、數據應用;深圳數據交易所又分為數據產品、數據工具、數據服務;杭州數據交易所分為數據API、數據服務、數據報告、數據工具、數據集等等。
綜合來看,各地分類基本是圍繞數據本身、數據處理工具、數據相關服務三類展開,然后各有側重進行衍生與細分。接下來,本文將對數據集、數據工具、數據服務三大類數據產品展開解讀。
1. 數據集
數據集(Dataset),又稱為資料集或數據集合,是由數據元素所組成的集合。在統計學和機器學習中,數據集常用于進行分析、構建模型或進行預測。它通常以表格形式出現,每一列代表一個特定變量,每一行都對應于某一成員的數據集。數據集可以包含不同類型的數據,如數值型數據、分類數據、文本數據等。
從數據調用角度,數據集的交易可分為原始數據集整體打包交易和API接口交易。對于公共數據而言,敏感性低可直接開放的數據可通過原始數據集打包形成數據產品直接上架。而對于敏感性較高,不適宜開放原始數據的數據集,則可通過選擇數據API接口進行交易。
2. 數據工具
數據工具,即數據采集、處理、分析、存儲、可視化、開發、應用等全流程配套工具。典型形式包括智能化系統平臺、狀態查詢程序、數據統計分析程序、可視化管理系統、AI模型等等。
以交通出行為例,各類停車場管理APP或小程序,以及地方城市服務APP,普遍集成了智能化系統管理、分析、可視化與查詢功能;監管部門通過智慧監控系統內置交通識別算法大模型,有效識別交通事故、違停等情況,顯著提高了監管效率;智慧公交系統則為公交調度、乘客了解到站信息等提供支持。數據工具的供給方主要為市場各類IT公司。
3. 數據服務
數據服務是支撐數據開發應用的重要環節。數據服務的類別非常豐富,涵蓋數據采集、分析、傳輸、存儲、處理、咨詢等多個服務環節。
例如大數據報告、智慧解決方案、咨詢認證、數據評估、數據培訓、算力服務、數據校驗等等。數據服務是數據產品開發交易全流程的重要支撐,這類數據服務產品常由市場化咨詢服務商提供。
四、以交通數據產品為例
綜合以上產品類型總結可以發現,公共數據產品的授權運營與開發交易,在數據工具與數據服務方面,市場上已經形成了高效的解決方案與技術能力。但是這兩者作用的有效發揮依賴于以數據集為基礎的數據底層資源。可見,當下制約公共數據產品的廣泛開發與應用,很重要的一個方面是如何實現平衡數據集的高效開放與信息安全。
結合國際經驗,廣闊的市場前景是當前市場對公共數據產品開發的共識與動力之源,但從當下各地實踐情況來看,卻存在收益率不確定及市場熱情不足的情況。數據利用場景的模糊、目標用戶不明確、持有者對自身數據價值認識偏差是制約公共數據產品開發的關鍵因素。
為此,基于交通領域數據的可利用性較高的特征,本文重點聚焦數據集型產品,試圖整理目前較為火熱的交通類數據產品供大家參考。
1. API接口類
API接口對于公共數據的適用性前文已有提及,在此不再贅述。API接口是應用程序編程接口(Application Programming Interface)的縮寫,是一種預先定義的函數,目的是提供開發主體得以訪問一組例程的能力。簡單來說,API就是讓不同的軟件之間可以互相通信、協作的工具。接口的調用是實現公共數據“可用不可見”的重要方式。
對于交通領域來說,主要在狀態核驗、熱力指數、實時查詢、實施預測、地理信息調用、物流溯源等方面,通過API數據調用運用公共數據開發數據產品。
狀態核驗類
狀態核驗類主要有以機動車為主體及其相關附加信息的一致性檢驗。如人車關系一致核驗,可以通過核驗指定人員/企業是否是指定車輛的所有人,確保所有權的一致性,這一過程為交通運輸行業監管、金融機構對市場主體授信提供數據支持。
又或者網約車行業,通過核驗網約車行駛里程狀態、事故情況、出險情況、營運資質等等,為保險部門提供保費設定依據等。
熱力指數類
熱力指數體現某類數據信息的集中度、飽和度等指標。對于交通領域來說,通過匯聚軌交進出站、公交上下車信息,可提供軌交進出站熱力、公交線路熱力等產品;通過匯聚網約車位置信息、上下車位置信息,可提供網約車需求熱力、網約車運力指數等產品;通過共享單車租還位置信息可提供共享單車租借便捷指數;通過匯集停車場停放情況、公共充電樁利用情況等可提供停車便捷指數、新能源充電利用率等指數產品。
這類數據產品具有天然大數據屬性,其數據量的大小直接影響指數質量。這類數據可為公共部門城市治理、企業商家選址、企業市場營銷、網約車運力分配、共享單車投放、地圖服務商導航線路推薦等提供數據支持。
實時查詢類
實時查詢類基于實時信息的收集與分析,為用戶提供實時信息查詢服務。交通出行場景中,軌道交通和公共交通的線路運行情況、進站信息及發車間隔等可為大眾出行提供信息資訊,為出行決策提供支持?;诔潆姌?、停車場運行數據,可提供充電、停車在線選擇與預約服務。物流行業還可提供物流車輛實時位置信息,滿足貨物物流追蹤需求。
實時查詢類信息常集成在地圖服務商平臺、城市服務平臺等,可為地圖服務商引流、生活服務商數據支撐等提供服務,也可為政府等公共部門公共服務提供支持。
實時預測類
在實時數據的基礎上,通過歷史數據的整合分析,引入AI大模型預測等技術手段,還可提供實時預測類數據產品服務。例如以上各類動態交通數據,都可通過歷史數據演化模擬,預測同時期此時段的動態情況。在海運領域,基于沿海海域地形、岸線、港口、礁石、潮汐、天氣等海情數據,實時播報并階段性預測,為海上物流運輸、海上作業提供決策參考。
與交通相關的氣象數據領域,天氣數據API服務可提供各種尺度、范圍及時間的天氣情況及預測數據,能為各類交通營運、地圖服務、城市治理提供數據依據,還能在與天氣密切相關的農業、太陽能光伏等行業找到商業價值。
溯源類
產品物流追溯是通過一物一碼實現商品從生產加工、包裝倉儲、渠道物流、終端銷售、真偽查詢到營銷互動等產品全生命周期信息記錄及追溯管理?;诮煌ㄎ锪餍畔⒌膶崟r記錄、存檔的溯源數據產品在物流溯源領域有強大的市場需求。
地理信息類
地理信息類數據產品同氣象數據一致,屬于交通領域相關數據產品,常在交通運輸類數據專區中有重要市場地位。例如,厘米級的高精地圖定位數據、地圖即時更新的POI數據是新能源汽車自動駕駛行業的重要底層工具。
2. 原始數據包類
對于無條件開放,或經脫敏后可直接開放原始數據的公共數據,可直接作為公共數據產品對外交易。相較于通過API接口調取數據,直接提供脫敏后的原始數據集給市場主體,不僅有利于對數據的全局性把握,而且為市場應用提供了更廣闊的空間與自由度,便于數據產品的二次開發。
以交通領域來說,常見的交通標志數據集、車牌數據集、歷史交通流量數據集以及交通路側感知數據等等是較為常見的公共數據產品,這些產品在自動駕駛領域有深入的行業應用,可為自動駕駛AI模型提供道路信息訓練素材。
上海交易所上架交易的由儀征市恒源數據資產運營有限公司提供的儀征市公交運營數據產品。通過安裝部署的智能車載調度終端、公交客流分析儀,以及調度人員的人工錄入,積累了覆蓋136條公交線路、274輛公交車以及日均1萬左右人次客流量的公交運營原始數據。通過對這些原始運營數據進行清洗、去重、格式校驗、篩選、整合等加工處理,并按照公交線路、站點等維度進行了分類管理,形成圍繞公交運營相關的公交實時數據、歷史公交站點客流、歷史公交排班及調度等主題的數據集,總共大小170G。
該產品的主要市場規劃方向為面向外部市場,主要服務于企業和政府采購。目標客戶包括高德、百度等科技公司,以及交通管理部門、商業機構和廣告公司。產品提供豐富的公交數據資源,支持實時監控、客流分析、線路優化和廣告策略調整等功能,助力客戶提升業務效率和決策能力,實現智能化管理。
五、展望
受限于安全管理機制的建設進程,目前大量市場主體所能使用的公共數據大都以API接口為主。少量數據集為相關市場主體在企業運營過程中自行收集的運營數據(這類數據在是以企業數據還是以公共數據開展市場交易仍存在一定的模糊地帶)。
又或者各省市試點“依場景授權”模式,推崇先有場景后有申請審批。通過此渠道,遵循最小必要原則,實行“一場景一審批”方能獲得特定原始數據集(經脫敏處理后)??梢?,市場主體拿到原始數據包進行數據產品開發還不是主流方式。
但是,相信隨著市場規模逐漸擴大,數據安全監管機制逐漸完善,交易機制的創新,市場將呈現出多樣的、便捷的數據調取方式。加上盈利模式不斷清晰,公共數據產品將出現一片新的藍海市場。