在信息科技轉向物聯(lián)網(wǎng)之際,一個全新的萬物互聯(lián)時代即將到來,到2020年將有高達幾百億的智能設備連接互聯(lián)網(wǎng)。
我們希望通過大數(shù)據(jù)交易行業(yè)現(xiàn)狀的分析與梳理,探索我國未來大數(shù)據(jù)交易產(chǎn)業(yè)健康良性的發(fā)展之路,為國家大數(shù)據(jù)應用和產(chǎn)業(yè)發(fā)展做出積極貢獻。
從可穿戴設備到智能家居,再到智慧城市、互聯(lián)工廠等等,這些智能設備產(chǎn)生的海量數(shù)據(jù)在更為先進的算法及運算能力推動下將為社會創(chuàng)造出更多新的價值。
大數(shù)據(jù)產(chǎn)業(yè)已形成龐大的產(chǎn)業(yè)生態(tài),我國大數(shù)據(jù)產(chǎn)品和服務業(yè)務收入規(guī)模已超萬億元。
數(shù)據(jù)集作為大數(shù)據(jù)產(chǎn)業(yè)的基礎資料,已經(jīng)成為企業(yè)核心競爭力的一個重要方面。
數(shù)據(jù)集的構成一方面是縱向同類數(shù)據(jù)大量的聚集,以生成更為精準的模型,比如醫(yī)學影像領域的智能輔助閱片軟件,當有越多同一病種大量患者的醫(yī)學影像作為訓練集時,模型輸出的結果也將更為準確;
另一方面是橫向跨領域的數(shù)據(jù)集合,以塑造出多維度的立體模型,如同時分析同一用戶的個人基礎數(shù)據(jù)、銀行數(shù)據(jù)、運營商數(shù)據(jù)、社交數(shù)據(jù)等等,可以建立更為立體豐富的用戶畫像。
但數(shù)據(jù)體系是多樣化的,不同維度的數(shù)據(jù)留存在各行各業(yè),如電信、交通、消費、金融、制造等等。
數(shù)據(jù)的存儲及管理形式也是分散的,如人口、自然資源等相關基礎數(shù)據(jù)由政府各部門統(tǒng)籌管理使用;
行業(yè)領域數(shù)據(jù)由企業(yè)和政府分別管理使用,如銀行存儲和管理賬戶數(shù)據(jù)、流水情況;
運營商存儲和管理用戶的通訊數(shù)據(jù)和位移數(shù)據(jù),社交網(wǎng)絡存儲和管理的是用戶的社交數(shù)據(jù)等等。
不同行業(yè)之間,同行業(yè)內不同企業(yè)之間,甚至同一企業(yè)不同業(yè)務部門之間的數(shù)據(jù)孤島現(xiàn)象普遍存在。
大型企業(yè)擁有大量資源來整合數(shù)據(jù):
亞馬遜已抓取50億網(wǎng)頁的數(shù)據(jù),其物流中心有超過50萬張產(chǎn)品的JPEG圖像和相應的JSON元數(shù)據(jù)文件,每日監(jiān)測全球廣播、印刷物、網(wǎng)絡新聞的記錄超過40億份。
谷歌擁有最大存儲庫的數(shù)據(jù)集之一,數(shù)據(jù)達10-15Exabyte;
阿里巴巴的數(shù)據(jù)存儲已經(jīng)逼近EB(大數(shù)據(jù)存儲單位)級別,部分單張表每天的數(shù)據(jù)記錄數(shù)高達幾千億條。
巨頭仍在不惜重金通過投資并購以獲得數(shù)據(jù)。
亞馬遜2017年6月宣布以130億美元并購知名有機超市Whole Foods,可說是一項著眼于大數(shù)據(jù)的交易;
IBM 2016年2月以26億美元的價格收購醫(yī)療保健和分析提供商Truven Health Analytics,此舉為2年內IBM進行的第四筆與健康數(shù)據(jù)有關的收購,總投入超過40億美元;
阿里巴巴早已把自己定位為數(shù)據(jù)公司,阿里資本在文化娛樂、金融領域、電子商務三個方向投資重金,分別高達300億、269億、223億,連同其他業(yè)務,早已成為國內最大的數(shù)據(jù)運營者之一。
對于無力通過自建/投資并購方式獲取數(shù)據(jù)的廣大中小企業(yè),數(shù)據(jù)購買及交易是其備選渠道,但應注意相關法律風險。
目前針對用戶信息的非法收集、竊取、販賣和利用行為猖獗,中國互聯(lián)網(wǎng)協(xié)會發(fā)布的《中國網(wǎng)民權益保護調查報告(2016)》顯示,我國6.88億網(wǎng)民因垃圾短信、詐騙信息、個人信息泄露等造成的經(jīng)濟損失達915億元,人均為133元。
初創(chuàng)公司為更加合理的獲取數(shù)據(jù),除主營業(yè)務外,會開展一部分業(yè)務用于獲取數(shù)據(jù)、留存數(shù)據(jù),如醫(yī)療行業(yè)內,開展輔助診斷業(yè)務的公司也會同步發(fā)展一些協(xié)同的科研項目或相關的醫(yī)療資源管理項目。
除數(shù)據(jù)獲取挑戰(zhàn)外,因各企業(yè)各部門對數(shù)據(jù)的留存、處理方式存在差異,企業(yè)也將面臨較高的數(shù)據(jù)獲取后的整合成本。
自2015年,大數(shù)據(jù)上升為國家發(fā)展戰(zhàn)略開始,國家政策不斷引導、鼓勵和推動發(fā)展大數(shù)據(jù)交易機制。
以在合法、合規(guī),保障數(shù)據(jù)安全的前提下,建設完善基礎設施,解決數(shù)據(jù)交易過程中公允定價、交易標準、數(shù)據(jù)傳輸?shù)汝P鍵問題。
全國各地相繼成立大數(shù)據(jù)交易所,包括貴陽大數(shù)據(jù)交易所、上海數(shù)據(jù)交易中心、武漢東湖大數(shù)據(jù)交易中心等等,以數(shù)據(jù)堂、美林數(shù)據(jù)、愛數(shù)據(jù)等為代表的數(shù)據(jù)資源企業(yè)也取得快速發(fā)展。
陽光的數(shù)據(jù)交易逐步落地,隨著數(shù)據(jù)交易類型的日益豐富、交易環(huán)境的不斷優(yōu)化、交易規(guī)模持續(xù)擴大,我國數(shù)據(jù)互聯(lián)、變現(xiàn)能力顯著提高。
《2016年中國大數(shù)據(jù)產(chǎn)業(yè)白皮書》中預計2020年國內大數(shù)據(jù)交易市場規(guī)模將達到545億元,相對集中分布在政府、金融、教育、電信、醫(yī)療等行業(yè)。
數(shù)據(jù)交易業(yè)務目前主要有兩種業(yè)務模式,一種是以貴陽大數(shù)據(jù)交易所、上海數(shù)據(jù)交易中心等為代表的平臺模式,另一種是以數(shù)據(jù)堂等為代表的自營模式。
在平臺模式下,平臺本身不擁有數(shù)據(jù),而是通過讓供需雙方加入平臺。
供方發(fā)布數(shù)據(jù)、需求方提交數(shù)據(jù)需求,平臺發(fā)揮數(shù)據(jù)質量認證、數(shù)據(jù)格式標準化、數(shù)據(jù)金融工具的作用,提供數(shù)據(jù)脫敏、質量控制、安全控制等基礎服務,數(shù)據(jù)清洗、建模、分析、可視化技術等增值服務,協(xié)助數(shù)據(jù)供方將數(shù)據(jù)變成可以交易的資產(chǎn)。
交易平臺同時提供交易定價、支付結算、數(shù)據(jù)傳輸?shù)确眨U蠑?shù)據(jù)供需雙方交易完成并獲得交易傭金。
在自營模式下,企業(yè)通過眾包、外購、公共機構共享、網(wǎng)絡采集等方式獲得數(shù)據(jù),利用自身技術對數(shù)據(jù)進行清洗、建模、可視化等,建立數(shù)據(jù)產(chǎn)品,提供予數(shù)據(jù)需求方。
自營模式下,企業(yè)可以通過擴大數(shù)據(jù)獲取、深度挖掘數(shù)據(jù)價值以豐富數(shù)據(jù)產(chǎn)品及提升單數(shù)據(jù)價值而提升數(shù)據(jù)服務能力;但由于在自營模式下數(shù)據(jù)將經(jīng)企業(yè)流轉,企業(yè)應注意防范數(shù)據(jù)泄漏及隱私保護相關法律風險。
數(shù)據(jù)交易仍處起步階段,面臨基礎配套不完善、市場及產(chǎn)品分散等挑戰(zhàn)。
1配套措施不夠完善
目前國家層面數(shù)據(jù)交易相關明確的法律法規(guī)尚未推出,也缺少專門的監(jiān)管部門,這導致地方各類型的數(shù)據(jù)交易平臺在建設過程中自行摸索標準體系,在發(fā)展進程上有所顧忌,謹慎前行,發(fā)展速度受到一定程度的影響。
2市場碎片化程度比較高
根據(jù)《中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)白皮書》的統(tǒng)計,51.61%的數(shù)據(jù)交易平臺收入在500萬以下,收入1億元以上的數(shù)據(jù)交易平臺僅占6.45%。
多個分割的市場不利于數(shù)據(jù)大量的匯聚,不同交易平臺之間數(shù)據(jù)缺乏流動性,難以真正實現(xiàn)平臺化、規(guī)模化、產(chǎn)業(yè)化的發(fā)展,難以實現(xiàn)數(shù)據(jù)交易平臺的優(yōu)勢。
3數(shù)據(jù)產(chǎn)品碎片化程度比較高
以發(fā)展階段相對領先的貴陽大數(shù)據(jù)交易所為例,截至2017年10月,交易所交易額累積突破1.2億元,可交易數(shù)據(jù)產(chǎn)品4000個,可交易的數(shù)據(jù)總量超過150PB,即平均交易單品交易金額2萬/年,每PB產(chǎn)生交易額不足80萬元。
“粗放式”的原始數(shù)據(jù)產(chǎn)品難以滿足數(shù)據(jù)需求方個性化需求,數(shù)據(jù)需方面臨較大的數(shù)據(jù)整合成本,是導致該現(xiàn)象的主要原因。數(shù)據(jù)產(chǎn)品過低的交易規(guī)模和頻次也不利于數(shù)據(jù)平臺組織交易。
數(shù)據(jù)交易平臺正在探索靈活的產(chǎn)品形式,如華中大數(shù)據(jù)2016年7月上線了以“活數(shù)據(jù)”交易為主的大數(shù)據(jù)交易平臺。
“活數(shù)據(jù)”即實時數(shù)據(jù),API是實時數(shù)據(jù)接口,數(shù)據(jù)提供方通過接口調用的方式向需要方提供,同時華中大數(shù)據(jù)交易平臺上提供了API調試工具、接口地址和統(tǒng)一格式的請求參數(shù)等信息,方便數(shù)據(jù)需求方快速理解和使用。
上海數(shù)據(jù)交易中心于2017年發(fā)布數(shù)據(jù)金融產(chǎn)品——CRP(中國企業(yè)信用風險畫像庫),CRP使用方可以在平臺上選擇高質量數(shù)據(jù),并通過一點實時數(shù)據(jù)接口,從多源供方獲得自身業(yè)務運行所需的數(shù)據(jù),用于訓練調校業(yè)務算法模型,多維度刻畫企業(yè)信用風險,為金融業(yè)務持續(xù)發(fā)展提供基礎數(shù)據(jù)服務。
隨著數(shù)據(jù)交易需求不斷激增,相關政策的逐漸落地,市場必將出現(xiàn)引領行業(yè)發(fā)展及整合市場的數(shù)據(jù)交易平臺。
在保障數(shù)據(jù)安全的前提下,真正實現(xiàn)數(shù)據(jù)的采集、處理、定價、傳輸?shù)龋浞职l(fā)揮數(shù)據(jù)交易平臺的實質優(yōu)勢。
數(shù)據(jù)交易平臺將通過結合自身資源情況探索個性化的發(fā)展道路,一方面可拓寬數(shù)據(jù)來源渠道,激活“長尾數(shù)據(jù)”,豐富數(shù)據(jù)產(chǎn)品提供方式,增加供方數(shù)據(jù)特色,另一方面可能圍繞數(shù)據(jù)需方需求劃分層級,通過“深加工”的產(chǎn)品形式,向相對集中的產(chǎn)品需求提供個性化定制服務等,降低數(shù)據(jù)需方整合數(shù)據(jù)成本的同時提高單位數(shù)據(jù)的交易頻次、交易規(guī)模,提升數(shù)據(jù)交易平臺的競爭優(yōu)勢。
國務院總理李克強在中國大數(shù)據(jù)產(chǎn)業(yè)峰會上曾表示,中國超過80%的數(shù)據(jù)在政府手中。因此各地數(shù)據(jù)交易平臺建設也離不開政府的支持。
聯(lián)新資本于2016年參與發(fā)起成立了上海數(shù)據(jù)交易中心。
上海數(shù)據(jù)交易中心是經(jīng)上海市人民政府批準,上海市經(jīng)濟和信息化委、上海市商務委聯(lián)合批復成立的國有控股混合所有制企業(yè)。
作為上海市大數(shù)據(jù)發(fā)展“交易機構+創(chuàng)新基地+產(chǎn)業(yè)基金+發(fā)展聯(lián)盟+研究中心”五位一體規(guī)劃布局內的重要功能性機構,承擔著促進商業(yè)數(shù)據(jù)流通、跨區(qū)域的機構合作和數(shù)據(jù)互聯(lián)、政府數(shù)據(jù)與商業(yè)數(shù)據(jù)融合應用等工作職能。
聯(lián)新資本將同上海數(shù)據(jù)交易中心一起推動泛長三角地區(qū)乃至全國數(shù)據(jù)交易機構的互聯(lián)互通和深度合作,形成健全規(guī)范的商業(yè)數(shù)據(jù)流通、交換機制,共同促進商業(yè)數(shù)據(jù)資產(chǎn)流通、充分釋放數(shù)據(jù)資源衍生產(chǎn)品紅利,為國家大數(shù)據(jù)應用和產(chǎn)業(yè)發(fā)展做出積極貢獻。