2021WAIC | 每日互動CTO葉新江:萬億級圖下的數據智能 -- 飛象網
2021-07-13 11:47:52 1223次2021WAIC | 每日互動CTO葉新江:萬億級圖下的數據智能 -- 飛象網
近日,每日互動(個推)CTO葉新江受邀出席WAIC世界人工智能大會,并于“大數據關聯下的圖數據庫技術與應用”主題論壇上發表演講,同與會專家、觀眾共同探討“萬億級圖下的數據智能”。

葉新江介紹,每日互動成立于2010年,以提供APP消息推送服務起家。十多年來,每日互動參與和見證了移動互聯網行業的飛速發展,更依托自身海量數據資源和大數據、人工智能技術優勢,構建了完整的數據智能服務生態,提供專業的大數據解決方案,推動移動互聯網、品牌營銷、金融、智慧城市等細分領域的數智化升級。
目前,每日互動已成長為將互聯網、大數據、人工智能、云計算等新興領域特點有機融合于一身的新經濟綜合體,并著力打造數據中臺產品——“每日治數平臺”,輸出治數能力,為垂直行業的數字化創新增能提效。
數據智能的新發展:解決現實中不確定性大的問題
每日互動將“數據讓產業更智能”作為自己的使命和愿景,對數據智能有著自己獨到的理解。葉新江講到,在信息化時代,我們主要通過數據來描述客觀現實。比如,我們通過可視化的監控大屏描述道路狀況,用不同的顏色代表道路的擁堵程度。后來,我們越來越多地使用數據進行診斷和因果分析,比如對道路擁堵進行歸因。近年來,數據持續呈爆炸式增長,機器學習、圖挖掘等前沿技術得到更廣泛的應用,數據智能隨之發展到一個全新的階段。當下,人們對數據的應用已經不僅僅停留在描述和診斷的階段,人們希望通過數據智能,解決現實中不確定性大的問題,并對未來進行預測,從而掌握態勢,掌握動向,掌握主動。

正確的解題方式:本體建模和檢索
葉新江提到,現實中不確定性大的問題,往往是開放環境下的問題,受到眾多因素影響。為了解決這類問題,傳統的基于神經網絡的深度學習方法,需要大量的參數對環境建模,如最近流行的GPT-3模型包含了千億級別的參數,一次訓練所需的成本達到千萬美元。即便如此,這種形式下的人工智能也很難達到人類的智能水平。
因此,我們判斷人工智能的最終形態應該是“人腦+電腦”人機共生的方式。如何實現“人機共生”,來解決這些不確定性大的問題呢?基于知識圖譜的數據智能是一個具有前景的方向,一方面通過本體建模將已有的知識進行數據化,讓電腦具有了人腦的思維方式;另一方面通過在知識圖譜上進行檢索和推理,讓人腦可以利用電腦的計算能力。為了實現這個目標,底層基礎設施需要符合建模架構要求,并具有快速檢索和全局推導的能力。而綜合了圖查詢系統和圖計算系統的綜合圖數據庫系統,能夠滿足這些特性和功能要求。
萬億級圖下的數據智能實踐:大數據抗疫
那么,如何基于綜合圖數據庫系統開展數據智能應用,以解決現實中不確定性大的問題呢?葉新江以每日互動參與大數據抗疫為例,分享了每日互動在萬億級圖下的數據智能實踐。
2020年新冠肺炎疫情發生后,每日互動火速成立大數據抗疫團隊——“個醫”,并與李蘭娟院士團隊共同合作,投入到這場與新型冠狀病毒的戰斗中,在疫情態勢研判、傳播路徑分析等方面進行深入研究,全面助力疫情精準防控。
為了幫助地方政府實現高效防疫,公司聯合李蘭娟院士團隊提出“無意識密切接觸者”概念,基于人時空大數據,幫助相關部門找到工作重點區域、重點人群和重點場景,實現智能防控。同時,為了方便地方政府綜合了解疫情態勢,我們通過大數據來反映和量化當前區域內的疫情風險,為高效開展疫情防控提供有力數據支撐。為了助力地方政府有序推進復工復產,我們還參與了健康碼賦碼引擎的開發,通過綜合“空間、時間、人間”三個維度的信息來計算密接風險,再結合當前的防控策略,助力完成最終發碼。
實際上,以上這些應用,都依賴于綜合圖數據庫對人群在“空間、時間、人間”三個維度上的關系進行高效的建模、檢索和推理,而三個維度的疊加形成了最終的萬億級圖,拓展了數據智能在社會治理、智慧醫療等方面的應用場景。
總結
如今,經濟發展呈現一種新的范式,數據成為一種新型生產要素,對未來發展起著重要的驅動作用。圖數據庫作為數據智能時代的一項重要基礎設施,為我們在全域范圍內,針對時間、空間等多維度進行動態檢索、統計、關系推導等復雜計算創造了充分條件。
未來,每日互動還將基于圖數據庫、知識圖譜等技術持續展開實踐,通過挖掘數據潛能,釋放數據互聯的力量,推動解決現實中不確定性大的問題,為產業發展和社會進步貢獻更大的力量。