文章摘要: 面向新經濟的大資料可視分析對於視覺化忠實性的分析和研究還沒有獲得長足的進展
2018年7月28日上午,多位專家學者在ChinaVis會議專題7部分給大家帶來了題為面向新時代的可視分析的精彩報告。報告共分為三個部分,分別涵蓋了圖視覺化、新時代下的大資料等熱點研究問題。
來自悉尼大學的Peter帶來的報告題為」How do you know whether your visualization is correct?」。報告以1930年結婚資料為案例,分析從圖的矩陣表示形式資料到基於node-link的方式的展現的變換過程中,怎樣判定視覺化是否真實地反應了資料問題為重點。
對於密集長序列的視覺化,通常在視覺化展示時會出現大量區域的模糊不清(blur)。我們可以觀察和感知整體的結構,但不知道這樣的視覺化是否正確。對於視覺化,存在兩個重要的分析指標,分別為忠實性和可讀性。忠實性是對於視覺化函式的描述和評價,而可讀性則着眼於感知函式的質量。相較於視覺化大量可讀性的研究工作(如圖視覺化啊中邊的交叉的影響),對於視覺化忠實性的分析和研究還沒有獲得長足的進展。
對於忠實性的評價還可以細分為兩個子評價標準。首先是資訊的忠實性,強調由資料到視覺化的一對一的對映,以圖視覺化為例,圖片反應的資訊要與原始圖片的資訊相同。我們可以通過視覺化圖片反向恢復資料,這就需要足夠的資訊支援。另一個子評價標準為任務的忠實性。視覺化中通常有原始資料出發到影象空間轉換再到人的知識最終得到分析結果的流程。任務的忠誠性指從流程的中間結果出發,相對於由原始資料出發得到的結果(truth),可以仍然正確地得到結果。
對於忠實性的度量演算法,包括一種舊的度量和一種基於形狀的新度量方式。舊的度量方式通過計算stress來計算忠實性,具體為通過對權重係數放縮下的影象每個元素和資料每個元素之間尤拉距離的求和,同時可以進行歸一化。基於形狀的度量方式通過視覺化圖片對映回,得到估計的圖結構,比較原始資料和估計的圖結構來度量忠實性。
忠實性與可讀性兩者共同表達了使用者對於資料的理解程度。我們需要對忠實性和可讀性做一個平衡,如對於邊聚合的演算法即是犧牲了一部分的忠實性以換取一部分的可讀性。
接著,華東師範大學的王長波教授做了題為」面向新經濟的大資料可視分析」的報告。新經濟打破了行業壁壘,解決了資訊的不對稱。同時在新經濟時代對大資料需求更大了。報告通過案例分析的形式,展示了新經濟環境下可視分析的成果。
案例分析
1.基於大資料分析的大宗商品接個智慧預測
案例任務為甲醇的價格分析。甲醇的價格受上下游產品、巨集觀趨勢、隨機因素等大概13種影響因素。工作跟蹤了18個月資料,着眼於預測1-3個月趨勢。可視分析的結果十分良好,結果準確率達到了90%以上(5%浮動)。系統設計的檢視包括因素相關性分析、時間線、專家分析介面等。
2.微信公眾號的社會化媒體營銷可視分析
這一系統主要致力於助力公眾號聚類->得到主題相關公眾號->排序->推薦公眾號進行營銷的工作流程。
3.零售商店選址推薦的可視分析
新經濟環境下,傳統方法不再能滿足要求,而商店選址十分複雜需要考慮交通、人流等多因素。
系統設計的介面包含:8方案選擇面板、統計分析檢視、選址推薦檢視(人流量和地鐵圖)、商圈輻射影響 比較檢視等。
4.O2O平臺消費者行為可視分析
O2O致力於個性化智慧推薦。系統採集了O2O外賣資料來進行消費者行為分析分類。對於有偏好、無偏好兩類消費者都給出了較為完備的分析。
系統設計的介面保護你:相關轉移店鋪檢視、使用者消費轉移檢視、使用者畫像檢視等。
5.基於摩拜單車資料的城市流動特徵研究
本工作致力於單車投放問題,以及如何進行規律性調配的方案分析。通過熱力圖來展示分配均勻性,同時結合單車車流圖以及大致軌跡流探究豐富分析的內容。
6.基於行業資料分析的企業知識圖譜
工作基於產業帶分析。設計的介面包括地圖、統計檢視、公司關聯分析圖等。
最後王教授做了對於可視分析未來的展望,並歸納了可能的研究方向:
1.可視分析經濟大資料走向公眾必經之路,需要更加輕量級應用(移動線上)
2.過程式互動分析中螺旋式探索發現
3.結合經濟大資料場景設計易用系統分析
對於觀眾關於地理資訊視覺化的重要性的提問,王長波教授也做出了專業性的解答。基於位置的視覺化形式重要,但是不能完全依賴地圖。在經濟資料中,我們更關注規律的關聯和演化。