Cagatay教授带来了题为Enhancing data-informed decision-making throughvisualization (通过可视化增强基于数据的决策)的精彩报告。Cagatay教授首先介绍了交互式可视化如何为有效和严格地使用数据、算法和其他数据派生的工具提供丰富的方式。Cagatay教授还强调了交互式方法不仅增强了洞察力,而且还支持基于结果做出更明智的决定。最后,他通过回顾一些研究实例来讨论了可视化如何促进这种信息丰富、多样化和关键的数据交互,其中数据和模型将通过多角度的可视化。
首先,针对如何利用交互式可视化增加数据算法工具的丰富性,Cagatay教授介绍了可视化对于数据分析、增强决策的必要性,并通过一个疫情下的政策分析来举例说明。他指出仅仅观察模型的结果存在的四点问题:难以得知模型内部统计量的变化;难以比较多种政策的不同影响;对于建模者来说模型有时也是不透明的;存在许多感染链,大型网络结构难以清晰的展示和观察传播模式(图1)。
图 1 图可视化与树可视化
综合考虑以上问题,Cagatay教授团队提出了一种基于树可视化的可视分析系统,支持对比两种政策对疫情传播影响。其中,树的节点大小表示传播数量,节点颜色表示感染状态,树的连线表示传播关系,下方数字表示相似的传播结构的数量(如图2所示)。通过这个项目的介绍,Cagatay教授提倡要深入模型内部来获得丰富的认知,使用新颖的可视化能够揭示原本看不见的结构,同时展示变化和条件等。
图 2 疫情下的政策对比可视分析系统界面
其次,Cagatay教授还介绍了交互式可视分析如何应用于网络安全中对用户行为分析。首先,教授总结了一系列分析难点,比如在一个会话中一系列的动作是否是一种有问题的行为,不同的用户角色是否会有不同的常见任务等(图3)。针对这些的问题,我们需要一个全面且多角度的可视化来支持多方面分析。
图 3 网络安全中用户行为分析的主要问题
随后,教授介绍了如何利用主题聚类从文本中提取用户行为的常见任务,并将其编码为序列结构,用颜色表示用户动作。通过对用户动作进行主题聚类就能够总结用户的行为(图4)。
图 4 通过主题建模提取用户行为的常见任务
针对动作序列数据的复杂语义和时间特征,Cagatay教授团队提出了一种视觉分析方法(图5),旨在促进用户参与,多面决策过程中识别和调查不寻常的动作序列。该系统支持基于约束的序列模式挖掘和基于语义距离的聚类,以及用户及其序列的多标量可视化。通过该项目,Cagatay教授进一步阐释了交互式可视分析在用户行为分析中的重要性。他指出,上下文是做出决策的关键,能够代表用户、角色和会话等多种含义。同时可视化能够帮助建立数据和会话、用户以及各种角色之间的多层关系。
图 5 用户行为分析系统界面
在提问环节,Cagatay教授和观众就数据可视化中防止错误表示信息,在沉浸式可视化中支持决策的机会和挑战,以及如何找到数据中重要的部分来可视化,面向专家和大众的可视化的区别等话题进行了热烈的探讨。针对如何防止错误表示数据的问题,Cagatay教授表示可以在设计草案时向可视化的使用者展示和讨论来确保正确性。他还指出沉浸式可视化支持决策的一个研究方向是利用虚拟环境下合作性的特点,实现共享互助的决策。针对如何找到数据重点来可视化,他表示通过阅读领域相关文献,比如网络安全可视化就需要了解网络安全领域相关的专业知识,来找到重要的分析对象,也可以通过一些数据分析和基本的可视化方式来了解数据,进而发现数据的特点。最后,Cagatay教授指出面向专家的可视化通常需要注重于对复杂的数据进行解释并可视化,更具有专业性。在设计面向大众的可视化时,通常需要注意减少交互的复杂性、添加注解和动画等来降低理解难度。
本次活动主办方为复旦大学大数据学院和CSIG-VIS,由复旦大学可视分析与智能决策实验室承办,可视化与可视分析专委会委员陈思明青年研究员主持。