数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。它是科学与工程实践当中对于计算机建模和模拟的运用。近年来,可视化尤为关注那些来自商业、财务、行政管理、数字媒体等方面的大型异质性数据集合。
当前数据可视化主要涉及的领域有:
(1)数据采集(DAQ或DAS)。又称为“数据获取”或“数据收集”,是指对现实世界进行采样,以便产生可供计算机处理的数据的过程。通常,数据采集过程之中包括为了获得所需信息,对于信号和波形进行采集并对它们加以处理的步骤。
(2)数据分析。它是指为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
(3)数据治理。数据治理涵盖为特定组织机构之数据创建协调一致的企业级视图(enterprise view)所需的人员、过程和技术;数据治理旨在:增强决策制定过程中的一致性与信心、降低遭受监管罚款的风险、改善数据的安全性、最大限度地提高数据的创收潜力、指定信息质量责任。
(4)数据管理。数据管理,又称为“数据资源管理”,包括所有与管理作为有价值资源的数据相关的学科领域。
(5)数据挖掘。数据挖掘是指对大量数据加以分类整理并挑选出相关信息的过程。数据挖掘通常为商业智能组织和金融分析师所采用;不过,在科学领域,数据挖掘也越来越多地用于从现代实验与观察方法所产生的庞大数据集之中提取信息。