什么是数据可视化?

数据可视化的主要目的是洞悉蕴含在数据中的现象和规律,这里面有多重含义:发现、决策、解释、分析、探索和学习,简明含义就是通过可视表达增强人们完成某些任务的效率。

数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这并不就意味着数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。为了有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。然而,设计人员往往并不能很好地把握设计与功能之间的平衡,从而创造出华而不实的数据可视化形式,无法达到其主要目的,也就是传达与沟通信息。

数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相关。当前,在研究、教学和开发领域,数据可视化乃是一个极为活跃而又关键的方面。“数据可视化”这条术语实现了成熟的科学可视化领域与较年轻的信息可视化领域的统一。

数据采集(有时缩写为DAQ或DAS),又称为“数据获取”或“数据收集”,是指对现实世界进行采样,以便产生可供计算机处理的数据的过程。通常,数据采集过程之中包括为了获得所需信息,对于信号和波形进行采集并对它们加以处理的步骤。数据采集系统的组成元件当中包括用于将测量参数转换成为电信号的传感器,而这些电信号则是由数据采集硬件来负责获取的。

数据分析是指为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析与数据挖掘密切相关,但数据挖掘往往倾向于关注较大型的数据集,较少侧重于推理,且常常采用的是最初为另外一种不同目的而采集的数据。在统计学领域,有些人将数据分析划分为描述性统计分析、探索性数据分析以及验证性数据分析;其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。

1)探索性数据分析:是指为了形成值得假设的检验而对数据进行分析的一种方法,是对传统统计学假设检验手段的补充。该方法由美国著名统计学家约翰·图基命名。

2)定性数据分析:又称为“定性资料分析”、“定性研究”或者“质性研究资料分析”,是指对诸如词语、照片、观察结果之类的非数值型数据(或者说资料)的分析。

2010年后数据可视化工具基本以表格,图形(chart),地图等可视化元素为主,数据可进行过滤,钻取,数据联动,跳转,高亮等分析手段做动态分析。

可视化工具可以提供多样的数据展现形式,多样的图形渲染形式,丰富的人机交互方式,支持商业逻辑的动态脚本引擎等等。

不同于一般的Dashboard或者Reporting产品,永洪科技的BI前端是发现型的:交互手段丰富,分析功能强大。用户可以进一步与数据互动(Interactive),过滤(Filter)、钻取(Drill)、刷取(Brush)、关联(Associate)、变换(Transform)等等技术,让用户能够:掌握信息,发现问题,找到答案,并采取行动。

数据治理涵盖为特定组织机构之数据创建协调一致的企业级视图(enterprise view)所需的人员、过程和技术,数据治理旨在:

1)增强决策制定过程中的一致性与信心

2)降低遭受监管罚款的风险

4)最大限度地提高数据的创收潜力

数据管理,又称为“数据资源管理”,包括所有与管理作为有价值资源的数据相关的学科领域。对于数据管理,DAMA所提出的正式定义是:“数据资源管理是指用于正确管理企业或机构整个数据生命周期需求的体系架构、政策、规范和操作程序的制定和执行过程”。这项定义相当宽泛,涵盖了许多可能在技术上并不直接接触低层数据管理工作(如关系数据库管理)的职业。

数据挖掘是指对大量数据加以分类整理并挑选出相关信息的过程。数据挖掘通常为商业智能组织和金融分析师所采用;不过,在科学领域,数据挖掘也越来越多地用于从现代实验与观察方法所产生的庞大数据集之中提取信息。

数据挖掘被描述为“从数据之中提取隐含的,先前未知的,潜在有用信息的非凡过程”,以及“从大型数据集或数据库之中提取有用信息的科学”。与企业资源规划相关的数据挖掘是指对大型交易数据集进行统计分析和逻辑分析,从中寻找可能有助于决策制定工作的模式的过程。

电商数据可视化,获得信息的最佳方式之一是,通过视觉化方式,快速抓住要点信息。另外,电商数据通过视觉化呈现数据,也揭示了令人惊奇的模式和观察结果,是不可能通过简单统计就能显而易见看到的模式和结论。“通过视觉化,我们把信息变成了一道可用眼睛来探索的风景线,一种信息地图。当你在迷失在信息中时,信息地图非常实用。”在电商行业尤为如此。

以上就是数据可视化的主要目的是什么?的详细内容,更多请关注php中文网其它相关文章!

》一书,里面第一次使用了饼状图。这三种都是至今最常用的最著名的可视化图形。19世纪中叶,数据可视化主要被用于军事用途,用来表示军队死亡原因、军队的分布图等。进入20世纪,数据可视化有了飞跃性的发展。1990年,在人机界面学会上,作为信息可视化原型的技术被发表。1995年,IEEE Information Visualization 正式创立,信息可视化作为独立的学科被正式确立[1]。随着2012年世界进入时代,数据可视化作为大量数据的呈现方式,成为当前重要的课题。

1. 数据可视化是什么

数据可视化的目的,是要对数据进行可视化处理,以使得能够明确地、有效地传递信息。

2. 为什么可视化之后会更好

比起枯燥乏味的数值,人类对于大孝位置、浓淡、颜色、形状等能够有更好更快的认识。经过可视化之后的数据能够加深人对于数据的理解和记忆。

例如有以下的数据,你能一眼看出哪一个最大吗?

这样是否易于理解了呢?

3.数据可视化的构成要素

数据可视化的手法很多,其中有一些共通的视觉要素,整理如下。

  • 坐标。数值的位置被对应到直角坐标系或极坐标系上。
  • 大校数据的大小被对应到图形的大校
  • 色彩。数值的分类和界限等对应到颜色的不同。
  • 标签。数值的特征用标签来标记。
  • 关联。数值之间的联系,用关联线条等连接起来。

4. 数据可视化的适用范围

目前存在着多种划分方法,常见的有[2]:

Frits H. Post(2002)从计算机科学的视角,将这一领域划分为如下多个子领域:

  • 交互技术方法与体系架构

5.数据可视化和信息可视化的关系

数据可视化( Data Visualization )和信息可视化( Information Visualization )很相近,有时几乎可以等同。但严格来说它们是不同的,它们的不同可以总结为一句话:数据可视化是对数字信息进行可视化,信息可视化是对数字信息和非数字信息进行可视化。

这不是一个具体告诉你怎么设计的攻略文档,这里面多是理解的内容,可以让读者更好的去完成大屏可视化项目。

可视化设计原则中最基本和最经典的原则来自于设计师爱德华·R·塔夫特,他在《量化信息的视觉表现》中概述了数据墨水比例原则:

定义表现数据的墨水在打印图标的总墨水的占比,在合理的基础上,使数据墨水比例最大化并去除非数据墨水和多余的数据墨水。

该原则要表达的核心思想就是简洁,我们的图表要简洁,我们的数据要简洁。最好的大屏可视化不是数据的平铺,不是设计的天马星空,而是针对客户场景,理解数据复杂性的基础上,通过可视化的手段,形成一个高度提炼的故事。

我们在项目调研、设计阶段都要以简洁、场景化为出发点,在理解客户复杂的场景、复杂的数据的基础上,将故事简化,为客户真正解决问题。深刻的简单并不是缺少复杂性,而是巧妙的掌握了复杂性,这一点深有体会。

数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。可视化是一个复杂的过程,在这里我们只想强调一个观念。

数据可视化通俗说就是要用图形讲故事,客户如果一见面就要看设计,那很显然我们就要跑偏了,我们在大屏上看到的是设计样式,看到的是一些指标数据,但再细想一下,人们关心的从来不是数据,数据不是重点,它只是达到目的的手段 ,人们关心的是数据背后的意义。

我们关心CPU利用率不是我们关心这个百分数,而是担心业务不能有效运行,数据和图形只是占位符,本身没有什么意义。

只有在特定场景下,融入数据才是有意义的,而可视化也只有将有意义的数据进行处理才能让数据产生持久效应。

规则是“你必须按这种方法做事。”原理是:“这种方式有效……而且经过了时间的验证。”两者有着本质区别。

大屏可视化的过程主要分为以下几个部分:

大屏的目的也是为客户解决某一个具体的问题,所以在项目入场前,我们要基于事实去最大程度的了解项目,事实可以弥补直觉上的缺陷,可以提升项目组对问题的把控能力,销售和售前前期有机会要基于《大屏基础信息调研表》完成客户的初次摸底,以减少项目的巨大变更。

我们要尽可能的收集事实信息,可以选择的手段有以下几种:

包括SOW、招标书、讲标文件等。

(2)利用前辈经验,不重复劳动

针对已有的客户我们要去跟售前、销售、公司对客户和行业了解的专家去坐下来一起聊聊项目,形成统一的建设思路,把我客户的基本期望。

可以通过上网和其他途径去了解一下客户的信息,目的不是收集到关于项目的具体信息,而是要对客户有一个整体的认识,吸取行业知识,了解行业现状。

在掌握基本项目信息的基础上,我们会对项目做一个初步的解决方案,形成一个初始假设,客户可能要做几个主题的大屏,每个主题要解决什么问题,都要展示哪些信息,要对接什么系统,哪个客户是关键角色……并对假设做出初步的解决方案。

与此同时要将项目信息提前通知到设计组、开发组、大屏组的同事,确定各方的资源安排和时间计划,这是为了增加其他人的可控性,避免项目并行人力资源紧张的风险。

了前期的准备后,我们需要做的是和客户达成共识,设计是一门浅科学,所有人都能对我们的作品插嘴评论,而且还会觉得理直气壮,为了减少这种情况,达成项目上的共识是必须的。

大屏项目可以说是一个“一把手工程”,一般最终拍板的就是领导,所以最完美的情况是领导就在你的项目启动会上,如果不在,争取让他在,这很重要。

启动会上的宣讲PPT是这个过程的主力,我们要在启动会上告诉客户什么是数据可视化,好的大屏应该是什么样,项目过程应该怎么做,并得到客户的认可与确认。

同时还要将之前的假设在启动会上与客户做一个初步确认,这个确认不是为说明假设是正确的,而是来验证我们是否掌握了正确充足的信息。

调研主要分为背景调研、数据调研和交互设计调研可以用到的方法主要是观察法和访谈法,另外,一把手的意见很重要。

调研的开始应该是从背景调研入手,我们要研究受众,分析标准,了解各种要求和相关利益者的想法,发现机会和限制,例如:从目标受众、大屏建设的目的和原因、理解业务等方向去了解,如果有条件,对好可以将大家组织到一起进行交流以确保信息的统一。

数据对于大屏就如同基因对于人体,数据决定了大屏要讲什么样的故事,决定了每一个图表该怎么展示。在我们验证之前了解的假设前提下,需要对数据进行更多的了解。对数据的调研主要分为认识数据、研究数据、整理数据。

基于不同的业务、不同的故事主题会有不同的数据展示需求,去客户的系统去实地查看一下数据,去了解数据对业务的影响,平时用户是怎么用这些数据的,观众会关心哪些数据,数据对接的条件是否满足等,并得到脱密的数据样本。

根据数据样本和观察的结果,要分析出数据的常规值、特殊值和各自对应的含义,还要看看名字的长度范围,数据适合是趋势展示还是实时数据展示,可能适合什么图形。

接下来就是要在数据之间建立联系,寻找故事、模式、关联和挑战,去思考数据中最有趣的是什么,什么最让人惊讶,数据中反复出现的事实和主题是什么,可以对数据进行分类和重要性排序,这里一定要考虑到受众的问题,他们是最终用户,并与具体人员逐个确认。

确认的过程中要避免数据堆砌的情况,有什么数据就往上放什么数据,还是要针对故事主题进行理解,可以尝试问问自己和客户,这个数据必须放上去吗,不放行不行,有没有什么可以替换的……

到底大屏还是用来看的,数据的调研基础上,需要对交互设计进行充分的调研,可以从环境、使用人群、观看人群等角度来进行探索。

包括物理环境和使用环境,物理环境是指大屏的硬件基本信息,屏幕的数目和材质、接入方式、分屏能力、整屏分辨率、横纵比、终端的显卡配置、显示要求等,使用环境是指大屏的应用场景,在什么时候用,要用多久。

会有哪些人来使用操作大屏,以什么方式来操作,要实际观察一下。

观看人群都有哪些,他们都是什么类型的人,他们观看的路径、步骤和位置大概是什么样的。

从调研中我们要找到交互的默认状态是什么样、常规状态是什么样、特殊状态是什么,常规操作是什么、默认操作是什么、误操作有哪些等。

在一部完成作品所体现的全部创作努力中,作家百分之七十五以上的劳动都用在了故事设计上。

大屏同写电影剧本一样,设计是核心,所以我们没有理由不在设计上花心思。前期的研究分析和坚定的信念是我们着手设计的基础,在原型设计阶段主要过程是草稿设计、验证、评审、原型图设计。

我们了解了客户的需求,要提炼出故事的关键词,关键词越简单我们理解的就越透彻,可视化的核心在于对内容的提炼,内容提炼得越精确,设计出来的图形结构就越紧凑,传达的效率就越高。反之,会导致图形结构臃肿散乱,关键信息无法高效地传达给读者。

根据关键词、主题、数据和交互的调研结果,用纸和笔进行草稿的制作,草稿上体现的是布局、图形和思想。

画完后,要和项目内部的同事一起去验证一下是否准确说明了故事,解决了问题,场景上能不能说通,分屏问题是否可以解决等。

在去见客户领导之前,先要跟设计和开发再次确认资源时间安排。向客户领导进行评审确认,收集客户的想法,修改几轮后得出成稿,并与客户取得确认,并向客户说明,现在修改还没有什么影响,后面内容再变就是变更,就会影响项目进度。草稿确认后要讲草稿电子化,并详细说明数据内容。

评审的时候可以再跟领导说明一下风格问题。

设计部分也是一个多方沟通的过程,我们要和设计和开发一起将整个调研的结果回顾一下,将业务跟同事说清楚,努力缩小设计和业务需求之间的沟壑。将数据样本、草稿、交互方案(或原型)提供给设计和开发。

这部分是和原型设计紧密相连的,但因为此过程比较重要,所以单独拿出来说一下,这部分主要的工作是:内部检查、现场测试、客户评审和修改完善。

设计原型图完成后需要在公司内部进行自我检查,查看在内容、风格、实现上是否满足需求。

带着设计同事一起去客户大屏现场看看实际投放的效果,能不能看清楚、色差大不大,比例对不对等等,最好模拟一下使用场景,楼上楼下,近处远处是什么样的感受。

自我检查修改后与客户领导一同在大屏现场进行评审。

可能免不了要修改几次,最终形成一个版本,每一次变更要形成版本号,并记录变更内容发给客户。

最终我们还要为客户形成一个《展演脚本》,辅助客户讲大屏的价值最大化的体现。再之后就是数据对接、系统实施部分的内容,此次就不做介绍。

文章的最后为大家提供一些调研中的技巧:

  1. 请被访者的上司安排会面;
  2. 开始前一小时,可以给被访人打电话咨询一下;
  3. 两人一组,这样一个问一个记录,避免遗漏信息;
  4. 可以在访谈中加入你已经知道的答案,这可以使你对被访谈者的诚实和知识有个大概的了解;
  5. 让被访者知道你在认真的听他说话:身体向客户倾斜,并时不时点头,经常用一些口语“嗯”“明白了”,同时写写画画;
  6. 留白:如果你觉得他们遗漏了一些信息或者不确定内容的重要信息,什么也不说,沉默一会,他们很可能会侃侃而谈,去填补空白;
  7. 问开放性的问题,不要问是和否,或者多个选择中的哪一个;
  8. 切勿问的太多,不要问被访者知道的一切事,你只需要知道两三件重要的事;
  9. 结束访问要出门的时候,问访谈者有个问题还想问一下,或者两天后再问,这样可以减低防备;
  10. 临走时也要再问一句,还有什么想告诉你的;
  11. 最重要的是倾听,访谈不是为了显示你有多么博学,如果是为了了解现状和最真实的情况,那就要多听;
  12. 倾听要做到身动、脑动和心动。身动是说我们除了要身体和语言上表示我们在听客户讲以外,要避免将手机放在他的眼前,也不要时不时的看手表和来回走,只要有一丁点的动作客户就能敏感的感受到你不耐烦的情绪;脑动是说如果客户没有表述清楚,你要为客户归纳好,总结好,帮助客户梳理内容;心动是指要知道客户背后的诉求,他们到底要怎么来解决这个问题。

本文由 @ SHsama 原创发布于人人都是产品经理。未经许可,禁止转载

我要回帖

更多关于 数据分析可视化图表 的文章