简单的讲解会帮助你理解数据可视化“美”的过程。
古人说:“人不能以貌取人”,但从古至今,人类都是一群感性的动物,容易受外在表象的影响,先感性后理性。
《后汉书》中提到,春秋末期鲁国人坦泰灭明,出身与众不同,“额低口窄,鼻低,无大貌”。他拜孔子为师,孔子并没有拒绝,只是对他漠不关心,不理他,让他坐冷板凳。于是,他毅然离开孔子,成为一名自学成才的人,另辟蹊径,游历讲学,积极传播儒家思想,培养了许多人才,深受百姓喜爱。孔子听说了他的事迹后,恍然大悟。
今天来看这件事也是很重要的。“颜值即正义”,长得好看的人似乎更受欢迎,更有优惠。
不过古人也说:“相由心生”。从一个人的外表和精神状态,我们大概可以知道他的内心状态。相反,一个人内心的心境也会投射到形象外表上。
所以要注重自身内在修养的健康发展,也要学会表达和审视国外的美。
同样,一个好的设计应该是内容和形式兼备的。
信息时代加快了人们的生活节奏,人们每天都很匆忙,时间也是碎片化的,没有太多的时间完整的看完一段。文字的力量是有限的。只有借助可视化,信息才能高效传播。
数据可视化是数据领域的一个重要分支,旨在“让数据说话”,展现数据之美。好的图表会说话,好的图表能俘获用户的心。
一、历史:人类对世界的认知和表达始于图片。
发现人脑同步处理图片信息,而分步处理文字信息,大多数人只记住一篇文字的20%;人在看报的时候,99%的文字信息会被自动过滤掉,脑子里只剩下可怜的1%;人脑处理图片的速度比文字快6000倍。也就是说,如果一篇6000字的文章需要10分钟阅读,压缩成一张图片只需要10/6000分钟。
图片比文字能表达更多的内容,同时能给人留下很大的想象空间,体现真实性(有图有真相),赏心悦目。
事实上,在远古时代,我们的远祖智人已经学会了绘画,并根据自己对周围生活环境的了解,在岩石、石壁和洞穴上描绘人、鸟、动物、草、木材以及狩猎、农耕、旅行、战斗、祭祀甚至男女性交等日常活动........................................................................在欧洲、亚洲、美洲和大洋洲70多个国家的150多个地区发现了岩画遗址,但只有非洲和澳大利亚的少数民族仍有制作岩画的传统,如著名的岩画遗址拉斯科洞穴壁画、阿尔塔米拉洞穴壁画、达迈迪岩画、薰衣草岩画、平图拉斯河手洞壁画、非洲象岩画和将军崖岩画。
岩画家伊曼纽尔·阿纳蒂在《世界岩画:原始语言》一书中提到:随着智人技术水平的提高和抽象感知能力的增强,出现了复杂的语言和艺术,岩画就是这种语言的一种记录形式;目前已知的岩画中,70%是狩猎采集社会的作品,其余30%是游牧和农耕时期的作品。在这些岩画的结构中,有* * *相同的记忆和普遍的认知模式。岩画是象形文字,书写在没有文字的时代,见证着人类隐藏的记忆。
可见,人类对世界的认知和表达是从图片开始的。
图1。古代的岩画
人类在造出文字之前,也经历了“用绳子打结来记录”和“记录一幅画”的阶段。
但是,随着社会的发展,人类发生了“农业革命”。他们不再单纯依靠狩猎为生,而是更加熟练地制造和使用工具,剩余产品逐渐增多,社会组织逐渐成熟。这时,社会组织不断产生大量信息。除了法律的条纹,他们还必须记录各种交易,税收,商品库存,假期和赢得战斗的日期。在此之前,虽然人们可以用图片做笔记,但仍然用大脑记录信息。随着信息的大量生产,很容易出现内存过载,于是就有了文字。
象形文字是从原始图画发展而来的。由于社会的发展,图片的效率低下,难以满足社交的需求,于是人们逐渐从图片中抽出元素,形成象形文字。象形字是最原始的造字方法,对文字只使用图形,而这些文字在形状上与它们所代表的东西非常相似,画面性被削弱,象征性被增强。苏美尔楔形文字、甲骨文、古埃及的象形文字和玛雅文字都是从原始社会最简单的图画和图案中独立产生的。
但是象形文字也有很大的局限性,因为一些物理的东西和抽象的东西是画不出来的,而且写起来很慢,很难读。
图二。世界四大古文字。
随着社会的进一步发展,汉字也得到了很大的发展,在象形文字的基础上,逐渐分化出了“表音”和“表意”两种文字。文字是用来记录和传播语言的,记录和传播的方式只有两种,要么是“表音”,要么是“表意”。就汉字而言,其发展大致如下:结体笔记-象形文字-象形文字-象形文字-语标。
社会的发展促进了文字的发展,文字使人们能够用更丰富、更多样的方式来表达事物,可以指物、象形字、音、义、注释、借口。人们对世界的认知和表达也在广度和深度上得到了极大的延伸。另一方面,人们可以更加准确、生动、深刻、灵活地记录自己的所见所闻、所思所想,加速了知识的传播和传承,推动了社会的大发展。
文字再丰富,也有难以突破的局限。文字需要理解,不是一目了然,对抽象的事物和个人的表达不够生动。所以在文字出现后的时代,很多文献都是以图文结合的形式流传下来的。比如1912发现的伏尼契手稿中,字母和语言至今未被破解,但很多植物、天体等美女的图画甚至还有精美的图案,一看就令人叹为观止。
图3。伏尼契手稿
二、发展篇章:进入了“百花齐放、百家争鸣”的时代
在计算机出现之前,人们已经能够灵活运用柱形图、折线图、饼状图等基本图表来显示数据,也衍生出了许多新颖的、有创意的数据图表。
大家应该都知道南丁格尔(国际上称她生日后的护士节),但很多人应该不知道南丁格尔的玫瑰图(下图)就是她创作的。克里米亚战争期间,南丁格尔发现很多死因并不是“死在战场上”,而是在战场之外感染了疾病或者在战场上受了伤,却在没有得到适当护理的情况下死去。为了解释这个原因,降低英国士兵的死亡率,她绘制了这张著名的图表,并于1858年提交给维多利亚女王。(这么漂亮的图表,女王一定很感动。)
图4。南丁格尔玫瑰图
米纳尔德是世界著名的绘画大师,他创造了许多重要的主题绘画技巧,并改进了其他技巧。他是第一个把饼状图和地图结合起来,把流线放进地图的人。下图是米纳德最知名的作品,被爱德华图夫特视为史上最杰出的统计图。描绘了拿破仑军队离开波俄边境以来的军事损失,通过拿破仑军队的数量、行军距离、温度、经纬度、移动方向、时间地域关系两个维度呈现了六个维度的信息。
图5。拿破仑进行曲
计算机出现后,特别是互联网的兴起,人类社会以摩尔定律的速度进入了一个全新的时代,科技也得到了前所未有的创新和发展,也给人们带来了很多新的思想。
随着技术的进步,我们可以收集的信息比以前多得多,数据的规模在数量级增加,数据的内容和类型也比以前丰富得多,改变了人们分析和研究世界的方式,为人们提供了新的可视化材料,促进了数据可视化领域的发展。
与过去相比,数据可视化领域发生了许多变化,取得了很大的发展。
1.视觉形式和场景更加丰富。
当今信息时代,信息已经“泛滥”和“超载”,人们每天都被各种信息轰炸。当我们打开一个网页或者手机APP,首先映入眼帘的就是各种弹窗广告信息。这些信息从内容到形式都经过精心设计。当我们走在街上,映入眼帘的是满大街的广告海报,人们经常站在街上向路人散发传单。我们不仅从书本上看到了视觉图表,还从海报、信息图、PPT、数据产品、大屏等获得了大量的视觉信息。
图6。可视化。
2.视觉呈现方式更加多样灵活。
数据图表是最常用的视觉元素。除了柱形图、条形图、饼状图、环形图、折线图、散点图、面积图、雷达图、k线图、地图等基本图表之外,现在又多了一些新的图表,比如峰值图、雷达图、气泡图、热图、漏斗图、树形图、箱形图、瀑布图、河流图、字云图、仪表盘、夜莺玫瑰图等等。此外,聪明人还经常创造性地混合搭配各种图表,如下图,地图与饼图、散点图、柱形图一起使用。
图7。各种图表的混搭
除了图表,图片和图标的灵活运用,使可视化更加美观、生动、贴切。
图9。图标的灵活使用
3.从静态到动态
由于技术的发展,实现了实时数据采集、实时数据传输、实时数据计算,人们终于可以领略到数据的灵动之美。过去,人们只能在事后看到数据的分析结果,看到数据的过去式,欣赏数据的静态之美。现在,通过实时计算和数据可视化,人们可以知道“此刻正在发生什么”,看到数据的变化,看到数据的动态之美。
4.设计上更注重用户体验。
“信息泛滥”造成的信息过载导致“信息焦虑”。无论是风格、元素、配色、文字、交互还是细节,人们的视觉作品越来越注重用户的视觉体验,希望不用花一点时间去理解,就能让用户一目了然。在设计风格上,从3D拟物化到简约、扁平化到拟物化的发展变化,也在不断为用户“减法”。
三。原则:设计的四个原则
“别忘了,你是在为读者做视觉设计。”
——《数据之美:学习视觉设计的一本书》
所有的设计细节都必须从用户的角度仔细构思和考虑。
高颜值或者穿着得体的人,总能牢牢吸引住别人的目光。相反,衣着不修边幅的人往往一眼就被别人嫌弃。那些聪明的人一定知道其中的秘密:一份好看的PPT报告,总能在第一时间吸引住观众,再加上一段生动的演讲,就会收到很多好评;广告牌做得越好,越能吸引路人的注意力,越能被路人记住,广告效果也会越好。
看到别人的视觉作品,是不是总觉得不好,却又说不出哪里不好?如果你熟悉以下基本原则,即使你不是专业设计师,你也能很快看出问题所在,并提出非常中肯的建议。如果你能巧妙地运用这些原则,你的视觉作品将会焕然一新,更加专业,美观有趣,也会获得更多读者的欣赏。
亲密度(分组)
在生活中,几乎任何事物都是有逻辑的,人们喜欢遵循一定的逻辑去理解世界上的事物,比如时序、空间、因果、总-分-总等逻辑结构。
在做视觉设计的时候,我们要表达的东西一定不能杂乱无章的呈现,这样会给读者造成混乱。我们的视觉作品要能遵循大多数读者都能理解的思维逻辑,把内容分成几个部分,按顺序一步步表达出来。
同一部分的内容,相互之间有联系的,要紧密的放在一起。这样就可以理解为同一个单元的内容,而不是多个孤立的、不相关的内容。不同部分的内容要分清楚,比如上下部分用空行隔开或者加大间距。这有助于组织信息,减少混乱,为读者提供一个清晰的结构。
图10。亲密原则
排列
在布局中,任何元素的放置都可能影响甚至主导用户的视觉过程。所以任何元素都不能随意摆放,否则会造成混乱,混乱会让人不舒服。对齐使每个元素与其他元素建立某种视觉联系。对齐也让视觉作品更清晰,更精致,更清爽。
对齐不仅包括左对齐、右对齐、上对齐和下对齐,还包括水平居中、垂直居中、水平分布和垂直分布。
图11。对齐原则
重复/统一
我们都有一个“先入为主”的坏习惯。当我们看到与之前不一致的东西时,往往会觉得突兀,甚至本能的抗拒。因此,一些视觉元素在视觉作品中被重复使用,以建立上下文之间的联系,增加组织性,保持视觉的统一性。
任何视觉元素都可以在同一个作品中重复使用,比如颜色、形状、材质、空间关系、线宽、字体、大小和画面等等。
图12。重复原则
对比/强调
在做视觉设计的时候,我们的初心就是把信息以图文的形式清晰地传达给用户,让用户一目了然,尽量不需要太多的思考和理解。为了达到这个目的,我们需要强调重点,弱化次要,避免作品中的所有元素看起来都具有同等的重要程度。如果一切都同等重要,就说明一切都不重要。
图13。强调重点,弱化必要性。
如果要突出一些信息点,做好相应的元素(字体、颜色、大小、线宽、形状、空间等。)区别于其他元素,让用户先关注。
图14。对比原则
表达,力求准确、到位、简洁、易懂。
当用户看到我们的视觉作品时,我们最好确保所表达的信息能被用户正确理解。除了利用上述原理,我们还需要附加一些辅助信息,如文字、箭头等。视觉作品中,文字是必不可少的,但长度要控制。
文字的表达要准确、到位、简洁、易懂,要能引导用户正确理解图表的含义,不造成任何歧义。
图15。表达要准确到位。
第四,过程:必须有一个正确的数据可视化的姿态
没有什么比亲手创造美更能带来成就感了。
当我们怀着兴奋的心情开始数据可视化的时候,请不要马上一头扎进某个细节,不要担心要展示什么酷炫的图表,也不要担心要用什么颜色和字体。我们要有正确的数据可视化开放姿态。
不同形式的数据可视化流程是不一样的,这里主要说一下重要的、相互联系的部分。
了解你的需求
关于需求,在实现之前,一定要听清楚做什么,想清楚怎么做,解释清楚怎么做。
了解和分析数据可视化需求,主要围绕以下几点:
1.看什么,也就是需要可视化的东西。
很少有需求者能准确全面的说出自己真正想要的东西。他们只能描述大概的样子,所以需要不断的引导,明确真正详细的需求。
可视化的目的是什么,用户是谁,在哪里看,在什么情况下看,多久看一次;
了解数据,看看哪些指标可用,哪些指标可以直接取,哪些需要复杂计算,哪些可以实时,哪些只能离线;
哪些指标必须显示,哪些指标不显示,哪些指标可以显示或不显示;
展示的维度有哪些,按时间、部门、地区、指标,看实时数据还是历史数据;
通过可视化,期望从中了解到哪些信息,等等。
2.谁看,就是谁是用户。
如果你面对的是一个务实的老板,你可能需要专注于内容,追求逻辑的合理性和数据的准确性;如果是来访客人,为了展示公司的实力和形象,可能会追求高大上的图表设计;如果你是一个不懂技术的商务人士,可视化的时候可能需要避免过于技术化。
3.往哪里看,也就是视觉形式有哪些。
一次性工作汇报,可以用PPT,如果老板讨厌做PPT太慢,可以直接用Excel,或者其他工具,比如脑图;如果定期计算的指标数据提供给多个用户,可以在不同条件下查看,则适合做数据产品或可视化报告;在向来访的客人介绍公司时,如果想给他们提供赏心悦目的视觉享受,用大屏幕将数据可视化比较合适;如果你想为公司各部门的同事普及知识、介绍成果、通报活动,制作一张可视化的信息图发布到网上,既有趣又生动,不仅能吸引更多读者的关注,还能提升阅读体验。
4.在什么情况下。
“第一印象”肯定很重要。用户第一眼当然觉得不好,然后就没有“第二眼”“第三只眼”了,就不会再往下看了。所以要给用户足够好的第一眼视觉体验,就要多想想用户会在什么场景下看你的视觉作品。
比如你打开手机,大多数情况下,用户只会根据标题选择性地浏览一小部分文章。所以,取一个生动、有趣、鲜明的标题,会比普通标题更有视觉冲击力,会让你的文章从众多内容中脱颖而出,赢得更多用户点击阅读。
图16。取一个吸引人的标题。
比如在一个企业(尤其是人多的公司),每天通过邮件将海报、信息图形式的内容大量分发到各个部门,或通知活动,或展示成果,或宣传典型事例,等等。每个员工都是“信息过载”,只能阅读少量信息。
除了吸引人的标题,还需要关注用户打开邮件的实际场景。很多用户打开这种群发邮件时,往往是以下几种情况:一堆收件人,一堆抄送人,已经占据了有限的电脑屏幕的一部分,剩下的就是点击邮件时出现的正文内容。所以标题(和内容摘要)完全可以显示在这个区域,吸引用户往下看。
图17。多想想具体的场景。
视觉设计
视觉设计是最重要的环节。只有做好这一点,接下来的事情才能变得简单流畅。
1.梳状逻辑
我们在阅读的时候,只要遇到稍微难一点的知识,都会本能的第一时间选择退缩,停止阅读。我们之所以觉得难以理解,主要是因为逻辑不清晰给我们带来了理解上的困扰。逻辑就像一棵树的树干。如果我们只看到树叶而看不到树干,我们就会迷失方向。所以在视觉设计之前,一定要站在用户的角度,梳理清楚逻辑结构。搞清楚这一步怎么做很重要,多花点时间也无所谓。
对于数据可视化来说,逻辑就是确定每一部分的核心内容,以及内容之间的顺序和关系,即什么该说什么不该说,先说什么再说什么。
让逻辑更简单明了,用户会更快理解你的“良苦用心”。
设定风格
风格营造了一种氛围,驱使用户沉浸在阅读中。不同的风格适合不同的用户,不同的场景,比如科技,学院,活泼,严肃,可爱等等。
3.排版
版面设计讲的是如何处理信息,因为在任何设计中,首先需要注意的是最重要的信息,其次才是次要信息。
好的布局就像导盲犬,合理安排内容,恰当安排布局中的视觉流程,引导用户第一时间看到最需要关注的部分,暗示用户“先看什么,再看什么”。
一般来说,视觉作品一般包括标题、文字、图表、说明文字等元素。布局就是根据上述原则,来确定元素之间的层次结构,并合理地放置这些元素。
选择图表
不,图表越酷越合适。这首先取决于显示什么数据。有些图表只适合以相应的格式显示数据。其次,还需要对展示数据的图表进行个性化设置,包括风格、样式、颜色、字体等,使之贴合语境,让图表更温馨。
不要因为这样就选择默认设置的图表,不要做那种“差一点的先生”或者“还不错的女士”。如果把默认的图表放在一个视觉作品里,总是显得那么突兀和不协调。另外,放弃默认设置可以迫使你不断进步,提高自己的可视化能力。
调整细节
单个部分的视觉设计并不能完全保证整体的和谐。所以,回到整体,按照上述原则,找出细节,调整一些细节,使其整体一致。比如每个部分的视觉元素都是对齐的,比如标题、文字、图表等。在配色、字体或其他细节方面,各部分要尽可能统一;各部分之间要有明显的分隔,等等。
(3)指标计算
巧妇难为无米之炊。有了数据,才能谈数据可视化。数据的获取、整合和计算会占用大量时间。这部分工作相对独立。
但需要注意的是,模拟数据和真实数据是有差异的。根据模拟数据设计的图表必须用真实数据呈现和验证,以验证图表和真实数据之间的拟合。比如下图,用模拟数据展示的图表中,部门之间有明显的差异,但用真实数据展示时,却“看起来感觉都一样”。这时候就需要调整图表的设置,突出视觉上的差异。
图18。用真实数据验证可视化效果。
这里省略指标的计算过程。
前端开发
数据产品和大屏的可视化也需要前端开发。
理论上只要设计好图表,就会在前端实现。但这可能受限于前端开发者的技术水平和展现工具。所以视觉设计有时候需要在设计和实现之间寻求平衡。
视觉设计师最好提前评估,在采用复杂的图表设计之前,最好和开发者沟通讨论实现的可行性。
5.工具:可以用Excel设计图表吗?
Excel是最常用的,基础的,灵活的,作为制图工具应该掌握。可以说大部分图表样式都可以用Excel来绘制。如果你认为你不能用Excel画出某种样式的图表,那可能是你还没有掌握Excel的高级技巧。
Excel显示的图表是静态的,支持的数据量有限。所以如果是企业级的动态数据展示,就需要使用专业的大数据可视化工具。
专业的可视化工具有很多,大致可以分为三类:企业级专业可视化工具、轻量级在线可视化工具、程序化制图工具。
企业级专业可视化工具
ECharts是一款开源的制图工具,在中国使用率很高。它可以在PC和移动设备上流畅运行,并兼容当前大多数浏览器。底层依靠轻量级的Canvas类库ZRender,提供直观、生动、交互、高度个性化的数据可视化图表。在ECharts 3中加入了更丰富的交互功能和更多的视觉效果,并对移动端进行了深度优化。
D3.js是最好的开源数据可视化工具库。D3.js运行在JavaScript上,使用HTML、CSS和SVG。D3.js使用数据驱动的方法来创建漂亮的网页。D3.js可以实现实时交互。这个JS库以SVG和HTML5格式呈现数据,所以IE7和IE8这样的老浏览器无法利用D3.js函数。
Tableau是一款企业级大数据可视化工具。Tableau允许您轻松创建图表、表格和地图。它不仅提供PC桌面版本,还提供允许您在线生成可视化报告的服务器解决方案。服务器解决方案可以提供云托管服务。
轻量级在线可视化工具
BDP个人版,类似Tableau的免费在线数据可视化分析工具,无需破解、下载和安装,在线注册后即可一直使用。操作很简单,拖拽即可。支持数十种图表类型,还支持数据图的制作(带坐标校正)。除了可视化,BDP还具有数据集成、数据处理和数据分析的功能。
百度表示,基于在线图表制作工具ECharts,采用Excel风格的操作模式,制作出风格丰富的图表,图表定制的选项丰富,使数据呈现更加美观和个性化,易于分享和传播。
文本映射主要在您想要生成带有文本描述的报告时使用。它提供了几个风格和配色都不错的主题供选择,让整个报告统一、简洁、美观!吐温能很好地适应移动终端。但是文字和图片的排版不是很好用。
创客贴,一款在线平面设计工具,据说是2016年度最好的在线设计网站,可以简单、快速、轻松的完成在线设计。
编程图表工具
对于掌握编程语言的程序员来说,新奇、惊艳的数据图表也可以通过代码实现。
Python有很多具有绘图功能的包,比如matplotlib、Seaborn、ggplot、Bokeh、pygal、Plotly、Geoplotlib、Gleam、missingno、Leather等等。
r语言提供了很多数据可视化工具包,比如ggplot2、ggthemes、ggmap、ggiraph、ggstance、GGally、gganimate、ggradar、ggTimeSeries、ggseas、lattice、rgl、ggvis、htmlwidgets、fleet、dygraphs等等。
提供强大绘图编程功能的类似语言有PHP、HTML、JavaScript、CSS等等。
不及物动词技巧:刻意练习是提高可视化技巧的唯一途径。
不断练习,不断提高。
提高数据可视化技能的唯一方法就是在理解可视化设计原理和方法论的基础上,不断练习和提高。
另外,应该有一些完美主义。
技巧在于平时的积累。多观察,在生活中看到好的设计,多思考为什么人家的设计那么好,让你忍不住多看几眼。当你看到一个糟糕的设计时,多想想是哪里出了问题。看到漂亮的图表,看到别人介绍的小技巧,就去做。
技巧太多,这里就不赘述了。
“倾向于使用设施”
“这是现代技术的另一个特征,以前很少有人想象得到——倾向于设施。这种倾向在地球上刚刚开始出现,但“去设施化”已经成为比地球世界更高级的舰队世界的基本结构。世界简单,到处空旷,几乎看不到任何设施。只有在需要的时候,设施才会出现,它们会出现在任何需要的位置。被技术复杂化后,世界又在变得简单,技术深深地隐藏在现实背后。”
——《三体》
科幻小说《三体》中的这段话给了我们一个提示。我们在分析和可视化数据的时候,如果不使用选项框和菜单栏,就要把它隐藏起来,用的时候再打开。另外,尽量最大化使用软件。这样就可以将内容信息以最大的视野展示出来,帮助我们获得更全面的信息,指导我们下一步做出正确的决定。
图19。有限的视野,信息最大化
颜色不能太多,配色要合理。
在视觉设计中,我们最好不要使用三种以上的主色。过多的颜色会分散用户的注意力,让用户无法集中注意力。
配色要合理。大自然是最好的调色师,我们可以借鉴大自然的色彩搭配。另外,如果你第一眼看到别人的设计,觉得很舒服,很顺眼,也可以借鉴一下作品中的色彩搭配。相信你的直觉,至少你的身体不会欺骗你。
图20。颜色要避免太多,配色要合理。
照片21。从生活和自然中学习配色技巧。