您的位置  > 互联网

数据可视化编程实战(第2版):70多个方法,轻松入门

这是一个由 John 发起的开源项目。 关于它的由来,还有一个小故事。 约翰和他研究癫痫的同事使用专有软件来分析皮质电图,但他的实验室只有皮质电图分析软件的许可证。 他和许多同事必须轮流使用该软件的硬件加密狗。 于是约翰萌生了开发一个工具来替代他目前使用的软件的想法。 当时它在生物医学界得到广泛应用。 John 最初想开发一个基于 . 然而,由于它的一些局限性和缺陷,并且因为他对它非常熟悉,所以诞生了。

因此,无论从名称上,还是从提供的函数名称、参数和使用方法来看,它们都与 . 对于开发人员来说,它将非常容易使用。 即使对于不熟悉它的开发者(比如我)来说,其功能的使用也能一目了然,并且有非常丰富的文档和示例。 再加上这本书的介绍,学起来会非常容易。

命令提供了一种交互式绘图的方法。 在交互式shell中,我们可以执行命令来绘制图形并实时修改它们。 生成的图像可以保存为多种格式,具体取决于所使用的后端,但大多数后端支持 png、pdf、ps、eps 和 svg 等格式。

《数据可视化编程(第2版)》讲什么?

本书中,作者对内容进行了组织,删除了一些与章节关系不密切的扩展内容,同时也修改了版式,使本书在内容安排上更加简洁、紧凑。 在本书中,作者还介绍了Plot.ly。 其中包括功能强大、高性能的数据分析工具。 Plot.ly是一款优秀的在线图表工具,非常注重图表的可操作性和共享性。 从内容上来说,第二版更加完整地涵盖了数据可视化领域使用的主流工具。 由于篇幅限制,本书不可能对所有工具进行完整、详细的介绍,但本书提到的工具可以满足大部分读者的数据可视化需求,读者可以根据自己的情况有选择地深入学习自己的需要。

最好的数据是我们可以看到和理解的数据。 作为开发人员和数据科学家,我们希望创建和构建最全面且易于理解的可视化效果。 然而,这并不容易。 我们需要找到数据、读取数据、清理数据、过滤数据,然后使用适当的工具将其可视化。 本书以简单明了(有时不那么简单)的方式解释了读取、清理和可视化数据的过程。

本书涵盖了如何读取本地数据、远程数据、CSV、JSON以及关系数据库中的数据。

通过这个,我们可以用一行简单的代码绘制一些简单的图表,但是更高级的绘图需要额外的知识。 我们需要了解信息论和人类美学才能生成最吸引人的可视化效果。

本书将向您介绍一些使用绘图的实际练习,以及不同绘图功能的使用及其用法示例。

定义图表类型 - 柱形图、折线图和堆积柱形图

虽然我们画了一些图表,但我们没有详细介绍它们是如何工作的,也没有介绍如何设置图表和许多其他功能。 本文将介绍并练习一些最基本的数据可视化图表类型,例如折线图、条形图、柱状图、饼图及其变体。

它是一个功能强大的工具箱,可以满足几乎所有2D和部分3D绘图需求。 通过实例学习是其作者推荐的方法。 以后需要画图的时候,可以找一个类似的例子,做一些修改,以满足新的需求。

本节显示基本图表及其用途。 这里展示的大多数图表都是常用的,其中一些是理解数据可视化中更高级概念的基础。

1.1.1 准备工作

我们从 . 库并使用一些简单的示例数据来开始一些基本的绘图操作,为以下部分奠定基础。

1.1.2 操作步骤

让我们首先在 中创建一个简单的图表。 是一个很棒的工具,它允许我们交互式地更改图表并立即查看结果。

(1) 在命令行中输入以下命令启动。

(2) 导入所需的方法。

(3) 然后输入绘图代码。

图表将显示在新打开的窗口中,其默认外观和辅助信息如图1-1所示。

基本图表包括以下元素。

x 轴和 y 轴:水平轴和垂直轴。

x轴和y轴刻度:刻度表示坐标轴的间隔,包括最小刻度和最大刻度。