pip install altair pip install vega_datasets pip install altair_viewer
如果使用的是conda包管理器来安装altair模块的话,代码如下:
conda install -c conda-forge altair vega_datasets
altair初体验我们先简单地来尝试绘制一个直方图,首先创建一个dataframe数据集,代码如下:
df = pd.dataframe({brand:[iphone,xiaomi,huawei,vivo], profit(b):[200,55,88,60]})
接下来便是绘制直方图的代码:
import altair as alt import pandas as pd import altair_viewer chart = alt.chart(df).mark_bar().encode(x=brand:n,y=profit(b):q) # 展示数据,调用display()方法 altair_viewer.display(chart,inline=true)
output
从整个的语法结构来看,首先使用alt.chart()指定使用的数据集,然后使用实例方法mark_*()绘图图表的样式,最后指定x轴和y轴所代表的数据,可能大家会感到好奇,当中的n以及q分别代表的是什么,这个是变量类型的缩写形式,换句话说,altair模块需要了解绘制图形所涉及的变量类型,只有这样,绘制的图形才是我们期望的效果。
其中的n代表的是名义型的变量(nominal),例如手机的品牌都是一个个专有名词,而q代表的是数值型变量(quantitative),可以分为离散型数据(discrete)和连续型数据(continuous),除此之外还有时间序列型数据,缩写是t以及次序型变量(o),例如在网购过程当中的对商家的评级有1-5个星级。
图表的保存最后的图表的保存,我们可以直接调用save()方法来保存,将对象保存成html文件,代码如下:
chart.save(chart.html)
也可以保存成json文件,从代码上来看十分的相类似。
chart.save(chart.json)
当然我们也能够保存成图片格式的文件,如下图所示:
altair之进阶操作我们在上面的基础之上,进一步的衍生和拓展,例如我们想要绘制一张水平方向的条形图,x轴和y轴的数据互换,代码如下:
chart = alt.chart(df).mark_bar().encode(x=profit(b):q, y=brand:n) chart.save(chart1.html)
output
同时我们也来尝试绘制一张折线图,调用的是mark_line()方法代码如下:
## 创建一组新的数据,以日期为行索引值 np.random.seed(29) value = np.random.randn(365) data = np.cumsum(value) date = pd.date_range(start=20220101, end=20221231) df = pd.dataframe({num: data}, index=date) line_chart = alt.chart(df.reset_index()).mark_line().encode(x=index:t, y=num:q) line_chart.save(chart2.html)
output
我们还可以来绘制一张甘特图,通常在项目管理上面用到的比较多,x轴添加的是时间日期,而y轴上表示的则是项目的进展,代码如下:
project = [{project: proj1, start_time: 2022-01-16, end_time: 2022-03-20}, {project: proj2, start_time: 2022-04-12, end_time: 2022-11-20}, ...... ] df = alt.data(values=project) chart = alt.chart(df).mark_bar().encode( alt.x(start_time:t, axis=alt.axis(format=%x, formattype=time, tickcount=3), scale=alt.scale(domain=[alt.datetime(year=2022, month=1, date=1), alt.datetime(year=2022, month=12, date=1)])), alt.x2(end_time:t), alt.y(project:n, axis=alt.axis(labelalign=left, labelfontsize=15, labeloffset=0, labelpadding=50)), color=alt.color(project:n, legend=alt.legend(labelfontsize=12, symbolopacity=0.7, titlefontsize=15))) chart.save(chart_gantt.html)
output
从上图中我们看到团队当中正在做的几个项目,每个项目的进展程度不同,当然了,不同项目的时间跨度也不尽相同,表现在图表上面的话就显得十分的直观了。
紧接着,我们再来绘制散点图,调用的是mark_circle()方法,代码如下:
df = data.cars() ## 筛选出地区是“usa”也就是美国的乘用车数据 df_1 = alt.chart(df).transform_filter( alt.datum.origin == usa ) df = data.cars() df_1 = alt.chart(df).transform_filter( alt.datum.origin == usa ) chart = df_1.mark_circle().encode( alt.x(horsepower:q), alt.y(miles_per_gallon:q) ) chart.save(chart_dots.html)
output
当然我们可以将其进一步的优化,让图表显得更加美观一些,添加一些颜色上去,代码如下:
chart = df_1.mark_circle(color=alt.radialgradient(radial,[alt.gradientstop(white, 0.0), alt.gradientstop(red, 1.0)]), size=160).encode( alt.x(horsepower:q, scale=alt.scale(zero=false,padding=20)), alt.y(miles_per_gallon:q, scale=alt.scale(zero=false,padding=20)) )
output
我们更改散点的大小,不同散点的大小代表着不同的值,代码如下:
chart = df_1.mark_circle(color=alt.radialgradient(radial,[alt.gradientstop(white, 0.0), alt.gradientstop(red, 1.0)]), size=160).encode( alt.x(horsepower:q, scale=alt.scale(zero=false, padding=20)), alt.y(miles_per_gallon:q, scale=alt.scale(zero=false, padding=20)), size=acceleration:q )
output
以上就是分享一个口碑炸裂的python可视化模块,简单快速入手!!的详细内容。
