疫情舆图紧张分为数据处理和舆图展示两大板块,相较于其他的一些疫情舆图项目,知识疫图不仅在数据可视化方面从韶光、空间两个维度尽可能地做到细粒度,而且涵盖了国内外新冠疫情多项不同数据的层级展现。
在疫情舆图实现过程中,紧张包括了疫情数据的采集与整合、地理数据的利用、舆图绘制三大流程,接下来将逐一先容。

疫情数据的采集与整合

要想打造好疫情舆图,根本事情是疫情数据的采集与整合。
在疫情数据的网络过程中,知识疫图整理了丁喷鼻香园、WHO、约翰·霍普金斯大学、必应等国内外多个平台的数据源,这些数据对付不同地区疫情有不同力度、不同准确度的描述。
多样的数据源,不仅可以使数据更细粒度,而且担保了数据的完全性和准确性。

如图一所示,针对不同数据源的更新特点,知识疫图利用了不同的采集办法,并将采集到的数据凑集于一个数据库中,通过整正当式进行监控,整理对齐以便后续前端利用。
图二是个中整正当式包含的详细事情,示例了其对数据对照、合并、补充、纠正四个方面的处理。
数据整合后的数据库由于数据过大,不利于传输,对此研究职员采取了如图三的数据压缩办法,大大减少了字段不必要的开销。

若何将新冠疫情搬上地图人工智能常识疫图可视化

图一 知识疫图数据采集过程

图二 整正当式

图三 数据压缩办法

舆图数据的利用

除了疫情数据,疫情舆图项目中地理数据也尤为主要。
地理数据紧张有Geojson(图四)、Topojson(图五)、Shapefile等几种通用格式。
Geojson将地理形状定义为点、线、面平分歧的类型,不同类型有各自地理特色的描述,其的优点在于可读性强,但对数据的描述存在冗余。
Topojson 针对Geojson的这一毛病做了相应改进,减少了数据的重复性。

图四 Geojson格式

图五 Toposon格式

在地理数据的来源上,知识疫图海内和国外分别采集了阿里云、Natural Earth两大数据源。
在网络到数据之后,进行地区字段的匹配如Beijing–China|Beijing–北京市,繁体简体转换,中英文对照等地区ID重组事情。
虽然Natural Earth有数据完全性等优点,但其数据还存在一些细节须要改动(如图六)。
中国地区的改动,紧张指九段线、南海诸岛、台湾省、藏南地区等边界线和描述的处理。
其他天下地区的数据调度包括(1)区域的重新方案比如意大利、法国等国家,须要以国家-大区-省办法重新合并和调度;(2)更粒度的数据处理比如英国苏格兰、北爱尔兰须要细化出像英格兰一样郡级的数据。

图六 数据改动示例

舆图绘制

将网络到的疫情数据和地理数据整理对齐往后,下一步进行舆图绘制。
舆图绘制紧张以前端渲染展开,其办法有SVG绘制、海内的舆图组件(百度舆图、高德舆图等)、国外的舆图组件(Google Map、Mapbox)等。
传统的SVG绘制大略快捷,但是存在放大缩小的局限性。
舆图组件可以做到不同层级的绘制,但须要大量的数据,此外国内外可能存在差异。
综合考虑疫情舆图项目的需求和各种绘制办法的特点,知识疫图选择了基于Mapbox的舆图组件这一办法。
图七是SVG绘制和Mapbox舆图组件绘制后的比拟,从图中可以看出两种办法在粒度上的差别,SVG绘制只能做到粗粒度的展示,但Mapbox舆图组件可以较好地呈现更细粒度的数据。

图七 粗粒度vs.细粒度

借助Mapbox Studio进行前端渲染,将完全舆图数据转换成区块数据,而区块级数据可以根据放缩大小完身分歧程度的边界压缩。
比如在图八天下舆图的宏不雅观界面时,Mapbox Studio会将细粒度数据压缩为可以知足需求的粗粒度数据,但当放大到某一详细区域时,会转变成此地区细粒度的数据。
宏不雅观时采取粗粒度数据,微不雅观时减少细粒度数据的范围,灵巧的转变办法可以很好地实现不同层级的数据呈现,并掌握传输开销。

图八 Mapbox Studio宏不雅观前端渲染

前端渲染有其内在逻辑和流程,以图九中国地理数据为例,数据源包含了区域等特色。
基于数据源舆图组件会分为不同的层,每层依据不同的渲染规则卖力渲染不同的内容。

图九 中国地理数据前端渲染

除此之外,知识疫图的疫情舆图前端渲染还包括了图十示例的事宜,将各种新闻以舆图标记的办法放置在疫情舆图上,方便用户能够理解全天下在疫情之下各国发生的详细变革。

图十 事宜渲染