前天,微博红人@牛津-小裁缝,王老师发布了一张日本2023年县级人口增长情形的舆图,引发了大家的谈论:难道只有东京人口增长?大阪呢?名古屋呢?

作为数据可视化爱好者,我们当然不甘示弱:能否制作一张更深入、更全面的日本人口数据舆图?

我不想多耗费精力,打算用一小会儿就搞定这个任务。
寻衅在面前,必须借助AI,特殊是Claude 3.5 Sonnet,来实现这个目标。

第一步:数据获取

首先,我们须要从可靠来源获取数据。
经由传统的Google搜索,创造有人口数据的日本网站还挺多的,我也没有仔细看哪家更知心,就选了排在搜索结果前面的日本帝国书院的统计数据网站。

3小时寻衅小白若何借助AI实现人口数据爬取到可视化

都已经是表格了,非常随意马虎拷贝粘贴。
也可以找个chrome的插件拖沓下来csv,但是既然要想到和人工智能合营了,而且我这次打算试试最近很红的编程环境:Cursor,那就让Cursor带着claude来帮我写爬虫好了。

大口语Prompt:

“我须要从https://www.teikokushoin.co.jp/statistics/prefecture/ 获取2020-2023年日本47个县的人口数据。
请帮我编写一个Python脚本来实现这个任务。

当然,你的任务是一步步要将你看到的情形,出错的问题,用不引起歧义的措辞反馈给claude。

经由一点点小挫折,一个小时内还是搞定。

Claude不仅天生了完全的Python脚本,还知心肠阐明了每一步的浸染,乃至考虑到了网站可能的反爬虫机制,建议添加适当的延迟。

左边的代码你不用管,只要老诚笃实将缺点信息add到chat(增加到谈天对话)里面,补充你的信息和哀求。
cursor能够将claude天生的代码自动更正左边的代码块,太知心了。

第二步:数据处理

有了原始数据,下一步是将其整理成适宜舆图可视化的格式。
这时,我们再次向Claude寻求帮助。

大口语Prompt:

“我已经获取了原始数据,现在须要将它处理成适宜舆图可视化的格式。
详细来说,我须要打算每个县2020年到2023年的人口变革率。
请供应处理这些数据的Python代码。

Claude供应了一个简洁而高效的数据处理脚本,完美地知足了我们的需求。

第三步:舆图制作

末了,我们将处理好的数据可视化到舆图上。
Claude自动就想到了怎么绘制,并结合GADM的日本行政区划数据来制作终极的舆图。

大口语Prompt:

“请利用我已经下载的GADM数据gadm41_JPN_1.shp和gadm41_JPN_2.shp,结合我们处理好的人口数据,利用你处理好的数据做关联。

虽然也有些小波澜,比如matplotlib利用本地字体的问题等,但还是可以通过报错信息一起谈论办理。
其余,关于颜色该怎么配,增长和降落该怎么表达,你都可以反复考试测验。

县级人口增长率:只有东京都有增长。
市区町村落一级人口增长图。
4年连续增长的一个都没有

反思与启迪

全体过程从构思到完成,仅用了3小时(不包括写作本文韶光)!
这充分展示了AI如何大幅提升事情效率。
对付我这样对代码一点都不专精,也不求甚解的前GIS工程师,让我有愉快的觉得,彷佛并没有被年事击败,我还可以通过写程序完成一些故意思的任务。

AI提升了职场基准线:像这样的事情,若没有AI赞助,GIS小白、剖析师小白可能须要老师的辅导、合营才能完成。
人机协作的力量:AI不会取代人类的创造力和专业判断。
在全体过程中,我们仍须要选择得当的指标、舆图样式,并阐明数据背后的含义。
AI提高了高手的上限:虽然低级程序员可以借助AI完成一些基本任务,但这些代码离一个真正的工程化高手还差太远了。
那些难爬的网站,完备不是三言两语就能破解的。
但真正的专家也能够更好地利用AI,完成更繁芜、更有创意的项目。
Ta们在AI的加持下,更加放大了Ta们与普通事情者的差距。

这个中,对付所有职场人来说,最最关键在于如何提出精确的问题。
与AI的有效沟通,哀求我们对问题有清晰的理解,并能够将繁芜任务分解成详细的步骤。

结语

AI正在改变我们的事情办法,但它并不是万能的。
真正的代价在于人机协作,将AI的效率与人类的创造力和专业知识相结合。
希望这个案例能勉励你,在事情中探索如何更好地利用AI工具。
记住,工具在变,但学习和创新的主要性永久不变。
让我们躺平一下子,中兴身一起拥抱这个时期,用这些、那些很小很小的试验,让自己得到自我效能感,从而不断鼓励、提升自己,创造更多精彩!

图文:极海CEO王昊