代码太复杂?三句话让GPT帮你完成数据分析!附关键词
在阅读NS正刊或者是子刊时,我们发现这些文章里面的图片往往别具一格,特别是一些数据分析相关的图,能够简明扼要地表示出作者的想法。现在GPT-4在分析CSV文件和数据可视化方面取得了重大进步。结合GPT-4,您不需要写任何代码,只需要输入指令就能获得非常棒的图片。
GPT关键词:impressionist style of a dashboard with a global map and 2 charts
GPT-4辅助数据分析
首先,打开GPT网站,点击小曲别针,上传您的csv文件,这里我们以FLUXNET的AR-Slu站点数据为例,您可以在公众号聊天窗口输入"FLUXNET例子"(无引号)获取此csv数据集。上传完成之后,在聊天框输入,"帮我分析这个FLUXNET的观测数据CSV"。并回车。
稍作等待,GPT-4出现analyzing字样,表明GPT在分析此CSV,不久后可以看到输出如图所示:
可视化
这里还只是很笼统的一个分析,现在我们要求GPT帮我们画图。告诉他您要绘制的列随时间的变化,"帮我绘制TA_F_MDS列随时间的变化趋势"
此后GPT会尝试对气温时间序列进行绘制,并输出图像。
你可以点击最后的代码图标获取原始的Python代码进行一些自定义。GPT会直接提供给您绘图所需要的代码
# Attempting a different approach due to the recursion error encountered
# Directly filtering out -9999 values without replacing them, to avoid recursion issue
ta_f_mds_filtered_direct = fluxnet_df[fluxnet_df[TA_F_MDS] != -9999][TA_F_MDS]
# Re-plot with direct filtering method
plt.figure(figsize=(10, 6))
plt.plot(ta_f_mds_filtered_direct.index, ta_f_mds_filtered_direct, marker=o, linestyle=-, color=blue)
plt.title(TA_F_MDS Temperature Trend (2009-2011))
plt.xlabel(Time)
plt.ylabel(Temperature (TA_F_MDS))
plt.grid(True)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
不过没这个必要,因为您可以直接告诉GPT要怎么改,比如小编这里要求它将线的颜色和图表标题进行更改:
您还可以直接问需要的数据问题,例如直接问它,哪个月份气温上升最快,或者,你从中看出了什么:
生成报告
GPT-4的优势之处在于可以直接生成Word或者PDF格式的报告。可以通过直接询问:“请帮我生成一份关于气温变化情况的word文档,带着气温变化的趋势图”,就可以获得一份非常棒的分析文档。GPT会直接提供给您下载链接。
如果您还没有GPT-4,或者是嫌GPT-4注册过于麻烦,您可以点击文章下方的链接,快速获取不需要科学上网的GPT-4。