2k字给你说清楚这3个大模型的能力测试和对应结果,想用AI做excel的友友必看系列~
就目前,市面上不乏声称能够轻松处理Excel文件的各类AI大模型,但说实话,它们的表现却是参差不齐。像KiMI、豆包和智谱清言这样的工具在处理数据时确实令人眼前一亮,不过有的处理起Excel文件来就显得力不从心了,不是图表呈现不够直观,就是数据准确性让人捏把汗。更别提偶尔会算错数字,实在让人头疼不已。接下来,让我们一起探讨这些AI模型在处理Excel文件时的表现和差异吧!
计算总和
在计算总和的能力上,不同AI模型的表现各异。经过多次严谨测试,我发现智谱清言在准确性和计算能力上都表现最为可靠,而KIMI和豆包则在某些方面存一些不足。
我上传一个关于全球总人口数量的文件,先以最简单的求和问题,询问表中每年的总人口数量是多少,并希望以表格的形式表现出来。
KiMI很快的计算出了结果,并且表格的形式呈现,但每年的结果是错误的。(图表中有世界这一栏,给出的是世界这一栏的答案)
豆包也计算出来了结果,并且以表格的形式形式呈现,很明显计算结果有误。(图表中有世界这一栏,给出的是世界这一栏的答案)
智谱清言的速度相比较KIMI和豆包比较慢,因为它需要先思考在执行,最后出结果,但是虽然慢结果是正确的。 从以上分析可以看出只有智谱清言的计算总和能力没问题。
查找数据计算总和
我以“我想知道中国这几年的人口数量总和,将每一年的数据列出来,在列出来总和”为问题,看看各家模型给出的答案,而总和应该是6728055000。
KIMI的答案:查找数据没问题,计算总和有问题。
豆包的答案:查找数据没问题,计算总和没问题。
智谱清言的答案:查找数据没问题,计算总和也没问题。
排序问题
我以“我想知道每年人口数量最多的10个国家,并且用图表表现出来”这个问题,测试下各家模型的排序问题,以及是否把结果现出图表。 不管我是按照一个图表进行排序还是每个图表进行排序,前10名分别是世界、中低收入国家、中等收入国家、中低等收入国家、中高等收入国家、南亚、中国、高收入国家、印度、撒哈拉以南非洲地区。
KIMI的答案:没有答案,只提供了方法。
豆包的答案:答案错误,不知道是否认为【中高等收入国家】这种不是国家,所以给出的答案都是国家,但是我想处理的仅仅是这个表格,答案不是我想要的。 豆包目前无法生成图表,只能以表格形式呈现。
智谱清言的答案:答案完全正确,并且生成了图表,图表也可以进行下载。
计算增长率
计算增长率涉及减法及除法,我以‘地区代码以a开头的国家,每5年的增长率是多少’为题,看各模型的答案。 KIMI的答案:依然告诉我方法,没办法告诉我实际的答案。
豆包的答案:查找数据正确,计算数据正确,但是缺少2016-2021年的增长率数据。
智谱清言的答案:这次让我很遗憾,智谱清言只查找了数据,无法进行计算。 我尝试了其他的方法来进行人口增长率的计算,它告诉我无法进行计算,
通过以上数据的分析,可以知道KIMI和豆包只能提供表格样式。
智谱清言可以提供图表形式,接下来测试是否提供其他形式,比如饼状图、柱状图等。
通过以上测试,基本生活中需要的图表都可以生成,这点而言我目前还未发现其他模型可以完成。
讯飞星火可以支持上传Excel文件,但是目前问题只有第一个问题回答了总和,其他问题都没回答出来。
通义千问可以支持上传Excel文件,但是没有一个问题回答出来。
总之国内的AI大模型在支持Excel文件上传及分析方面各有千秋。
智谱清言不仅支持包括Excel在内的各种格式文件上传,还能对上传的文件进行进一步的数据分析,并给出相应的分析结果,同时数据的准确性是最高的,还可以生成各种需要的图表,以出色的文件分析和结果输出能力而脱颖而出。
这对于需要进行复杂数据处理的用户来说,无疑是一个巨大的便利。
其次是豆包,豆包数据处理上基本上比较准确,只是图表的多样性有待提高。
与智谱清言、豆包相比,KIMI可以接受Excel文件的上传,它没有提供针对Excel文件的直接分析功能,很多问题只能提供方法都不能提供直接的分析结果,意味着用户在上传数据后,还需借助其他工具或方法来完成数据分析的工作。
通义千问以及讯飞星火虽然支持文件上传,但在数据分析功能上还有待提升。
值得注意的是,文心一言目前只支持PDF文件的上传,暂时还不支持Excel文件。