一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

当前案例中,我需要为Devexpress的CardView标题栏赋值,这个问题同时问了三个AI平台,结果如下:

文心一言

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

这个回答包含了三个错误:

  • “object”未包含“RowHandle”的定义
  • “BaseView”未包含“GetDataRow”的定义
  • “object”未包含“Caption”的定义

告知错误给文心一言,文心一言修正答案。

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

但是,实际上错误并没有修复,至少存在以下几个问题。

  • “object”未包含“RowHandle”的定义
  • “object”未包含“Caption”的定义

再次反馈文心一言,于是文心一言摆烂。

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

可怕的人工智能,不但没有消除上文提到的两个错误,还将代码几乎全部注释掉。

原因很简单,文心一言智能程度不高,了解的只是很少,没有修复错误的能力。

实际测试中,除了能力弱以外,文心一言还存在上下文毫无关联的情况。比如说上文咨询了一些问题,通过文心一眼的交互后,进一步反馈时,文心一言的上下文会莫名被清空,回答一些毫无关联下的”人工客服“类的措辞。

通义千问

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

通义千问相较于文心一言来说,首先是界面上优秀很多,代码流畅性也更好,文心一言经常浏览器页面卡顿明显,通义千问哪怕有较长的上下文,卡顿现象也会少很多。

然而,通义千问的回答,仍然是有问题的:

“CardCaptionCustomDrawEventArgs”未包含“Card”的定义

反馈后,给出了新的回答。

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

出现了和文心一言相似的问题,e.CardIndex实际是不存在的,只有e.CardInfo。

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

仍然没有提供正确的有效的代码,存在的问题是:“object”未包含“VisibleIndex”的定义。

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

还是错误,错误原因是:命名空间“DevExpress.XtraGrid.Views.Card”中不存在类型或命名空间名“CardViewInfo”。

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

在这里,通义千问重复了千问中犯的错,这是通义千问的老毛病,他会在A<=>B之间来回,一个错误反反复复原地踏步。

接下来,是一堆无用的周而复始,最终也没有解决问题。

值得一提的是,通义千问在当前版本中,还存在一个很严重的问题,会死循环,比如:

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

只有用户手动停止才能结束,在编程场景下容易触发这个问题,我个人而已,最近已经触发了十余次。

ChatGPT

最后是ChatGPT。

因为是在未登录状态下开始的提问,所以没有及时的截图,但是可以肯定的是,ChatGPT一开始给的方法,不会出现任何代码上的错误,不会莫名其妙调用一些不存在的方法和属性。

只是获取到的返回值是空,反馈给GPT后,得到如下答案。

一个问题对比通义千问、文心一言、ChatGPT,孰优孰劣 说说我的看法

”一次“成功(实际对话了两次,一次在未登录状态下,一次是登录后)。

总结

这一年来,我对AI的依赖非常大,因为跨语言有着很明显的学习成本,在很久之前,我一直通过PHP开发,近一年开始学习C#和SQL SERVER,如果没有AI的帮助,就国内这些教育机构给的课程,往往会让人陷入误区无法自拔。他们会讲一堆高大上的理念,但是本质原因并不会告知你,让你去定义一堆实际上处于初学者的你而言并不知道的类。到头来发现,定义的那个类,真的有必要吗?

C#我在过去的一段时间,认真跟着好几家机构的课程,完完整整的走了几个。内容真的是大同小异,而且实际上能得到的,都很浅显。他们会花很大的篇幅去讲语法讲类型,我实在很难理解为什么,明明一节课就能讲完的,用户付费后真的要听这些吗,微软官网的文档难道不够详细吗。

所以,我最终选择直接上手干,不懂的就问AI,AI往往都能给出正确的答案,像通义千问,经常会给出好几种方法,这是非常棒的。如果有不理解的,可以截取或者直接问题AI,让AI解释代码的意思,这都是能快速提升巩固学习成果的方法和实践。

就当前情况而已,国内的AI水平仍然有很大的提升空间,不少时候,都只能沦为”人工客服“的角色,特别是文心一言在这个问题上最显著,却还对外收费,发布很多产品。我既能理解,又不理解。

原创文章,作者:蓝洛水深,如若转载,请注明出处:https://blog.lanluo.cn/13184

Like (1)
蓝洛水深的头像蓝洛水深管理员
Previous 2024年10月25日 下午2:21
Next 2024年11月14日 下午9:39

发表回复

Please Login to Comment
联系QQ
联系QQ
SHARE
TOP