当前位置：首页 > AI资讯 > 正文内容

ChatGPT论文通过图灵测试：是AI太聪明，还是学界太灌水？

wxianyue10个月前 (06-25)AI资讯322

强大的文本生成能力震惊了世界。它甚至能够进行学术写作，产出的很多文献竟然可以鱼目混珠。这一情况让学术出版行业十分警惕。国际光学和光子学学会(SPIE) 出版总监表示，由于担忧这种“AI论文”的准确性和道德规范，他和其他期刊的管理人员正在致力于保护学术文献这方净土免受AI论文潮的侵蚀。“自去年11 月以来，我们一直在谈论这一切”，说。

在风行全球的时候，多家期刊迅速出台了关于以AI参与研究或论文写作的相关规定。Cell和柳叶刀虽然允许投稿人使用AI工具，但作者不能依赖其完成关键任务——比如解释数据或得出结论，并且作者必须如实声明他们是否以及如何使用了AI工具。

则明确规定：任何大型语言模型工具（如）都不能被列为论文作者；作者如在论文写作中使用过AI工具，则应在论文中明确标明。另一顶级期刊则完全禁止论文使用生成的文本。因为的编辑认为，AI不能对其写作的内容负责。

为什么期刊编辑们对AI论文如此紧张？难道依赖同行评议制度把关论文质量的学术界，难道一篇由AI东拼西凑攒成的文章，竟然有可能突破一个个专业审稿人的图灵测试ChatGPT论文，在学术界大摇大摆地登堂入室？

答案还真不好说。

当全球免费开放后，使用这个AI工具的人堪比过江之鲫，科研工作者也不例外。而不久前的一项研究声称，许多人可能都难以鉴别出AI所写出的学术文献。这项研究由美国西北大学的 Gao等人2022年12月27日发表于预印本平台，题为： by to using an , , and human 。

在这项研究中，研究人员将生成的论文摘要交予审稿人盲审。但审稿人只鉴别出了68%的AI论文，换言之，有近三分之一的论文，他们没能识别出来。这些审稿人表示，要区分两者之间的差别并不容易，虽然仍有一些模糊痕迹可以追寻。

这项研究能得出的结论仍十分有限，但仍然令人十分吃惊，并且造成了一点小尴尬。吃惊的点在于，强大的文本生成能力。尴尬的点在于，同行评议在应对AI赝品时，竟然出乎意料的乏力。这一现象似乎指向两种解释：一是同行评议制度失灵了；二是学界论文同质性太过严重，以至于AI东拼西凑再灌水出一篇，人们也难以鉴别。当然，对于学术界来说，两种解释都不怎么积极。

从根本逻辑上讲，现在的只是个预训练语言模型，它只能从已有的训练样本中提取、整合信息，而不能真正地发展出新的知识。而且期刊编辑们认为，使用AI进行写作，准确性其实并不能得到很好的保证。因为，如果AI没有接触到足够的训练样本以给出恰当答案，那么它通常会自己编造一些信息。2022年11 月，科学家专用的大型语言模型ChatGPT论文，在开放几天之后就匆忙下线，因为它虽然接受了学术文献样本的相关训练，但是事实错误仍然比比皆是。2022 年一项对（由子公司开发的信息检索聊天AI）进行的预印本研究发现，其回复有高达 20% 的比例包含错误。而且，AI会十分偏向于训练样本中包含的科学假设与前提。

除此之外，期刊编辑更担心AI会助长剽窃之风，即使用AI来对论文进行洗稿、降重。这种现象在高校学生群体中尤其猖獗。美国在线课程提供商对100多名教育工作者和1000多名18岁以上的学生进行了问卷调查，结果发现：超过89%的学生使用来帮助完成家庭作业，53%的学生承认曾用它写论过文。网络上甚至诞生了一个新词来指代这种学术不端行为——“”（AI化抄袭）。

正如前文所述，期刊编辑们对这种新式学术不端十分担忧，因此正在积极拟定政策进行应对。而自然而然地，审稿人就会负担起检查或核查作者披露的生成的文本——这些任务会增加本已很繁重的志愿者工作量。 & 的学术道德与诚信主管 Alam表示，随着出版界在处理AI论文方面经验的积累，相应处理政策仍有变化空间。

最后重点推荐当下最新最火的商业模式不管你是想创业找项目的，还是自己开实体门店的，猪小侠是目前市场独一无二的实体门店引流商业模式猪小侠属于消费返现平台，即消费者消费多少就有机会返现多少，通过这种方式促进消费者复购和分享，提升门店的客源猪小侠消费返现模式目前已经获得多家每天报道，是2023年实体门店拓客最佳商业模式更多详细了解点击进去猪小侠全民共享系统