1/7生物医学论文摘要都是AI撰写

研发家 | 2025-07-04 33

根据对学术文献的大规模分析,去年发表的大约1/7的生物医学论文摘要可能借助人工智能。(AI)完成写作。2024年,医学数据库PubMed收录的150万篇摘要中,包含大型语言模型的文章超过20万篇(LLM)经常推荐使用词汇。

相关研究于2024年6月以预印本的形式在线公布,预计上半年约1/9的摘要将由AI协助完成。上述最新分析结果将于今年7月2日在《科学进步》中公布。

Andrew,英国伦敦大学学院。 Gray说:“LLM编辑的论文数量一直在不可阻挡地增加。”他认为,研究人员还没有充分认识到这些工具用于产生学术成果的规模。“希望这篇论文能促进人们对这个问题的关注”。

很多团队试图评估LLM对学术输出的影响,但这个过程是相当具有挑战性的,因为大多数用户没有透露这种行为。常见的方法是训练模型来识别人类和LLM生成文本的区别,然后应用于文献评估。但目前还不清楚这类模型如何区分两种文本,训练数据集可能无法反映LLM生成文本的最新趋势。

Dmitry在德国图宾根大学。 Kobak和他的同事采用了更开放的研究方法。在摘要中,他们搜索了2022年11月ChatGPT普及后频率异常上升的“冗余词汇”。

研究发现,2024年出现454个单词的频率比2010年以来的任何一年都要高得多。他们大多是与研究内容无关的“风格词”,主要是动词和形容词。常见词“发现”和“潜力”不仅存在,还存在“探索”和“展示”。Kobak指出,2024年下半年新增的冗余词包括最高级别的形容词,如“显著增强”、“障碍”和“无与伦比”和“极其有用”。

科学词汇的演变是一个长期的过程。2021年有190个“冗余词汇”,其中大部分是与研究内容相关的术语。然而,自LLM普及以来,词汇的变化更加明显,主要体现在风格层面。

另外,在计算科学和生物信息学等领域,LLM辅助撰写了超过1/5的摘要。Kobak说:“今年的整体数据可能会进一步增加,LLM的使用仍在继续增加。AI的实际使用率可能高于最新研究所表明的。

二月份,法国巴黎高等师范学院的Mingmeng Geng和同事在预印平台arXiv发布的一项研究中指出,2024年底“探索”等一些标志性词汇和短语的出现频率有所下降。他认为,这可能是因为相关研究将其标记为“使用AI”,促使作者删除此类词汇,或者调整LLM请求以避免测试。

随着作者策略的不断调整,越来越难以评估AI对学术文献的影响。另一个主要挑战是,包括Kobak团队在内的研究无法确定AI工具的具体使用方法。作者可能会在没有适当监督的情况下生成大段文本,比如润色文本或辅助翻译,或者涉及到更有争议的做法。“真正的科研诚信存在隐患。”Gray说。

赞一个

分享:
打开微信扫一扫
33
版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
招商合作
请您完善以下信息,我们会尽快与您联系!
论文投稿
参加会议
合作办会
期刊合作
论文辅导
科研绘图
论文翻译润色
论文查重
其他
提交
专家招募
个人信息
联系信息
提交
在线客服
商务合作
专家招募
常见问题
手机端
扫描二维码
与学术大咖共探知识边界
出版无忧
投稿无忧
翻译服务
润色服务
自助查重
排版校对
科研绘图