1/7生物医学论文摘要都是AI撰写
研发家 | 2025-07-04 33

根据对学术文献的大规模分析,去年发表的大约1/7的生物医学论文摘要可能借助人工智能。(AI)完成写作。2024年,医学数据库PubMed收录的150万篇摘要中,包含大型语言模型的文章超过20万篇(LLM)经常推荐使用词汇。

相关研究于2024年6月以预印本的形式在线公布,预计上半年约1/9的摘要将由AI协助完成。上述最新分析结果将于今年7月2日在《科学进步》中公布。

Andrew,英国伦敦大学学院。 Gray说:“LLM编辑的论文数量一直在不可阻挡地增加。”他认为,研究人员还没有充分认识到这些工具用于产生学术成果的规模。“希望这篇论文能促进人们对这个问题的关注”。

很多团队试图评估LLM对学术输出的影响,但这个过程是相当具有挑战性的,因为大多数用户没有透露这种行为。常见的方法是训练模型来识别人类和LLM生成文本的区别,然后应用于文献评估。但目前还不清楚这类模型如何区分两种文本,训练数据集可能无法反映LLM生成文本的最新趋势。

Dmitry在德国图宾根大学。 Kobak和他的同事采用了更开放的研究方法。在摘要中,他们搜索了2022年11月ChatGPT普及后频率异常上升的“冗余词汇”。

研究发现,2024年出现454个单词的频率比2010年以来的任何一年都要高得多。他们大多是与研究内容无关的“风格词”,主要是动词和形容词。常见词“发现”和“潜力”不仅存在,还存在“探索”和“展示”。Kobak指出,2024年下半年新增的冗余词包括最高级别的形容词,如“显著增强”、“障碍”和“无与伦比”和“极其有用”。

科学词汇的演变是一个长期的过程。2021年有190个“冗余词汇”,其中大部分是与研究内容相关的术语。然而,自LLM普及以来,词汇的变化更加明显,主要体现在风格层面。

另外,在计算科学和生物信息学等领域,LLM辅助撰写了超过1/5的摘要。Kobak说:“今年的整体数据可能会进一步增加,LLM的使用仍在继续增加。AI的实际使用率可能高于最新研究所表明的。

二月份,法国巴黎高等师范学院的Mingmeng Geng和同事在预印平台arXiv发布的一项研究中指出,2024年底“探索”等一些标志性词汇和短语的出现频率有所下降。他认为,这可能是因为相关研究将其标记为“使用AI”,促使作者删除此类词汇,或者调整LLM请求以避免测试。

随着作者策略的不断调整,越来越难以评估AI对学术文献的影响。另一个主要挑战是,包括Kobak团队在内的研究无法确定AI工具的具体使用方法。作者可能会在没有适当监督的情况下生成大段文本,比如润色文本或辅助翻译,或者涉及到更有争议的做法。“真正的科研诚信存在隐患。”Gray说。

赞一个

分享:
打开微信扫一扫
33
版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
更多服务
招商合作
请您完善以下信息,我们会尽快与您联系!
论文投稿
参加会议
合作办会
期刊合作
论文辅导
科研绘图
论文翻译润色
论文查重
其他
提交
专家招募
个人信息
联系信息
提交
在线客服
商务合作
专家招募
常见问题
手机端
扫描二维码
与学术大咖共探知识边界
出版支持
翻译服务
润色服务
自助查重
排版校对