您的当前位置:首页 > 百科 > 用AI數據訓練AI效果怎樣?國際最新研究稱可能最終導致崩潰 這個概念稱為「模型崩潰」 正文
时间:2025-02-22 12:01:22 来源:网络整理 编辑:百科
國際學術期刊《自然》最新發表一篇計算機科學論文指出,用人工智能(AI)生成的數據集訓練未來幾代機器學習模型可能會污染它們的輸出,這個概念稱為「模型崩潰」。該研究顯示,原始內容會在AI數代內變成不相關的
國際學術期刊《自然》最新發表一篇計算機科學論文指出,用A研究用人工智能(AI)生成的據訓數據集訓練未來幾代機器學習模型可能會污染它們的輸出,這個概念稱為「模型崩潰」。果樣國際
該研究顯示,最新終導致崩原始內容會在AI數代內變成不相關的用A研究胡言亂語,顯示出使用可靠數據訓練AI模型的據訓重要性。
生成式AI工具越來越受歡迎,果樣國際如大語言模型等,最新終導致崩這類工具主要用人類生成的用A研究輸入進行訓練。不過,據訓隨着這些AI模型在互聯網不斷壯大,果樣國際計算機生成內容可能會以遞歸循環的最新終導致崩形式被用於訓練其他AI模型或其自身。
論文第一作者兼共同通訊作者、用A研究英國牛津大學Ilia Shumailov和同事及合作者一起,據訓用數學模型演示了AI模型可能會如何出現模型崩潰。果樣國際他們證明了一個AI可能會忽略訓練數據中的某些輸出(如不太常見的文本),導致其只用一部分數據集來自我訓練。
隨後,論文作者還研究了AI模型會如何應對主要用人工智能生成的訓練數據集。他們發現,給模型輸入AI生成的數據會減弱今後幾代模型的學習能力,最終導致模型崩潰。他們測試的幾乎所有遞歸訓練語言模型都容易出現重複短語。比如,一個用中世紀建築文本作為原始輸入的測試到第九代的輸出已經是一串野兔的名字。
論文作者指出,為了讓人工智能成功使用其自身輸出進行訓練,本次研究認為用AI生成數據訓練一個模型並非不可能,但必須對數據進行嚴格過濾。與此同時,依賴人類生成內容的科技公司或許能比競爭對手訓練出更高效的AI模型。
(來源:中國新聞網)
責任編輯: 宋得書再等两周!NVIDIA官宣:RTX 50系列笔记本2月25日开始预订2025-02-22 11:30
欧美服PS PLus十月会免公布:《死亡空间》领衔2025-02-22 11:12
《Forge of the Fae》众筹开启 凯尔特神话复古日式RPG2025-02-22 11:03
制作人揭示放弃林克作为《塞尔达传说:智慧的再现》主角的缘由2025-02-22 10:54
超频340MHz轻轻松松!耕升RTX 5080追风OC评测:超频后性能追平RTX 4090D2025-02-22 10:41
《Wittle Mistakes》Steam上线 高能婴儿动作闯关2025-02-22 10:02
1200W峰值功率!RTX 5090显卡可能上双16针供电2025-02-22 09:56
前测试人员称《光环:无限》问题频发是微软的锅2025-02-22 09:41
亚马逊宣布为任天堂Switch 2开发游戏 愿意多等1年2025-02-22 09:32
《地平线:零之曙光 重制版》PC版仍然捆绑PSN账户2025-02-22 09:29
脑机接口试验再突破 马斯克预测10年内数百万人使用2025-02-22 11:24
《崩坏:星穹铁道》走近星穹——「灵砂:去哪里买能闻到香味的手机?」2025-02-22 11:24
开电车耍沙漠太好玩了!极氪001成功直拔40层楼高深坑2025-02-22 10:46
《Wittle Mistakes》Steam上线 高能婴儿动作闯关2025-02-22 10:31
再等两周!NVIDIA官宣:RTX 50系列笔记本2月25日开始预订2025-02-22 10:26
钉钉鸿蒙版宣布开放测试!10月8日随HarmonyOS NEXT公测2025-02-22 10:15
KK官方对战平台《无尽对决》震撼上线:PVPVE策略对抗新纪元2025-02-22 10:04
我国将在月球上建无线网 正在研究能不能种菜2025-02-22 09:42
2024年暑期档电影票房破110亿!《抓娃娃》遥遥领先2025-02-22 09:30
生存恐怖合作新游《永恒寒冬》现已上线Steam和Epic商店 支持中文2025-02-22 09:16