大語言模型中的涌現現象是不是偽科學？

2023-04-21 01:50:16 程序員客棧

Datawhale干貨

作者：平凡@知乎，諾桑比亞大學，在讀博士

(資料圖片僅供參考)

今天晚上，花了一點兒時間看了兩篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

這兩篇講的都是emergent behavior，即涌現現象。

大規模神經網絡下的涌現現象

在機器學習中使用大規模神經網絡時，由于增加了參數數量、訓練數據或訓練步驟等因素，出現了定性上的新能力和性質，這些能力和性質在小規模神經網絡中往往是不存在的。

第一篇文章舉了這個例子，每個圖都可以理解為一個任務，橫軸是神經網絡的規模，而縱軸是準確率，可以理解為模型的性能。

我們拿圖一來看，在10的22次方前，這些模型基本上的性能基本上都很穩定在0附近，而在10的22以后，突然在10的24次方上獲得了很大的性能提升，在其他的幾個任務上都表現出類似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的評論引用在這里：

作者發現，當我們訓練用網絡計算同余加法 a+b = ? (mod c) 時，網絡在某個時間突然獲得了 100% 準確率。分析發現，神經網絡實際上“頓悟”了使用傅立葉變換來計算同余加法！這個算法可以證明是正確的，反人類直覺的。

從這倆例子里面我的感受是，只要數據量足夠且真實，且模型沒有硬錯誤的前提下，不斷的訓練說不定真的能夠產生一些意想不到的效果。

還有就是我覺得人類現在積累的知識并不少，但是系統的少，零星的多，如果類似ChatGPT這樣的大模型可以拿所有的人類已有知識進行不斷學習的話，我覺得有很大概率會讓它涌現出意想不到的能力。

甚至可能把人類的生產力解放提前很多。

參考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

標簽：

精彩推薦

世界觀焦點：智慧醫療”能夠實現醫療管理和服... 2022-12-15 18:29:15
【全球速看料】pr視頻軟件如何學習（pr視頻軟... 2022-12-15 18:29:15
當前時訊：哥倫比亞廣播公司推出幽靈之夏 2022-12-15 18:29:15
環球觀熱點：不愿給電池廠打工多車企投錢自... 2022-12-15 18:29:15
特斯拉新款Model 3實車內飾曝光！兩款車型售價上漲 2023-04-23 09:25:24
網紅“減肥針”不是想打就能打 2023-04-23 08:58:36
每日速看!萬商云集“鏈”全球 2023-04-23 09:18:34
世界熱點！中國援喀麥隆雅溫得醫療分隊舉行義診 2023-04-23 08:53:03
快船主場輸38個罰球，船記：威少籃下17投零罰... 2023-04-23 08:37:01
每日頭條!word裁剪圖片形狀為正五邊形（word裁... 2023-04-23 08:27:09
消息！閑魚上怎么賺錢（閑魚怎么賺錢） 2023-04-23 08:23:02
大姨媽不能碰的12種食物_來大姨媽能吃菠蘿嗎 ... 2023-04-23 08:06:52
追夢解禁后加強與其身體對抗？小薩：不會還... 2023-04-23 07:54:26
第28個世界讀書日｜作為文化富礦的山東，還有... 2023-04-23 07:28:32
牛黃解毒片的功效與作用_牛黃清心丸的功效與作用 2023-04-23 07:07:19
有代溝什么意思_代溝什么意思_世界訊息 2023-04-23 07:07:14
世界微資訊！精選30余款菜肴推薦，時令食材搭... 2023-04-23 06:35:55
模擬經營、現場互動，蘇州市相城區創業培訓班... 2023-04-23 06:13:13
世界消息！車子碰撞保險公司怎么理賠的 2023-04-23 06:13:59
世界頭條：2023五一天津解放橋怎么去？坐地鐵... 2023-04-23 06:05:42
2023天津解放橋開橋時間是幾點到幾點 2023-04-23 06:21:13
每日視點！2023五一假期天津解放橋開橋只有5月... 2023-04-23 06:15:51
2023天津五一海河游船船票開售時間（附購票入... 2023-04-23 06:05:56
法師多肉可以露天養嗎春夏之交帶錦的法師還... 2023-04-23 05:57:59
全球即時看！A股：這輪下跌或會持續很長時間 2023-04-23 06:01:07
塵世羈滄海月明完整版_塵世羈 2023-04-23 05:00:21
【熱聞】4月21號后要準備2644點券？公孫離機甲... 2023-04-23 05:14:23
白鱗鮭魚食譜_新鮮的白鱗鮭魚在哪釣_當前看點 2023-04-23 04:31:05
全球快看：羅伊斯好慘一男的，續約一事懸而未... 2023-04-23 04:37:17
落雁沉魚_關于落雁沉魚的簡介 2023-04-23 03:57:06
世界速讀：無良商人的再度抉擇，預告 2023-04-23 03:44:24
這群學生體驗“農人”生活，在希望的田野耕耘未來 2023-04-23 03:28:18
三朝北盟會編點校本（三朝北盟會編） 2023-04-23 03:08:30
2023上海車展：全新林肯航海家上市 32.88-37.88萬元 2023-04-23 02:53:34

新聞頻道更多

社會頻道更多

財經頻道更多

五月天六月婷婷开心激情,天使的性电影,三级韩国一区久久二区综合,五月婷婷久,九九精品在线视频,66精品综合久久久久久久

大語言模型中的涌現現象是不是偽科學？

大語言模型中的涌現現象是不是偽科學？