[閒聊] 哈利波特成為AI界學習用普世聖經
AI:讚頌萬母之母莉莉絲,智慧之果的恩賜者\[J.K. 羅琳]/。
話說回來如果偷偷換成哈綴本不知道會發生什麼事?
https://technews.tw/2023/12/27/harry-potter-in-ai-researches/
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
作者 林 妤柔 | 發布日期 2023 年 12 月 27 日 12:37
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
J.K. 羅琳的《哈利波特》在全球造成轟動,現在學術界正使用這套暢銷書來測試生成式AI 系統如何學習和提供資訊。
根據彭博社報導,越來越多研究人員利用《哈利波特》來試驗生成式 AI 技術,因為該系列影響力深遠,書中又有廣泛的語言數據和複雜的文字遊戲。透過回顧《哈利波特》一系列研究和學術論文,能了解 AI 前沿研究,以及該技術面臨的最棘手問題。
最近在論文〈誰是哈利波特?LLMs 近似反學習〉(Who’s Harry Potter? Approximate
Unlearning in LLMs)中揭露大型語言模型(LLM)選擇性遺忘訊息的新技術。由於 AI
聊天機器人建立在大量線上數據上,可能包括受版權保護的資料和有誤內容,導致 AI 公司面臨侵權訴訟或大眾監督問題。
因此這篇論文作者、微軟 Azure 技術長 Mark Russinovich 和 Ronen Eldan 已證明,可對 AI 模型進行修改或編輯,刪除任何有關《哈利波特》一書中存在的知識,包括人物和情節,而不會影響 AI 系統的整體決策和分析能力。
Russinovich 和 Eldan 表示,之所以選擇《哈利波特》是因為他們耳熟能詳。
Russinovich 表示,「研究界會更容易評估我們的技術所產生的模型,並親自確認內容確實已經被『消除學習』」。
另項研究中,西雅圖華盛頓大學、加州大學柏克萊分校和艾倫研究所的研究人員開發新語言模型「Silo」,可刪除數據以降低法律風險。不過他們在稍早發布的論文中提到,如果只在版權過期書籍或政府檔案等低風險文本上進行訓練,模型性能會明顯下降。
為深入研究,研究人員利用《哈利波特》來研究單篇文本是否影響 AI 系統性能。他們創建兩個資料儲存庫,即網站和文檔的集合。第一個資料儲存庫包括除了《哈利波特》第一部以外所有已出版書籍;另個資料庫包括除第二部以外的所有系列書籍,以此類推。
研究人員發現衡量 AI 模型的準確性標準時,當《哈利波特》從資料儲存庫中移除,困惑度會變更加嚴重。
在開放存取的科學研究資料庫 arXiv 上,與《哈利波特》有關的最新論文包括〈霍格華茲魔藥開發的機器學習〉(Machine learning for potion development at Hogwarts)、〈大型語言模型與《哈利波特》的相遇〉(Large Language Models Meet Harry
Potter)和〈用基於 Transformer 模型的人工智慧檢測奇幻文學中的咒語〉(
Detecting Spells in Fantasy Literature with a Transformer Based Artificial
Intelligence)。
AI 研究引用《哈利波特》至少已有十年之久,但隨著學術界和技術專家將重點放在能處理自然語言並給出相關答案的 AI 工具上,情況變得越來越普遍;即使不是研究的核心內容,《哈利波特》也是研究人員最喜歡參考的文學作品。
Researchers Have a Magic Tool to Understand AI: Harry Potter
(首圖來源:pixabay)
--
ai:你再使用禁止字,我就對你索命咒
SJW:你說誰的《哈利波特》
到處都是梅林的鬍子
這些論文標題真的很像哈利裡的書名w
44
[情報] 蘋果會將生成式AI帶入其生態體系嗎?【新聞/情報來源】 原網址: 短網址: 【新聞/情報內容】(國外文章請附上簡單翻譯) 微軟已經宣布與ChatGPT達成協議,將其生成式AI內建到其搜尋引擎Bing中。至於谷歌,38
[情報] 中國推出世界首顆無干涉 AI全自動設計CPU中國推出世界首顆無干涉 AI全自動設計CPU 中科院計算所的處理器晶片全國重點實驗室及其合作單位, 用AI技術設計出了世界上首個無人工干預、全自動生成的CPU晶片——啟蒙1號。 這顆完全由AI設計的32位RISC-V CPU,相比GPT-4目前所能設計的電路規模大4000倍,17
[蒸汽機] 芝加哥大學研究團隊發布防模仿AI模型目前生成式 AI 模型可以學習去模仿特定畫家的繪畫風格6
Re: [新聞] 吳欣盈街頭開講近全台語 群眾喊「you are道 : 2. GDPR 架構上有沒有問題?有。其中一個是因為很多領域如醫療等其實很難訂出全歐 一 : 3. 另根據研究,在 GDPR 實行也對產業產生衝擊,有數據指出有 8% 的利潤損失,其 中?4
[問卦] 選舉到了有沒有什麼AI可以偵測假新聞Fake news detection within online social media using supervised artificial intelligence algorithms Fake News Detection on Social Media Using Machine Learning3
Re: [問卦] AI畫奶的功力怎麼進步這麼快的?AI畫奶的技術是一種基於深度學習和圖像處理技術的應用,隨著機器學習和計算機視覺的 不斷發展,其技術水平也在不斷提高。 在過去的幾年中,AI畫奶技術已經經歷了許多重要的進步,其中包括以下幾點: 數據集的增加:AI算法需要大量的數據來進行訓練和優化, 隨著數據集的增加,AI算法可以更好地理解不同類型的圖像,從而提高奶畫的質量。3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3d
爆
[情報] 星街 日本武道館 Live開催決定爆
[推投] 偶像大師本家765 最喜歡女角「2票」爆
[Vtub] 星街すいせい武道館開催決定89
Re: [閒聊] 知名實況主 Asmongold 因歧視炎上中86
[討論] 鬼滅柱展失控的中國轉賣亂象84
[慶生] 今天是高捷少女司機員 艾米莉亞的生日!50
[情報] 我推完結後赤坂萬字訪談懶人包67
Re: [閒聊] FF16,pc版本只賣出28.9萬份65
[閒聊] 我想成為影之強者 動畫瘋破千萬觀看28
[閒聊] 橫槍老師是否開始和赤坂有嫌隙了?38
[閒聊] 鬼滅咒術我推要怎麼排名47
[閒聊] 陰陽眼見子 防AI水印(慎入)45
[Holo] 星街彗星Live新衣裝大家給幾分46
[鳴潮] 椿第一波營收41
[閒聊] 現在的你,收到PSP還會開心嗎?83
[問題] 二手書店的漫畫能收嗎?43
Re: [Vtub] 虎鯨出道爭議有比F團隊長嚴重嗎?41
[閒聊] 烙印最後用握手和好結局可嗎?爆
[閒聊] FF16,pc版本只賣出28.9萬份35
[閒聊] 是誰造就了我推的出圈38
[情報] Metal Build 鋼彈00Q全刃式 新裝備爆
[推投] 請問你是電腦派或是主機派?37
[閒聊] 亂馬1/2的看板娘是女亂馬還是珊璞☺35
[閒聊] PTCGP歐了一次32
[閒聊] 戰敗逃跑的魔法少女28
[鳴潮] 小保都不歪有多猛31
[情報] 天穗之咲稻姬 新情報預告31
[魔物] 都是獵人,不要分的那麼細30
[奶子] 隱巨乳29
Re: [閒聊] 我想成為影之強者 動畫瘋破千萬觀看