[閒聊] 哈利波特成為AI界學習用普世聖經
AI:讚頌萬母之母莉莉絲,智慧之果的恩賜者\[J.K. 羅琳]/。
話說回來如果偷偷換成哈綴本不知道會發生什麼事?
https://technews.tw/2023/12/27/harry-potter-in-ai-researches/
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
作者 林 妤柔 | 發布日期 2023 年 12 月 27 日 12:37
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
J.K. 羅琳的《哈利波特》在全球造成轟動,現在學術界正使用這套暢銷書來測試生成式AI 系統如何學習和提供資訊。
根據彭博社報導,越來越多研究人員利用《哈利波特》來試驗生成式 AI 技術,因為該系列影響力深遠,書中又有廣泛的語言數據和複雜的文字遊戲。透過回顧《哈利波特》一系列研究和學術論文,能了解 AI 前沿研究,以及該技術面臨的最棘手問題。
最近在論文〈誰是哈利波特?LLMs 近似反學習〉(Who’s Harry Potter? Approximate
Unlearning in LLMs)中揭露大型語言模型(LLM)選擇性遺忘訊息的新技術。由於 AI
聊天機器人建立在大量線上數據上,可能包括受版權保護的資料和有誤內容,導致 AI 公司面臨侵權訴訟或大眾監督問題。
因此這篇論文作者、微軟 Azure 技術長 Mark Russinovich 和 Ronen Eldan 已證明,可對 AI 模型進行修改或編輯,刪除任何有關《哈利波特》一書中存在的知識,包括人物和情節,而不會影響 AI 系統的整體決策和分析能力。
Russinovich 和 Eldan 表示,之所以選擇《哈利波特》是因為他們耳熟能詳。
Russinovich 表示,「研究界會更容易評估我們的技術所產生的模型,並親自確認內容確實已經被『消除學習』」。
另項研究中,西雅圖華盛頓大學、加州大學柏克萊分校和艾倫研究所的研究人員開發新語言模型「Silo」,可刪除數據以降低法律風險。不過他們在稍早發布的論文中提到,如果只在版權過期書籍或政府檔案等低風險文本上進行訓練,模型性能會明顯下降。
為深入研究,研究人員利用《哈利波特》來研究單篇文本是否影響 AI 系統性能。他們創建兩個資料儲存庫,即網站和文檔的集合。第一個資料儲存庫包括除了《哈利波特》第一部以外所有已出版書籍;另個資料庫包括除第二部以外的所有系列書籍,以此類推。
研究人員發現衡量 AI 模型的準確性標準時,當《哈利波特》從資料儲存庫中移除,困惑度會變更加嚴重。
在開放存取的科學研究資料庫 arXiv 上,與《哈利波特》有關的最新論文包括〈霍格華茲魔藥開發的機器學習〉(Machine learning for potion development at Hogwarts)、〈大型語言模型與《哈利波特》的相遇〉(Large Language Models Meet Harry
Potter)和〈用基於 Transformer 模型的人工智慧檢測奇幻文學中的咒語〉(
Detecting Spells in Fantasy Literature with a Transformer Based Artificial
Intelligence)。
AI 研究引用《哈利波特》至少已有十年之久,但隨著學術界和技術專家將重點放在能處理自然語言並給出相關答案的 AI 工具上,情況變得越來越普遍;即使不是研究的核心內容,《哈利波特》也是研究人員最喜歡參考的文學作品。
Researchers Have a Magic Tool to Understand AI: Harry Potter
(首圖來源:pixabay)
--
ai:你再使用禁止字,我就對你索命咒
SJW:你說誰的《哈利波特》
到處都是梅林的鬍子
這些論文標題真的很像哈利裡的書名w
44
[情報] 蘋果會將生成式AI帶入其生態體系嗎?【新聞/情報來源】 原網址: 短網址: 【新聞/情報內容】(國外文章請附上簡單翻譯) 微軟已經宣布與ChatGPT達成協議,將其生成式AI內建到其搜尋引擎Bing中。至於谷歌,38
[情報] 中國推出世界首顆無干涉 AI全自動設計CPU中國推出世界首顆無干涉 AI全自動設計CPU 中科院計算所的處理器晶片全國重點實驗室及其合作單位, 用AI技術設計出了世界上首個無人工干預、全自動生成的CPU晶片——啟蒙1號。 這顆完全由AI設計的32位RISC-V CPU,相比GPT-4目前所能設計的電路規模大4000倍,17
[蒸汽機] 芝加哥大學研究團隊發布防模仿AI模型目前生成式 AI 模型可以學習去模仿特定畫家的繪畫風格6
Re: [新聞] 吳欣盈街頭開講近全台語 群眾喊「you are道 : 2. GDPR 架構上有沒有問題?有。其中一個是因為很多領域如醫療等其實很難訂出全歐 一 : 3. 另根據研究,在 GDPR 實行也對產業產生衝擊,有數據指出有 8% 的利潤損失,其 中?4
[問卦] 選舉到了有沒有什麼AI可以偵測假新聞Fake news detection within online social media using supervised artificial intelligence algorithms Fake News Detection on Social Media Using Machine Learning3
Re: [問卦] AI畫奶的功力怎麼進步這麼快的?AI畫奶的技術是一種基於深度學習和圖像處理技術的應用,隨著機器學習和計算機視覺的 不斷發展,其技術水平也在不斷提高。 在過去的幾年中,AI畫奶技術已經經歷了許多重要的進步,其中包括以下幾點: 數據集的增加:AI算法需要大量的數據來進行訓練和優化, 隨著數據集的增加,AI算法可以更好地理解不同類型的圖像,從而提高奶畫的質量。3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3d
爆
[閒聊] 果然冷氣就是要大力吹下去對吧?爆
Re: [情報] 日經:角川已繳贖金但資料依然無法復原95
[閒聊] 活俠傳 0705更新內容82
[24夏] B站為何要剪掉艾莉同學穿襪子的畫面?92
Re: [閒聊] Mygo有沒有可能跟GBC棘團對邦啊86
[情報] 原神歷練點可以累積使用82
[SF6] 人鬼師徒 VS G-STAR Gaming 台日交流賽71
[活俠] 大家的趙活練到最後是不是都在練劍啊65
[原神] 策畫:新深淵聽到大家的意見了,修改中爆
[推投] 活俠三個結緣+飛俠60
[情報] 石油杯獎杯介紹,輸家真慘55
[閒聊] 都2024年了為什麼FGO還做不出Auto57
[原神] 今天4.8前瞻會不會翻盤64
[閒聊] 話說,減肥減到90公斤以下很難嗎?56
[閒聊] 活俠的全真教待遇很好吧52
[閒聊] 哪一款手遊的每日最值得稱許51
[鬼滅] 義勇這時候在想什麼51
[光速] 光速蒙面俠 21 37位漫畫家賀圖53
Re: [情報] 日經:角川已繳贖金但資料依然無法復原44
[閒聊] 活俠傳拯救全女主47
[活俠] 狗勾居然是……的喔(解包雷)28
[Holo] 幹你娘 限重90公斤是要逼死人嗎48
[問題] 絕區零怎麼還沒有送石?47
[戴森]擔心到了這個年紀女兒的交友關係43
[閒聊] 原神怎麼了?44
[閒聊] Hololive跟Vshojo的攤位很熱鬧43
[原神]納塔新角色37
[Vtub] HoloEN 性感排名37
[活俠] 夏侯蘭配合度蠻高的吧35
Re: [閒聊] MyGO vs GBC 為啥都看衰買夠= =