[閒聊] 哈利波特成為AI界學習用普世聖經
AI:讚頌萬母之母莉莉絲,智慧之果的恩賜者\[J.K. 羅琳]/。
話說回來如果偷偷換成哈綴本不知道會發生什麼事?
https://technews.tw/2023/12/27/harry-potter-in-ai-researches/
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
作者 林 妤柔 | 發布日期 2023 年 12 月 27 日 12:37
學術界超夯!研究人員最愛用《哈利波特》衡量 AI 技術理解成效
J.K. 羅琳的《哈利波特》在全球造成轟動,現在學術界正使用這套暢銷書來測試生成式AI 系統如何學習和提供資訊。
根據彭博社報導,越來越多研究人員利用《哈利波特》來試驗生成式 AI 技術,因為該系列影響力深遠,書中又有廣泛的語言數據和複雜的文字遊戲。透過回顧《哈利波特》一系列研究和學術論文,能了解 AI 前沿研究,以及該技術面臨的最棘手問題。
最近在論文〈誰是哈利波特?LLMs 近似反學習〉(Who’s Harry Potter? Approximate
Unlearning in LLMs)中揭露大型語言模型(LLM)選擇性遺忘訊息的新技術。由於 AI
聊天機器人建立在大量線上數據上,可能包括受版權保護的資料和有誤內容,導致 AI 公司面臨侵權訴訟或大眾監督問題。
因此這篇論文作者、微軟 Azure 技術長 Mark Russinovich 和 Ronen Eldan 已證明,可對 AI 模型進行修改或編輯,刪除任何有關《哈利波特》一書中存在的知識,包括人物和情節,而不會影響 AI 系統的整體決策和分析能力。
Russinovich 和 Eldan 表示,之所以選擇《哈利波特》是因為他們耳熟能詳。
Russinovich 表示,「研究界會更容易評估我們的技術所產生的模型,並親自確認內容確實已經被『消除學習』」。
另項研究中,西雅圖華盛頓大學、加州大學柏克萊分校和艾倫研究所的研究人員開發新語言模型「Silo」,可刪除數據以降低法律風險。不過他們在稍早發布的論文中提到,如果只在版權過期書籍或政府檔案等低風險文本上進行訓練,模型性能會明顯下降。
為深入研究,研究人員利用《哈利波特》來研究單篇文本是否影響 AI 系統性能。他們創建兩個資料儲存庫,即網站和文檔的集合。第一個資料儲存庫包括除了《哈利波特》第一部以外所有已出版書籍;另個資料庫包括除第二部以外的所有系列書籍,以此類推。
研究人員發現衡量 AI 模型的準確性標準時,當《哈利波特》從資料儲存庫中移除,困惑度會變更加嚴重。
在開放存取的科學研究資料庫 arXiv 上,與《哈利波特》有關的最新論文包括〈霍格華茲魔藥開發的機器學習〉(Machine learning for potion development at Hogwarts)、〈大型語言模型與《哈利波特》的相遇〉(Large Language Models Meet Harry
Potter)和〈用基於 Transformer 模型的人工智慧檢測奇幻文學中的咒語〉(
Detecting Spells in Fantasy Literature with a Transformer Based Artificial
Intelligence)。
AI 研究引用《哈利波特》至少已有十年之久,但隨著學術界和技術專家將重點放在能處理自然語言並給出相關答案的 AI 工具上,情況變得越來越普遍;即使不是研究的核心內容,《哈利波特》也是研究人員最喜歡參考的文學作品。
Researchers Have a Magic Tool to Understand AI: Harry Potter
(首圖來源:pixabay)
--
ai:你再使用禁止字,我就對你索命咒
SJW:你說誰的《哈利波特》
到處都是梅林的鬍子
這些論文標題真的很像哈利裡的書名w
44
[情報] 蘋果會將生成式AI帶入其生態體系嗎?【新聞/情報來源】 原網址: 短網址: 【新聞/情報內容】(國外文章請附上簡單翻譯) 微軟已經宣布與ChatGPT達成協議,將其生成式AI內建到其搜尋引擎Bing中。至於谷歌,38
[情報] 中國推出世界首顆無干涉 AI全自動設計CPU中國推出世界首顆無干涉 AI全自動設計CPU 中科院計算所的處理器晶片全國重點實驗室及其合作單位, 用AI技術設計出了世界上首個無人工干預、全自動生成的CPU晶片——啟蒙1號。 這顆完全由AI設計的32位RISC-V CPU,相比GPT-4目前所能設計的電路規模大4000倍,17
[蒸汽機] 芝加哥大學研究團隊發布防模仿AI模型目前生成式 AI 模型可以學習去模仿特定畫家的繪畫風格6
Re: [新聞] 吳欣盈街頭開講近全台語 群眾喊「you are道 : 2. GDPR 架構上有沒有問題?有。其中一個是因為很多領域如醫療等其實很難訂出全歐 一 : 3. 另根據研究,在 GDPR 實行也對產業產生衝擊,有數據指出有 8% 的利潤損失,其 中?4
[問卦] 選舉到了有沒有什麼AI可以偵測假新聞Fake news detection within online social media using supervised artificial intelligence algorithms Fake News Detection on Social Media Using Machine Learning3
Re: [問卦] AI畫奶的功力怎麼進步這麼快的?AI畫奶的技術是一種基於深度學習和圖像處理技術的應用,隨著機器學習和計算機視覺的 不斷發展,其技術水平也在不斷提高。 在過去的幾年中,AI畫奶技術已經經歷了許多重要的進步,其中包括以下幾點: 數據集的增加:AI算法需要大量的數據來進行訓練和優化, 隨著數據集的增加,AI算法可以更好地理解不同類型的圖像,從而提高奶畫的質量。3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3d
爆
[蔚藍] 四週年生放串 DAY3早場爆
[閒聊] 台漫的問題是畫技還是劇情爆
[閒聊] 美國魔爪告侵權 連寶可夢也不放過92
[刺客] 日本歷史研究員談彌助81
[閒聊] 真三國無雙起源(雷)62
[台漫] 台灣漫畫家拿補助出國去安古蘭漫畫節48
Re: [新聞] 日本Rokudenashi將來台開唱35
Re: [討論] 文化部長:2027年台灣漫畫超車日韓37
[妮姬] 海倫寶是愛我的!35
[閒聊] Bookwalker FB35
[閒聊] 最想當女友的Hololive成員(JP)35
[NS2] 任天堂2022專利與NS2的猜測32
[閒聊] 漫威爭鋒TwitchRivals賽事炎上28
[蔚藍] 哇幹 雪老師的莉央25
[閒聊] 優秀的台灣漫畫作者推薦名單24
[閒聊] 《你的名字。 》DVD 即日起開始預購25
[蔚藍] 甜點貓ASMR感想24
[真愛] 賢狼赫蘿22
[東方] ....想看肚子嗎?21
[母雞] 祥子討厭爽世嗎?22
[閒聊] 各位覺得動畫成本什麼時候會被AI衝擊?21
Re: [討論] 台灣是不是先從小說開始扶持再來想其他21
[閒聊] 今天的迷路小孩怎麼特別多21
[閒聊] 我獨自升級 第一季那個治療師沒戲份了嗎20
[妮姬] 要給這一季的角色珍藏品嗎?18
[閒聊] 露西亞的粉屍的詛咒19
[閒聊] 過年有設定什麼目標嗎?18
[母雞] 初華為何沒背吉他18
[母雞] 睦頭人算是在「不該沈默時沈默」嗎?18
[閒聊] 突然想到讓彌助當武士的一個問題..