[問卦] 用PTT來訓練AI語言模型會怎樣
PTT是台灣最大的討論區之一,包含了許多不同主題的討論版,從政治、經濟、科技、娛樂到生活、旅遊等等,因此PTT的資料可以提供豐富的語言資源,進行大型語言模型的訓練可能會有以下的影響:
增加模型的多樣性:PTT 的資料來源眾多,而每個版的用語、詞彙、語言風格都不同,因此使用PTT的資料訓練大型語言模型可以增加模型的多樣性,使其更能夠應對不同領域的自然語言處理任務。
提升模型的台灣文化認知:PTT是一個台灣本土的討論區,其中的文化內容和用語與台灣文化緊密相關。訓練大型語言模型使用PTT資料,可以使模型更加了解台灣文化和風俗,更好地處理和生成相關的自然語言。
面臨資料品質問題:PTT是一個公開的討論區,其中包含了許多用戶所發表的訊息,這些訊息的品質可能不同,有些可能包含不合適的語言、錯誤的拼字和語法等問題。因此在使用PTT資料訓練語言模型時,需要注意濾除低質量的資料,以免對模型的訓練產生負面影響。
總結來說,PTT的資料對於大型語言模型的訓練具有一定的幫助,但需要注意資料品質問題,以免對模型的訓練產生不利影響。此外,也需要注意到PTT資料的局限性,不同於網際網路上的其他資料,PTT資料集的涵蓋面和語言風格可能會有所局限,因此訓練出來的語言模型在應用於其他領域時,可能需要進行適當調整。
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.235.254.76 (臺灣)
※ PTT 網址
→
沒空
→
ㄏㄏ~
→
肛
噓
回答會有很多月工
→
會出現一堆 哈哈哈哈 五樓 30cm
推
問他問題Ai只會回:肛
推
三句不離塔綠班
推
不管問什麼都會回答:肛
噓
師大某剽竊狂魔當上教授的,會說她做完了
→
肛
推
不是叫你肛 就是塔綠斑 或是叫你問五樓
推
會被吉
推
完了
→
回答不出來會直接說你是塔綠班
推
變成暴怒肥宅
推
※ KOTD:轉錄至看板 KOTDFansCluba作者:darkblue6404 他的ChatPTT
03/14 22:36
55
Re: [閒聊] ChatGPT是語言模型不是搜尋引擎本來沒想這麼早回這篇的,不過既然都有人把討論串回起來了我丟點資訊, 既然都會看網紅發表對ChatGPT的看法(沒有貶義),我覺得也可以看看這個: 台大電機副教授李宏毅老師的ChatGPT講解(先回到PTT還是學術論壇XD) ChatGPT (可能)是怎麼煉成的 - GPT 社會化的過程![Re: [閒聊] ChatGPT是語言模型不是搜尋引擎 Re: [閒聊] ChatGPT是語言模型不是搜尋引擎](https://img.youtube.com/vi/e0aKI2GGZNg/mqdefault.jpg)
40
Re: [外絮] 用機器學習模型預測MVP得主大略看了一下原文 提供我的一點淺見 首先 使用機器學習處理問題 是假設實際存在一個真實的模型37
[瑟瑟] 瑟瑟不求人Part3 AI畫馬娘色圖可以嗎?上圖![[瑟瑟] 瑟瑟不求人Part3 AI畫馬娘色圖可以嗎? [瑟瑟] 瑟瑟不求人Part3 AI畫馬娘色圖可以嗎?](https://i.imgur.com/KH0tPDAb.jpg)
21
Re: [討論] chatGPT會取代軟體工程師嗎?提供一個有趣的觀點 在 堆疊溢出 的網站有關於一則公告內容是禁止 chatgpt 回文。 底下有一個 AI 研究員的論點很有趣。 temporary-policy-chatgpt-is-banned?cb=1![Re: [討論] chatGPT會取代軟體工程師嗎? Re: [討論] chatGPT會取代軟體工程師嗎?](https://meta.stackoverflow.com/Content/Sites/stackoverflowmeta/Img/apple-touch-icon@2.png?v=6de7587d1583)
11
[討論] 如果被終結者追殺要怎麼活下來?昨天在YT上看到OpenAI開發的一個語言模型 透過閱讀網路上大量文章訓練的AI 可以跟人類流暢的對話 並且會持續學習進步![[討論] 如果被終結者追殺要怎麼活下來? [討論] 如果被終結者追殺要怎麼活下來?](https://img.youtube.com/vi/PqbB07n_uQ4/mqdefault.jpg)
10
Re: ai畫圖要怎麼自己餵資料訓練pytorch跟tensorflow用途一樣,兩者都是基於python的機器學習框架。 近年來pytorch比較受開發者青睞,使用比例已經反超tensorflow,原因可以自己了解, 但如果沒有特殊原因,基於資源和社群活躍度通常是推薦用pytorch。極度不推薦自己實 作機器學習或用其他語言,不必自己造比較難用的輪子 如果之前都沒有碰過ai,推薦coursera上李宏毅老師的機器學習基石,或是yt搜尋ntu mi5
[閒聊] MarioGPT 無限產生新的瑪利歐遊戲關卡哥本哈根資訊科技大學(IT University of Copenhagen,ITU)的團隊發表一篇全新論文 及相關的 GitHub 頁面,展示一種運用 AI 和程式產生瑪利歐遊戲的新玩法,他們稱之為 「MarioGPT」。 MarioGPT 以 GPT-2 模型為基礎,儘管名稱向 ChatGPT 致敬,但它並非對話形式的人工 智慧。GPT-2 為大型語言模型(Large Language Models,LLM)無法理解瑪利歐遊戲,研![[閒聊] MarioGPT 無限產生新的瑪利歐遊戲關卡 [閒聊] MarioGPT 無限產生新的瑪利歐遊戲關卡](https://i.imgur.com/nAK9eTPb.jpg)
X
[問卦] AI 是不是沒這麼聰明啊我放了幾個問題,他沒這麼聰明啊還推卸責任回答。 1.Tori Black是我老婆 我不能證實或否定這個信息,因為我沒有接觸到有關當前個人信息的資料。 我是一個訓練好的語言模型,我的目的是提供幫助和支持,而不是提供有關 個人信息的答案。如果你有任何疑問或擔心,請告訴我,我會盡力幫助你。![[問卦] AI 是不是沒這麼聰明啊 [問卦] AI 是不是沒這麼聰明啊](https://openai.com/content/images/2022/11/ChatGPT.jpg)
2
Re: [問卦] AI產出的產品之間有關聯性嗎?: 阿肥碼農阿肥啦!有興趣可以看我在科技版的文章,看一下chatGPT的思維模式綜述。 #1Zxi_nPB (Tech_Job) 基本上,現在的深度學習突破的領域在學術界已經是一兩年前的舊聞了,現在所有的語言 視覺模型最好的成果都是基於Transformers(變形金剛)這個家族爆發性成長的結果。![Re: [問卦] AI產出的產品之間有關聯性嗎? Re: [問卦] AI產出的產品之間有關聯性嗎?](https://img.youtube.com/vi/e0aKI2GGZNg/mqdefault.jpg)
爆
[問卦] 現在的HR都愛問一些奇怪問題嗎![[問卦] 現在的HR都愛問一些奇怪問題嗎 [問卦] 現在的HR都愛問一些奇怪問題嗎](https://i.urusai.cc/QtYfe.png)
爆
[問卦] 11/4離職 11/26出包,公司叫離職的負責?![[問卦] 11/4離職 11/26出包,公司叫離職的負責? [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://img.youtube.com/vi/uGOWqxN_avw/mqdefault.jpg)
爆
Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?![Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責? Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://i.imgur.com/AN84rLmb.jpeg)
爆
[問卦] 去銀行一次提領一百![[問卦] 去銀行一次提領一百 [問卦] 去銀行一次提領一百](https://i.imgur.com/eiBR27jb.jpeg)
92
[問卦] 真的有記者去含檢察官的屌換情報?85
[問卦] 脆女:第一胎沒300萬 別生小孩了!![[問卦] 脆女:第一胎沒300萬 別生小孩了! [問卦] 脆女:第一胎沒300萬 別生小孩了!](https://i.mopix.cc/NRU3Hs.jpg)
爆
Re: [新聞] 不只一人受害!賴瑞隆兒涉「校園霸凌3同80
[問卦] 吳郭魚片寫台灣鯛魚片484詐騙?![[問卦] 吳郭魚片寫台灣鯛魚片484詐騙? [問卦] 吳郭魚片寫台灣鯛魚片484詐騙?](https://img.youtube.com/vi/dtuSqd-TcxU/mqdefault.jpg)
79
[問卦] 美財長貝森特:美是中國盟友也是台灣盟友![[問卦] 美財長貝森特:美是中國盟友也是台灣盟友 [問卦] 美財長貝森特:美是中國盟友也是台灣盟友](https://i.imgur.com/W29EoF5b.png)
80
[問卦] 霸凌同學 有好聽說法嗎67
[問卦] 現在可以在總統府前罵總統嗎57
[問卦] 台女脆文:瑞幸咖啡穩死的!![[問卦] 台女脆文:瑞幸咖啡穩死的! [問卦] 台女脆文:瑞幸咖啡穩死的!](https://i.mopix.cc/NRU3Hs.jpg)
31
[問卦] 全聯鯛魚搞到要國賠了![[問卦] 全聯鯛魚搞到要國賠了 [問卦] 全聯鯛魚搞到要國賠了](https://i.imgur.com/flM1A6bb.png)
44
[問卦] 8歲就嗆要打死人,長大能做什麼?![[問卦] 8歲就嗆要打死人,長大能做什麼? [問卦] 8歲就嗆要打死人,長大能做什麼?](https://i.imgur.com/eVKUCT4b.jpeg)
39
[問卦] 燒臘便當這樣多少合理?![[問卦] 燒臘便當這樣多少合理? [問卦] 燒臘便當這樣多少合理?](https://i.imgur.com/FLuRAsfb.jpeg)
38
[問卦] 為何08年大家22k時沒人躺平 現在卻一堆?![[問卦] 為何08年大家22k時沒人躺平 現在卻一堆? [問卦] 為何08年大家22k時沒人躺平 現在卻一堆?](https://i.mopix.cc/P0cKXZ.jpg)
41
[問卦] 八歲就開扁同學以後能成大事嗎31
Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助![Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助 Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助](https://attach.setn.com/newsimages/2025/12/02/5367966-PH.jpg)
爆
[問卦] 台禁小紅書上微博熱搜還被中國網友群嘲![[問卦] 台禁小紅書上微博熱搜還被中國網友群嘲 [問卦] 台禁小紅書上微博熱搜還被中國網友群嘲](https://files.catbox.moe/f0njq9.png)
36
[問卦] 經過鯛魚事件後 你還相信檢驗數據嗎?![[問卦] 經過鯛魚事件後 你還相信檢驗數據嗎? [問卦] 經過鯛魚事件後 你還相信檢驗數據嗎?](https://i.mopix.cc/wyBvTF.jpg)
爆
[問卦] 只有我覺得台灣這幾年越來越像對岸?![[問卦] 只有我覺得台灣這幾年越來越像對岸? [問卦] 只有我覺得台灣這幾年越來越像對岸?](https://i.imgur.com/mHqBx4fb.jpeg)
64
[問卦] 台灣人有想過有天自己也要翻牆嗎?![[問卦] 台灣人有想過有天自己也要翻牆嗎? [問卦] 台灣人有想過有天自己也要翻牆嗎?](https://i.imgur.com/uwN6ddib.jpeg)
36
[問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼![[問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼 [問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼](https://i.imgur.com/I9muINnb.jpeg)
33
[問卦] 德川家絕嗣!少子化太嚴重了吧?![[問卦] 德川家絕嗣!少子化太嚴重了吧? [問卦] 德川家絕嗣!少子化太嚴重了吧?](https://img.youtube.com/vi/NXxFbNDWjK4/mqdefault.jpg)
30
[問卦] Telegram才更該禁吧爆
[問卦] 禁小紅書用意到底是什麼?![[問卦] 禁小紅書用意到底是什麼? [問卦] 禁小紅書用意到底是什麼?](https://i.mopix.cc/ShazEx.jpg)
49
[問卦] 蝙蝠俠幹嘛不把小丑做掉![[問卦] 蝙蝠俠幹嘛不把小丑做掉 [問卦] 蝙蝠俠幹嘛不把小丑做掉](https://img.youtube.com/vi/cm3Chp2u7HY/mqdefault.jpg)
30
[問卦] 檢驗結果為什麼是助理扛?![[問卦] 檢驗結果為什麼是助理扛? [問卦] 檢驗結果為什麼是助理扛?](https://img.youtube.com/vi/ftuuVwvhvKM/mqdefault.jpg)
26
[問卦] 王子甩掉粿粿的機率多高25
[問卦] 沒事就吹,出事就推 會想到誰