[問卦] 台灣本土化LLM是不是騙局??
完整的LLM訓練成本極高
可能一次就要兩百萬美金
如果本土化LLM因預算限制只進行fine tune調整
因為pre trained內容以英文為主
處理中文效率差很多
(例如內建的標準tokenizer就很少有中文字)
如果要從源頭改善 就得花費大量的資源重新調整
一個機會是使用中國pre-train的模型
但是這會產生中國詞彙或回答的政治問題
去中又不大量金額投資的前題
本土化LLM是不是騙局?
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.230.78.102 (臺灣)
※ PTT 網址
52
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套小弟待的公司,非學術單位, 可能是台灣硬體計算資源稍微豐富的公司。 公司投入在買GPU 應該近億了。 自己也研究了幾個月 fine-tune 方法。 不過,還是沒足夠能力與資源訓練正常的LLM。22
Re: [爆卦] 中央研究院詞庫小組大型語言模型看到這篇真的龜懶趴火 語氣還真的他媽的大啊 敢嗆鄉民去上LLM課程啊 誰不知道LLM的正確率一定會有誤差? 現在的問題是我國最高學術研究機構中央研究院直接拿對岸LLM套 且直接用opencc大量將簡體資料轉繁體資料!20
Re: [討論] ChatGPT的思維是甚麼?阿肥外商碼農阿肥啦! 剛好看到這篇文章就回覆一下,這次大型語言模型(LLM)表現出來的是語言模型的湧現能 力,我其實不贊同LeCun說的LLM是歪路,畢竟雖然我們可以直覺知道加大網路連接數可能 是實踐人類大腦的一個重要步驟(畢竟人腦的連結數量跟複雜性在生物醫學上都有驗證), 但科學上不去驗證你沒辦法證明某些事情的。X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。5
Re: [新聞]剖析中研院大型語言模型事件的衝擊先說結論: 發展本土化,繁體中文LLM模型,然後期待這個模型能讓大家使用,根本是錯誤方向。不知道這些專家學者,是在騙經費,還是還沒想清楚產業到底缺什麼。 --- 如果今天你使用Google搜尋,搜到"台灣是中國的",或任何有政治偏見的相關文章。 你會不會覺得Google很爛?- 中國做的工程都是這樣啊 美國是把零做到一 中國把一做到二 然後美國出了個十直接屌打 ChatGPT就是這個例子 美國AI本質是科學 中國AI本質是工程
3
Re: [問卦] ChatGpt為什麼開始變笨了?正好半夜看到這篇無聊來回一下 GPT4能力下降大概5月多開始就有人注意到了 但你要怎麼定義能力衰退這件事而且量化他? 於是七月就有一篇論文在討論這件事1
[黑特] 審計部最應該導入LLM吧立委諸公們對預算都很有意見 不過查預算結算很多眉角 一般民眾沒時間只能看報告跟立委質詢 導入LLM 可以讓更多人了解我們的錢花哪裡去1
[問卦] 120b PT的LLM,你用過的感受和心得?Hugging Face的高手無極限, 推出了多種120b的LLM PT模型, 每個不但超大容量, 還可以只用CPU來跑, 而且號稱同時使用越多張高等級Nvidia顯卡,- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
[地震] 地震爆
[爆卦] 地震58
[問卦] 新光三越倒了? (物理)53
[問卦] 雙北是做錯了什麼才沒有整理家園假?57
Re: [新聞] 郭智輝:向菲律賓買綠電 每度成本絕不會49
[問卦] 八卦這次檢討災情的文章怎麼少那麼多40
[爆卦] 聯合國要求日本和諧出版品中的女性角色33
[問卦] 台灣為何最近多颱風了〓〓?16
[問卦] △+△△=96,△=? 求解 在線等32
[地震] 地震32
[問卦] 兩餸飯真的蠻好吃?28
[問卦] 昨天道奇是怎麼逆轉的?有懶人包嗎?42
[爆卦] 基隆路上躺了一棵樹24
[問卦] 台中突然刮大風15
[問卦] 台北人跟新北人是次等公民嗎?16
[問卦] 台北現在無風無雨22
[問卦] 汽車被樹壓到要修多少錢21
Re: [新聞] 綠營人士:獨派還在隱忍「金孫」20
[問卦] 無糖可樂的意義是什麼?17
[問卦] 市區種路樹要做通盤檢討了吧?17
Re: [問卦] 台中突然刮大風16
[問卦] 有人也是為了省錢開始留長髮嗎?19
[問卦] 有人覺得房子在搖嗎14
[問卦] 洗髮精沐浴乳都用最便宜會怎樣21
[問卦] 新口味的麥克雞塊好吃嗎?8
[問卦] 台北市街道隨便都長這樣早上怎上班?15
[問卦] 新竹現在風超大的是因為我住大樓嗎?9
[問卦] 煮泡麵水加太多有解嗎?14
[問卦] 台北現在無風無雨 是什麼意思11
[問卦] MJ是史上最偉大的明星嗎