PTT推薦

Re: [新聞] 輝達H100顯卡「訂價139萬」...上架就秒殺

看板Gossiping標題Re: [新聞] 輝達H100顯卡「訂價139萬」...上架就秒殺作者
bachelorwhc
(積積陰陰德)
時間推噓 2 推:3 噓:1 →:10

※ 引述《sxy67230 (charlesgg)》之銘言:
: H100真正的目的就是拿來訓練LLM跟NN模型而已,普通人根本沒Data是要訓練三小模型= =: ?


看你講那麼大聲 結果根本外行


訓練LLM的dataset網路上都找得到 根本看不完

從wikipedia擷取到從fandom蒐集次文化資料、pdf電子書等等

還有專門RolePlay的chat資料集

跟從遊戲擷取的對話文本等等.....

只要你的運用不偏門 大部分的資料都找得到

自己寫一個爬蟲也沒多難 我上週才寫了一個爬pixiv dict的程式


LLM的pretrain跟fine tuning資料來源不是問題 時間跟錢才是

大部分的做法是拿現有pretrain過的model在runpod上租GPU來再訓練


--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.52.184 (臺灣)
PTT 網址

cisyong 07/07 11:50跟你說,政黑的推文都拿來訓練,錢賺飽飽

SpinozaPi 07/07 12:09你說的內容一樣說公司會買來裝置來讓費

SpinozaPi 07/07 12:09用客戶使用 所以一樣是他提及的公司買

SpinozaPi 07/07 12:09

leoloveivy 07/07 12:47糗嘎並軌 你多會爬 你要花幾年爬完人

看你這種論調就知道你連HF dataset要怎麼下載都不知道 就別出來丟臉了

lianpig5566 07/07 15:04所以都是大公司做pretrain model 一

lianpig5566 07/07 15:04般人沒啥資源就fine tune阿

lianpig5566 07/07 15:05fine tune就是拿specific task需要的

lianpig5566 07/07 15:05資料去訓練就好 除非你是要通用領域

Bmtswiiii 07/07 15:42老婆當然只能裝大器啊 都幾歲了難道要

Bmtswiiii 07/07 15:42離婚去找第二春喔 老公有持續拿錢回家

Bmtswiiii 07/07 15:42就好了啦 在外面想怎麼玩就玩 反正就

Bmtswiiii 07/07 15:42是新台幣維持的婚姻 男生要是沒錢早離

AirLee 07/07 16:45樓上推錯文

※ 編輯: bachelorwhc (36.230.52.184 臺灣), 07/07/2024 22:55:04