Re: [閒聊] Deepseek的角色扮演
※ 引述 《e04su3no》 之銘言:
: → pobby2266: 昨天無聊也是讓他模擬魯迅和尼采對話 01/28 03:19: 推 pHyrz: 可以串連兩邊讓他們吵架ㄇ 01/28 03:22: 推 gm79227922: 可以瑟瑟嗎 01/28 05:40
Deepseek目前是有同時釋出開源模型(權重、Code、訓練模型的方法報告都開源)的,走跟llama一樣的路線,所以理論上只要GPU卡夠你就可以建一個完全一樣的環境包含重新微調模型讓DeepSeek 做瑟瑟的事情跟串接對話還有Agent去執行任務。
目前初步測試繁中能力真的屌打一堆拿喇嘛微調的台灣llama模型,重點是MoE的架構可以很省GPU(如果是llama同精度需要32張H100卡才能佈起來)。其實這次比較新釋出的是他的R1數學模型,主打純用RL左右互搏不需要像OpenAI的PPO一樣需要先經過大量監督微調(就是人類構造數據)的步驟就可以讓模型自主學會數學分解思考。
然後比較搞笑的是本來自稱自己開源的OpenAI現在早就把自己的模型全部close,然後首個開源深度思考模型竟然發生在最封閉的左岸。
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.8.79 (臺灣)
※ PTT 網址
27
[問卦] DeepSeek剛剛發布新款開源AI模型圖像生成模型Janus-Pro 在 GenEval 和 DPG-Bench 基準測試中打敗 OpenAI 的 DALL-E 3 和 Stable Diffusion? 請問中國人不過年嗎? 半夜放新模型是不是想炒美股?![[問卦] DeepSeek剛剛發布新款開源AI模型 [問卦] DeepSeek剛剛發布新款開源AI模型](https://cimg.cnyes.cool/prod/news/5847178/m/5ddbd59484861b45ae070a3a996bf42c.jpg)
15
[爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的李開復 所創立零一萬物 推出全球強中國 AI 模型 包括 Yi-6B 和 Yi-34B 兩個版本 取得了多項 SOTA 國際最佳性能指標認可 成為全球開源大模型的雙料冠軍 擊敗了 LLaMA2 和 Falcon 現在被爆是套用 Meta 的 LLaMa 模型架構![[爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的 [爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的](https://user-assets.sxlcdn.com/images/987821/FrlX5hBJzYiI62PNP5FUKt8y5n4Y.png?imageMogr2/strip/auto-orient/thumbnail/1200x630>/format/png)
17
[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。 LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT,但 是硬體需求大大降低,是個人電腦甚至旗艦手機都跑得動的程度。 根據他們paper的說法,LLaMA 13B的模型性能比GPT-3模型要好,可以作到基本對答。 一些LLaMA可以達成的任務![[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型 [討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型](https://i.imgur.com/G4o7TYsb.png)
9
[問卦] 要收費的OpenAI是不是完蛋了感覺美國的這些AI公司都講好了 開源的模型不能超越閉源的 很明顯這些開源的大公司有在禮讓 不能把別人的飯碗全部端走 讓OpenAI這個閉源的可以繼續撈![[問卦] 要收費的OpenAI是不是完蛋了 [問卦] 要收費的OpenAI是不是完蛋了](https://i.imgur.com/Xf1S6o8b.jpg)
8
[問卦] 如何利用deepseek開源模型 建構台灣AI聽說 deepseek-R1 是目前開源AI模型第一名 我有一個大膽的想法 既然這個模型是開源的 我們可以使用這個模型來建構台灣的 openAI 擺脫對美國AI大廠的依賴 是不是很聰明啊?6
Re: [新聞] 陸企DeepSeek接連推出大模型 陸媒:引發南無阿彌陀佛 敝島上所有做AI的專家學者全部綁在一塊不知道有沒有這家小公司的成就 還不就還好之前有組刻薄的llama救了多少人的論文 讓多少教授只要在那邊跑一跑人家的模型就可以坐穩那個學者的名份 現在又有一個deepseek開源可以伸手直接拿來用6
[情報] 微軟, META合作 Llama2上 Azure1. 標題: 微軟與META擴大他們的AI合作關係,讓Llama 2上Azure以及 windows 2. 來源: 微軟公司 3. 網址:![[情報] 微軟, META合作 Llama2上 Azure [情報] 微軟, META合作 Llama2上 Azure](https://blogs.microsoft.com/wp-content/uploads/prod/2023/07/1920x1080-META-OMB-Llama-2-Image-002-1024x576.png)
X
Re: [新聞] DeepSeek爆紅引熱議 傳偷用5萬顆輝達H10"世界一開源 中國就領先" 這是一句最近流傳的諺語~~~ 之前中國嘴砲7奈米量產 結果一開蓋 發現是TSMC like的製程 多重曝光 現在要驗證 deepseek是否真的是便宜成本就可以訓練好 只要請deepseek 公佈模型架構 不要提供完整訓練好的模型2
Re: [問卦] 有deepseek越強其實對台灣是大利多的卦?deepseek橫空出世 對台灣當然是大利多 台灣有很多號稱做AI的教授只會拿別人的模型來訓練 meta的llama釋出之前 只能在網路上找些更爛的開源model做出只會講幹話的東西1
Re: [新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷前文恕刪 : 據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100 : 顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。 這比法很不公平
爆
[Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況![[Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況 [Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況](https://img.youtube.com/vi/KJeMC4BKvoA/mqdefault.jpg)
爆
Re: [Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況![Re: [Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況 Re: [Vtub] 春魚四期生Vtuber冰霧疑似指控快打實況](https://i.mopix.cc/OgUnxH.jpg)
爆
[鳴潮] 3.0動畫短片 轉校生 前瞻直播12/12![[鳴潮] 3.0動畫短片 轉校生 前瞻直播12/12 [鳴潮] 3.0動畫短片 轉校生 前瞻直播12/12](https://img.youtube.com/vi/nNyot7KuDQE/mqdefault.jpg)
爆
[閒聊] 如果是bilibili被封鎖會怎麼樣?爆
[閒聊] 男女粉比例出乎你意料的作品?![[閒聊] 男女粉比例出乎你意料的作品? [閒聊] 男女粉比例出乎你意料的作品?](https://i.imgur.com/wSnRZsnb.jpeg)
爆
[討論] 欸!泡泡瑪特怎麼在大跌價了?![[討論] 欸!泡泡瑪特怎麼在大跌價了? [討論] 欸!泡泡瑪特怎麼在大跌價了?](https://img.youtube.com/vi/QBPEpPblwcw/mqdefault.jpg)
爆
Re: [閒聊] 小紅書成為美國App Store下載第一![Re: [閒聊] 小紅書成為美國App Store下載第一 Re: [閒聊] 小紅書成為美國App Store下載第一](https://i.imgur.com/T8vEV7xb.jpeg)
89
[Vtub] 虹VS齁 卡比賽車對抗賽87
Re: [Vtub] 春魚Vtuber冰霧疑似指控快打實況主Yoro私訊騷擾![Re: [Vtub] 春魚Vtuber冰霧疑似指控快打實況主Yoro私訊騷擾 Re: [Vtub] 春魚Vtuber冰霧疑似指控快打實況主Yoro私訊騷擾](https://img.youtube.com/vi/KJeMC4BKvoA/mqdefault.jpg)
73
Re: [Vtub] 春魚Vtuber冰霧疑似指控快打實況主Yoro私訊騷擾71
[閒聊] 最跌落神壇的公司是育碧嗎?![[閒聊] 最跌落神壇的公司是育碧嗎? [閒聊] 最跌落神壇的公司是育碧嗎?](https://i.imgur.com/71OHyzZb.png)
73
[閒聊]定義上幾歲才應該被叫「大叔」?![[閒聊]定義上幾歲才應該被叫「大叔」? [閒聊]定義上幾歲才應該被叫「大叔」?](https://i.imgur.com/0M6qX7Wb.jpeg)
65
[閒聊] 美國一名11歲幼童靠模仿達爾撐過危機![[閒聊] 美國一名11歲幼童靠模仿達爾撐過危機 [閒聊] 美國一名11歲幼童靠模仿達爾撐過危機](https://i.imgur.com/5kdUABnb.jpeg)
57
[蔚藍] 百花繚亂圍毆能打贏若藻嗎![[蔚藍] 百花繚亂圍毆能打贏若藻嗎 [蔚藍] 百花繚亂圍毆能打贏若藻嗎](https://i.imgur.com/dlSBA7yb.jpeg)
58
[閒聊] 被宣判是醜男該怎麼辦?![[閒聊] 被宣判是醜男該怎麼辦? [閒聊] 被宣判是醜男該怎麼辦?](https://i.mopix.cc/bVDkpu.jpg)
40
Re: [閒聊] 小紅書成為美國App Store下載第一53
[閒聊] 現在少前2是完全塵白化了喔52
[閒聊] 巨人的OP跟ED算很強嗎??52
[鳴潮] 怎辦?這計畫根本一點屁用也沒有!49
[妮姬] 小遊戲好難![[妮姬] 小遊戲好難 [妮姬] 小遊戲好難](https://i.mopix.cc/k7reSC.jpg)
45
Re: [閒聊] 小紅書成為美國App Store下載第一48
[Vtub] Vivi自爆性癖是被搔腳底XDDD![[Vtub] Vivi自爆性癖是被搔腳底XDDD [Vtub] Vivi自爆性癖是被搔腳底XDDD](https://i.imgur.com/l9An5yXb.jpeg)
49
[情報] 黑白妹1重製 插圖進度正式200% (全體50%)![[情報] 黑白妹1重製 插圖進度正式200% (全體50%) [情報] 黑白妹1重製 插圖進度正式200% (全體50%)](https://i.imgur.com/ZzNmHMBb.gif)
48
[閒聊] 統神會怎麼評論yoro騷擾事件!?47
[閒聊] 哪一種恐怖比較讓人不舒服?![[閒聊] 哪一種恐怖比較讓人不舒服? [閒聊] 哪一種恐怖比較讓人不舒服?](https://i.imgur.com/e8dN5uAb.png)
47
[閒聊] 新妹魔王 這樣算是黑奴嗎?![[閒聊] 新妹魔王 這樣算是黑奴嗎? [閒聊] 新妹魔王 這樣算是黑奴嗎?](https://pbs.twimg.com/media/FdMJRYGaEAAl0zi.jpg)
爆
[魔物]荒野總監發言惹議 將世界稱前作掀玩家反感![[魔物]荒野總監發言惹議 將世界稱前作掀玩家反感 [魔物]荒野總監發言惹議 將世界稱前作掀玩家反感](https://image.gameapps.hk/images/202512/05/1764898511_762582_jpg_r_result.jpg)
爆
[閒聊] 一晚9發現實中做得到嗎?![[閒聊] 一晚9發現實中做得到嗎? [閒聊] 一晚9發現實中做得到嗎?](https://i.imgur.com/U8Ejehhb.jpg)
41
[閒聊] 《星艦戰將》改編遊戲《星艦戰將: 終焉![[閒聊] 《星艦戰將》改編遊戲《星艦戰將: 終焉 [閒聊] 《星艦戰將》改編遊戲《星艦戰將: 終焉](https://img.youtube.com/vi/it0V4iBGq18/mqdefault.jpg)
41
[星塔] 旅人介紹 『夏花』 CV.伊藤静![[星塔] 旅人介紹 『夏花』 CV.伊藤静 [星塔] 旅人介紹 『夏花』 CV.伊藤静](https://i.imgur.com/nK8rcORb.jpeg)
![[閒聊] Deepseek的角色扮演 [閒聊] Deepseek的角色扮演](https://i.imgur.com/fniID6nb.jpg)