[爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的
李開復 所創立零一萬物 推出全球強中國 AI 模型 包括 Yi-6B 和 Yi-34B 兩個版本
取得了多項 SOTA 國際最佳性能指標認可 成為全球開源大模型的雙料冠軍
擊敗了 LLaMA2 和 Falcon
現在被爆是套用 Meta 的 LLaMa 模型架構
面對質疑零一萬物只說
GPT是一個業內公認的成熟架構 而 LLaMA 在 GPT 上做了總結
零一萬物借鑒了行業頂尖水平的公開成果
同時基於零一萬物團隊對模型和訓練的理解做了大量工作
LLaMA 模型僅是模型訓練其中一部分
Yi開源模型在其他方面的精力例如資料工程、訓練方法、baby sitting的技巧、
超參數設定、評估方法以及對評估指標的本質理解深度、
對模型泛化能力的原理的研究深度、產業頂尖的AI Infra能力等
投入了大量研發和打底工作 這些工作往往比起基本結構能起到更大的作用跟價值
https://xueqiu.com/5899108858/266938216
中國或成最大贏家
--
然後台灣的直接抄大陸
幫你總結他的說法懶人包 : 工人智慧
用llama很正常 但用了還說自創就有問題了
用開源 然後自稱自創 我看87%只有資料集是
自己的(搞不好還混一堆公開的+偷來的)
反正不公開沒人知道
台灣抄中國?請1樓舉例有什麼案例
?詐騙?器官買
賣?人口販賣一條龍模式,這個中國
到很強!
我想起之前中國廠商拿外國的晶片說是自
己開發的 還開記者會炫耀 結果被踢爆
漢芯1號總是不斷的被中國製造出來 嘻嘻
意外嗎?
台灣那個就不用說了,借鑒借鑒的
台灣集資一堆假裝自創的淘寶貨
原來中國有AI
就跟鴻蒙套皮安卓類似
李開復真的有料嗎?之前關於AI的預測錯
資安危機?中研院「台版GPT」模型 出現
很大。
大量中國內容
這很中國
套LLaMA然後擊敗LLaMA2?
7樓很急?上個月工研院才出包這麼
快就忘了?
中國科研一向都是這樣啊,人家一開源中國
就突然突破了
中國套美國 台灣套中國 暖心
中國不就把1做到2的 而且做的不差
遙遙領先
抄襲國
彎道超車
出包的是中研院啦
重要技術 當然能抄就抄
亞洲人改別人東西特別厲害是不知道
喔
李開復笑死
台灣人李開復笑死
這個是直接改名稱而已
騙了阿里巴巴10億美
笑死 美國都願意開源讓大陸抄了 沒台灣
的事好嗎 ai台灣只能跟大陸買現成的
7樓有夠急,總統府管的中研院出來洗
白嗎? 笑死
支那日常操作,抄別人的來包裝,就可以
當作自己的來炫耀
94
Re: [新聞] 輝達傳再推中國特供AI晶片 最快「這時」老黃應該是有機會能繼續用黃家刀法 用高階價錢賣低階產物給中國 從美國的最大化利益角度來想 美國也會希望老黃賣次級的晶片給中國 這樣就某種程度能最大化阻滯中國發展 和弱化中國科技樹發展 比方說 中國最近的華為昇腾910B AI晶片號稱對標A100 已經賣給百度作為AI開發用途 如果說中國目前上面自製化晶片算力是10 那A100是30 H100是50 那老黃只要賣給中國晶片55
Re: [問卦] 中研院自己做的大型語言模型怎麼了?阿肥外商碼農阿肥啦! 昨天晚上都在跟獵人直播來不及趕上大型翻車現場,這邊中午看hugging face hub還 可以進去,但現在已經進不去了。 這邊阿肥就直接說,基本上現在所有中文開源語言模型除了少數像chatGLM這種中國比較 早期做的自己完全從零訓練的語言模型外,大家都是從meta 的llama魔改的,差別在於預23
Re: [爆卦] 中央研究院詞庫小組大型語言模型阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~17
[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。 LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT,但 是硬體需求大大降低,是個人電腦甚至旗艦手機都跑得動的程度。 根據他們paper的說法,LLaMA 13B的模型性能比GPT-3模型要好,可以作到基本對答。 一些LLaMA可以達成的任務10
Re: [請益] 為什麼有人說AI會讓資工人失去工作?阿肥外商碼農阿肥啦! 我只能說當前甚至往後十幾年都很難完全取代,除非真正的AGI實現了,那取代的可能不 止資工人,而是整個人類社會了,想想看AGI都有人類智慧了,那鎖螺絲、自己修理自己 或是檢測同類機器人都是很簡單的,那幹嘛還找人類黑手? 先說說像GPT-4即便是大成功的當下,很多企業要復現這樣的模型難度也是跟登天一樣X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。8
[爆卦] Meta 的語言模型 LLaMA 被人洩漏出來了出大事了 Meta 用來對標 OpenAI ChatGPT 的語言模型 LLaMA 被人洩漏出來 還打包成 Torret 在網路上供人下載了6
[情報] 微軟, META合作 Llama2上 Azure1. 標題: 微軟與META擴大他們的AI合作關係,讓Llama 2上Azure以及 windows 2. 來源: 微軟公司 3. 網址:X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答3
Re: [問卦] 聽說中研院AI花300萬?中研院聲明專區 本院資訊所表示,CKIP-Llama-2-7b 並非中研院官方或所方發表的研究成果,而是個別研 究人員公佈的階段性成果。此非臺版chatGPT,且跟國科會正在發展的 TAIDE 無關。 CKIP-Llama-2-7b 的研究目標之一是讓 meta 開發的 Llama 2 大型語言模型具備更好的
爆
[問卦] threads再度發起靈堂製作爆
[問卦] 立院外面怎麼一堆人爆
[問卦] 今晚遊行出現淫穢暗示舉牌??爆
[問卦] 老外問「How are you?」 到底回什麼?92
[問卦] 「很多」的台語 唸法?87
[問卦] 鏡週刊司法記者被爆出被招待喝酒?49
[問卦] 脆:為了台灣人上街還被酸求職 覺得心痛59
[問卦] 為何韓國年輕人抗議的是執政黨不是在野黨54
[問卦] 倉儲大火已經9死,誰該負責?54
Re: [新聞] 揭法務部「用公款招待媒體吃喝玩樂」照!20
[問卦] 八炯爆料好友死了 網友大喊毛骨悚然47
[問卦] 街上的青鳥是不是被賣掉了?43
[問卦] 日幣買在0.21的人現在在想什麼 掛?????38
[爆卦] 板南線異常34
[問卦] 麥當勞是有多缺人啊!?30
[問卦] 超商99元的粥都什麼人在買啊?99
[問卦] 日本2024最美JC選拔,1-15各位最喜歡誰34
[問卦] 桂冠湯圓 花生芝麻鮮肉 選誰25
[問卦] 全聯烤全雞賣199元長這樣 你會買嗎30
[問卦] 破窗而入有比較台灣價值的說法嗎?27
[問卦] 青鳥聚會只有水和雨衣?21
[問卦] 台灣撕裂成這樣,你真的OK?26
[問卦] 25歲清大研替跳樓沒有人在意?23
[問卦] 台中大火這黑煙龍捲太猛了吧75
[爆卦] 中捷英雄長髮哥分手了24
[問卦] 台中大型火災?!93
[問卦] 馬籍女大生命案嫌犯:我很擔心死者19
[問卦] D-link到底都誰在用14
[問卦] 口口聲聲說愛國 為什麼不簽志願役?4X
Re: [新聞] 國民黨嘲諷抗議青鳥像「瘋子」 吳思瑤