[爆卦] 全球最強中國 AI 模型被爆是套用 Meta 的
李開復 所創立零一萬物 推出全球強中國 AI 模型 包括 Yi-6B 和 Yi-34B 兩個版本
取得了多項 SOTA 國際最佳性能指標認可 成為全球開源大模型的雙料冠軍
擊敗了 LLaMA2 和 Falcon
現在被爆是套用 Meta 的 LLaMa 模型架構
面對質疑零一萬物只說
GPT是一個業內公認的成熟架構 而 LLaMA 在 GPT 上做了總結
零一萬物借鑒了行業頂尖水平的公開成果
同時基於零一萬物團隊對模型和訓練的理解做了大量工作
LLaMA 模型僅是模型訓練其中一部分
Yi開源模型在其他方面的精力例如資料工程、訓練方法、baby sitting的技巧、
超參數設定、評估方法以及對評估指標的本質理解深度、
對模型泛化能力的原理的研究深度、產業頂尖的AI Infra能力等
投入了大量研發和打底工作 這些工作往往比起基本結構能起到更大的作用跟價值
https://xueqiu.com/5899108858/266938216
中國或成最大贏家
--
然後台灣的直接抄大陸
幫你總結他的說法懶人包 : 工人智慧
用llama很正常 但用了還說自創就有問題了
用開源 然後自稱自創 我看87%只有資料集是
自己的(搞不好還混一堆公開的+偷來的)
反正不公開沒人知道
台灣抄中國?請1樓舉例有什麼案例
?詐騙?器官買
賣?人口販賣一條龍模式,這個中國
到很強!
我想起之前中國廠商拿外國的晶片說是自
己開發的 還開記者會炫耀 結果被踢爆
漢芯1號總是不斷的被中國製造出來 嘻嘻
意外嗎?
台灣那個就不用說了,借鑒借鑒的
台灣集資一堆假裝自創的淘寶貨
原來中國有AI
就跟鴻蒙套皮安卓類似
李開復真的有料嗎?之前關於AI的預測錯
資安危機?中研院「台版GPT」模型 出現
很大。
大量中國內容
這很中國
套LLaMA然後擊敗LLaMA2?
7樓很急?上個月工研院才出包這麼
快就忘了?
中國科研一向都是這樣啊,人家一開源中國
就突然突破了
中國套美國 台灣套中國 暖心
中國不就把1做到2的 而且做的不差
遙遙領先
抄襲國
彎道超車
出包的是中研院啦
重要技術 當然能抄就抄
亞洲人改別人東西特別厲害是不知道
喔
李開復笑死
台灣人李開復笑死
這個是直接改名稱而已
騙了阿里巴巴10億美
笑死 美國都願意開源讓大陸抄了 沒台灣
的事好嗎 ai台灣只能跟大陸買現成的
7樓有夠急,總統府管的中研院出來洗
白嗎? 笑死
支那日常操作,抄別人的來包裝,就可以
當作自己的來炫耀
94
Re: [新聞] 輝達傳再推中國特供AI晶片 最快「這時」老黃應該是有機會能繼續用黃家刀法 用高階價錢賣低階產物給中國 從美國的最大化利益角度來想 美國也會希望老黃賣次級的晶片給中國 這樣就某種程度能最大化阻滯中國發展 和弱化中國科技樹發展 比方說 中國最近的華為昇腾910B AI晶片號稱對標A100 已經賣給百度作為AI開發用途 如果說中國目前上面自製化晶片算力是10 那A100是30 H100是50 那老黃只要賣給中國晶片55
Re: [問卦] 中研院自己做的大型語言模型怎麼了?阿肥外商碼農阿肥啦! 昨天晚上都在跟獵人直播來不及趕上大型翻車現場,這邊中午看hugging face hub還 可以進去,但現在已經進不去了。 這邊阿肥就直接說,基本上現在所有中文開源語言模型除了少數像chatGLM這種中國比較 早期做的自己完全從零訓練的語言模型外,大家都是從meta 的llama魔改的,差別在於預23
Re: [爆卦] 中央研究院詞庫小組大型語言模型阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~17
[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。 LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT,但 是硬體需求大大降低,是個人電腦甚至旗艦手機都跑得動的程度。 根據他們paper的說法,LLaMA 13B的模型性能比GPT-3模型要好,可以作到基本對答。 一些LLaMA可以達成的任務10
Re: [請益] 為什麼有人說AI會讓資工人失去工作?阿肥外商碼農阿肥啦! 我只能說當前甚至往後十幾年都很難完全取代,除非真正的AGI實現了,那取代的可能不 止資工人,而是整個人類社會了,想想看AGI都有人類智慧了,那鎖螺絲、自己修理自己 或是檢測同類機器人都是很簡單的,那幹嘛還找人類黑手? 先說說像GPT-4即便是大成功的當下,很多企業要復現這樣的模型難度也是跟登天一樣X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。8
[爆卦] Meta 的語言模型 LLaMA 被人洩漏出來了出大事了 Meta 用來對標 OpenAI ChatGPT 的語言模型 LLaMA 被人洩漏出來 還打包成 Torret 在網路上供人下載了6
[情報] 微軟, META合作 Llama2上 Azure1. 標題: 微軟與META擴大他們的AI合作關係,讓Llama 2上Azure以及 windows 2. 來源: 微軟公司 3. 網址:X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答3
Re: [問卦] 聽說中研院AI花300萬?中研院聲明專區 本院資訊所表示,CKIP-Llama-2-7b 並非中研院官方或所方發表的研究成果,而是個別研 究人員公佈的階段性成果。此非臺版chatGPT,且跟國科會正在發展的 TAIDE 無關。 CKIP-Llama-2-7b 的研究目標之一是讓 meta 開發的 Llama 2 大型語言模型具備更好的
爆
[爆卦] 震撼! 30個死刑犯將會重啟判決爆
[問卦] 台灣隊12強4勝1敗僅輸日本 你敢信?爆
[問卦] 明天查到勞動部內部有霸凌的機率 多高?77
[問卦] D卡:奉勸年輕人不要衝動玩重機!91
[問卦] 可以祝我生日快樂嗎?83
[問卦] 日本有什麼是輸台灣的?爆
[問卦] 洪仲丘事件25萬人遊行 這次公務員靜悄悄?63
[爆卦] 中華男足3:2擊敗新加坡62
[地震] 地震33
[問卦] D卡:35歲重考醫牙中!40
[問卦] 真的有人想跟中共統一嗎〓〓?34
[問卦] 張信哲最紅的歌是過火嗎?38
[問卦] 認真問 所以大巨蛋是誰的功勞?1X
[地震] 地震24
[問卦] 賓士的臺語為什麼是麵魯?45
[問卦] 河北彩花整形前長這樣 你真的還可以嗎5
[問卦] 共產黨沒殺台灣人 台灣人在恨什麼19
[問卦] 為什麼捕殺綠鬣蜥犯法14
[問卦] 大巨蛋原本預計2015完工 怎麼2023才啟用19
[問卦] 綠鬣蜥這樣抓 根本不用考照?輕鬆又簡單?21
[問卦] 嘉義中埔有什麼經典(肥宅兔兔陣線)15
[問卦] 許慧欣是最美女歌手嗎?19
[問卦] 靠杯 邦交國貝里斯的綠鬣蜥 居然需要復育17
[問卦] 實務上來說 有辦法臨時組團包機去日本嗎?18
Re: [新聞] 勞動部公務員疑遭霸凌輕生 何佩珊明公18
Re: [問卦] 台女:33歲一離婚就幾個男生想娶我17
[問卦] 來台最好吃的大陸小吃是啥?16
[問卦] 石門水庫活魚到底好不好吃?13
[問卦] 2025開始WW3後的生活你可以忍受幾年?