Re: [新聞] 台版ChatGPT雛型曝光 國科會用4個月秀TAI
※ 引述《Waitaha (行人地獄)》之銘言:
: 1.媒體來源:
: 自由時報
: 2.記者署名:
: 記者吳柏軒/台北報導
: 3.完整新聞標題:
: 台版ChatGPT雛型曝光 國科會用4個月秀TAIDE初階成果
: 4.完整新聞內文:
: 美國Open AI去年秀ChatGPT引發人工智慧(AI)浪潮,我國國科會今年2月宣布要推台版
: 的生成式AI模型,耗時4個月今(14日)宣布第一階段成果,目前已投入70億個參數量,
: 針對繁體中文訓練,實測已達自動摘要、翻譯文本、寫信與寫文章,都有不錯表現,並首
: 度透露相關計畫經費約2到3億元,年底前希望釋出更大模型,推向商業應用。
: 國科會主委吳政忠表示,今年2月宣布要推動「可信任AI對話引擎」(簡稱TAIDE),集結
: 產官學研、公私協力下,眾人力量紛紛無私奉獻,不少義工加入,加上國網中心超級電腦
: 算力一半拿出來支持,4個月後今公布第一階段成果,相關經費編列2到3億元,雖跟國外
: 相比「小小小小小」,但確是台灣目前重要成果。
: 協助開發的陽明交通大學應用數學系教授李育杰表示,當國科會宣布台灣要有自己的生成
: 式AI,避免過度依賴外國技術,眾人便開始用跑的,打造TAIDE引擎,目前利用臉書公開
: 學界使用的LLaMA模型,投入70億個參數量(7B,AI訓練所需參數),達中模型規模。
阿肥外商碼農阿肥啦!
其實這四個月整個訓練框架大爆發,阿肥自己也有幫公司訓練了一個中文小羊駝(可商用版)給業務單位使用。
包含微軟自己開源的DeepSpeed(把學習人類對話的強化學習(RLFH)訓練框架開源給大家免費用,還有知名開源框架抱抱臉釋出一些模型壓縮方法可以直接無腦調用,整個訓練阿肥訓練130億參數的模型從無到有弄起來真的不用一個禮拜,新手最多兩個禮拜就可以掌握了,真的蠻無腦的。
不過像Llama這種由於參數量其實只有GPT-3(不是ChatGPT跟GPT-4)的1/10不到,所以其實效能也是有限,像小羊駝Vicuna在通用評價測試集上只有GPT-3的92%,不過只需要一張顯卡又傻瓜是真的值得什麼都不懂又只有小需求的訓練一下拿來玩,像阿肥現在會把他拿來做基石做一些有趣的事情微調到自己的領域上省去人工標註的功夫。
差不多4醬
--
李宏毅講過了
人家可以拿政府2~3億
但可以拿來幹嘛= =
弱弱一問可商用的中文語料來源都是哪邊的
阿?
30
Re: [新聞] USAF預計明年7月施行人類對AI演習為何對台灣來說最簡單也最有效的AI軍事武器:自動機槍塔 沒有人想要開發呢 現有的開源軟體框架已經很成熟,也有已經訓練好的物體偵測模型(yolo) 只要把通用模型針對特定目標做遷移式學習就可以強化特殊領域辨識率 訓練用圖像資料靠海陸弟兄幫忙模擬一下 (班長:徵求資料標注公差10名) 整個套件硬體成本其實很低,樹莓派+intel神經棒或nvidia jeston應該可以做到21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機14
Re: [閒聊] 文心一言AI繪圖(慎入)文心一言實力不如ChatGPT是理所當然的,微軟投資幾百億美元並且用微軟的雲端訓練整個網 路資料兩年了,到了去年底才終於開花結果 目前這種LLM模型,最重要的就是 資料 算力 和算法,其中基礎的資料是非常重要的,Chat GPT在建立模型的過程跟一般的Ai一樣要機器學習建立模型,而ChatGPT的基礎原理就是由上 一個字生成下一個字,週而復始,其中在訓練的過程還會經過人工挑選優質回答和一些和添17
[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。 LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT,但 是硬體需求大大降低,是個人電腦甚至旗艦手機都跑得動的程度。 根據他們paper的說法,LLaMA 13B的模型性能比GPT-3模型要好,可以作到基本對答。 一些LLaMA可以達成的任務11
Re: [標的] 3443創意 跳水台空Google 辛辛苦苦追趕 ChatGPT 好幾個月,還沒拿出什麼具體對策,OpenAI 今日又火上 加油發表 GPT-4 模組,在這條人工智慧賽道別說車尾燈,Google 現在要擔心的是被 OpenAI 套圈了。但究竟 GPT-4 有什麼威能,和現在聊天好好玩的 ChatGPT 有什麼差別 ?10
[閒聊] 讓黑川茜唱アイドル我不是日文母語者 但是底下日本留言表示聽不出違和感 看起來成品是蠻成功的? 以後不需要用V家唱歌了8
[閒聊] 來聊聊AI輔助作畫的願景首先novel-ai過份了 手腳的問題解決了 馬賽克問題解決了 四肢亂跑的問題解決了 多人的問題也解決了 下面第三張極度nsfw注意 (全裸無露點)5
Re: [閒聊] 用CHATGPT跑團基本上就是記憶力(連結上下文能力)問題, ChatGPT的記憶能力「據說」是4000個token 約= 3000個英文單詞。 無論GPT3 API或者前天的GPT3.5 API也是這樣,超過的連結不到就會跑設定, 就算你自己串API都不會得到比較好的結果,只是據說沒有倫理限制而已。 那真的想這樣玩「可能」可以怎麼做?1
Re: [問卦] 為什麼人工智慧在這今年炸開了這一波是十年前的AlexNet才開始讓ML實用化 以往都只是研究 AlexNet橫空出世 GPU+大型CNN 辨識率高 忽然讓一堆人想到 啊幹 原來GPU能幹那麼複雜的事情 所以從2012年之後 ML/AI的研究如同雨後春筍呈現爆炸性的增長 ML從事的人多 想法就多 推出的模型多 成功的總會有幾個- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
Re: [新聞] 簡舒培PO裁定書!民眾黨:違反偵查不公開爆
[問卦] 淘寶小米75吋電視破屏,怎辦?爆
[問卦] 所以你倒底敢在淘寶上 買什麼東西到台灣?53
[問卦] 真想問:為什麼我們每年都要擔心戰爭?87
[問卦] 「刺青」給大家的觀感到底是正面還是負面81
[問卦] 賀錦麗那一步走錯了才被川普翻掉?61
[問卦] 印度最有名的東西是什麼??57
[問卦] 不會長牙結石的給我進來 操!30
[問卦] 媽的高速公路內側要開多少才不會被閃燈?57
[爆卦] 路透社: 川普的保護費= 近期新的巨額軍售51
[問卦] 這魚煎得不錯吧☺78
[問卦] 認真問! 兩岸到底要怎麼和平統一?43
[問卦] 美國芝加哥群眾抗議川普當選總統38
[問卦] 教召查詢系統是不是有調整權重?37
[問卦] 八卦版最恨的前三名是什麼38
[問卦] 你喜歡伍佰的哪些國語歌?28
[問卦] 驚! HBD老闆夏筠婷強勢回歸?28
Re: [新聞] 京華城案裁定書揭柯文哲拿前金又收賄 簡28
[問卦] 大樂透封關後30分鐘才開獎是為了洗球吧?爆
[問卦] 照這邏輯 該羈押財政部相關負責人了吧63
[問卦] YOASOBI是不是打臉尸位素餐的垃圾文化部62
[問卦] 台灣有甚麼懸案X調查的Will值得講述?24
[問卦] ㄍㄨㄟ ㄐㄧˋ 是水果喔?爆
Re: [新聞] 京華城案裁定書揭柯文哲拿前金又收賄 簡52
[問卦] 現在的小孩不看卡通 都看什麼??66
[問卦] 川普家是神基因嗎?24
[問卦] 有沒有 台科 比中字輩強的八卦?83
[問卦] 為什麼日本歌壇都沒有斷層的?反觀台灣21
[問卦] 商用筆電跟電競筆電哪個快?哪個好用?20
[問卦] 山本由伸在日男裡面算PR多少?