Re: [新聞] 台版ChatGPT雛型曝光 國科會用4個月秀TAI
※ 引述《Waitaha (行人地獄)》之銘言:
: 1.媒體來源:
: 自由時報
: 2.記者署名:
: 記者吳柏軒/台北報導
: 3.完整新聞標題:
: 台版ChatGPT雛型曝光 國科會用4個月秀TAIDE初階成果
: 4.完整新聞內文:
: 美國Open AI去年秀ChatGPT引發人工智慧(AI)浪潮,我國國科會今年2月宣布要推台版
: 的生成式AI模型,耗時4個月今(14日)宣布第一階段成果,目前已投入70億個參數量,
: 針對繁體中文訓練,實測已達自動摘要、翻譯文本、寫信與寫文章,都有不錯表現,並首
: 度透露相關計畫經費約2到3億元,年底前希望釋出更大模型,推向商業應用。
: 國科會主委吳政忠表示,今年2月宣布要推動「可信任AI對話引擎」(簡稱TAIDE),集結
: 產官學研、公私協力下,眾人力量紛紛無私奉獻,不少義工加入,加上國網中心超級電腦
: 算力一半拿出來支持,4個月後今公布第一階段成果,相關經費編列2到3億元,雖跟國外
: 相比「小小小小小」,但確是台灣目前重要成果。
: 協助開發的陽明交通大學應用數學系教授李育杰表示,當國科會宣布台灣要有自己的生成
: 式AI,避免過度依賴外國技術,眾人便開始用跑的,打造TAIDE引擎,目前利用臉書公開
: 學界使用的LLaMA模型,投入70億個參數量(7B,AI訓練所需參數),達中模型規模。
阿肥外商碼農阿肥啦!
其實這四個月整個訓練框架大爆發,阿肥自己也有幫公司訓練了一個中文小羊駝(可商用版)給業務單位使用。
包含微軟自己開源的DeepSpeed(把學習人類對話的強化學習(RLFH)訓練框架開源給大家免費用,還有知名開源框架抱抱臉釋出一些模型壓縮方法可以直接無腦調用,整個訓練阿肥訓練130億參數的模型從無到有弄起來真的不用一個禮拜,新手最多兩個禮拜就可以掌握了,真的蠻無腦的。
不過像Llama這種由於參數量其實只有GPT-3(不是ChatGPT跟GPT-4)的1/10不到,所以其實效能也是有限,像小羊駝Vicuna在通用評價測試集上只有GPT-3的92%,不過只需要一張顯卡又傻瓜是真的值得什麼都不懂又只有小需求的訓練一下拿來玩,像阿肥現在會把他拿來做基石做一些有趣的事情微調到自己的領域上省去人工標註的功夫。
差不多4醬
--
李宏毅講過了
人家可以拿政府2~3億
但可以拿來幹嘛= =
弱弱一問可商用的中文語料來源都是哪邊的
阿?
30
Re: [新聞] USAF預計明年7月施行人類對AI演習為何對台灣來說最簡單也最有效的AI軍事武器:自動機槍塔 沒有人想要開發呢 現有的開源軟體框架已經很成熟,也有已經訓練好的物體偵測模型(yolo) 只要把通用模型針對特定目標做遷移式學習就可以強化特殊領域辨識率 訓練用圖像資料靠海陸弟兄幫忙模擬一下 (班長:徵求資料標注公差10名) 整個套件硬體成本其實很低,樹莓派+intel神經棒或nvidia jeston應該可以做到21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機14
Re: [閒聊] 文心一言AI繪圖(慎入)文心一言實力不如ChatGPT是理所當然的,微軟投資幾百億美元並且用微軟的雲端訓練整個網 路資料兩年了,到了去年底才終於開花結果 目前這種LLM模型,最重要的就是 資料 算力 和算法,其中基礎的資料是非常重要的,Chat GPT在建立模型的過程跟一般的Ai一樣要機器學習建立模型,而ChatGPT的基礎原理就是由上 一個字生成下一個字,週而復始,其中在訓練的過程還會經過人工挑選優質回答和一些和添17
[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。 LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT,但 是硬體需求大大降低,是個人電腦甚至旗艦手機都跑得動的程度。 根據他們paper的說法,LLaMA 13B的模型性能比GPT-3模型要好,可以作到基本對答。 一些LLaMA可以達成的任務11
Re: [標的] 3443創意 跳水台空Google 辛辛苦苦追趕 ChatGPT 好幾個月,還沒拿出什麼具體對策,OpenAI 今日又火上 加油發表 GPT-4 模組,在這條人工智慧賽道別說車尾燈,Google 現在要擔心的是被 OpenAI 套圈了。但究竟 GPT-4 有什麼威能,和現在聊天好好玩的 ChatGPT 有什麼差別 ?10
[閒聊] 讓黑川茜唱アイドル我不是日文母語者 但是底下日本留言表示聽不出違和感 看起來成品是蠻成功的? 以後不需要用V家唱歌了8
[閒聊] 來聊聊AI輔助作畫的願景首先novel-ai過份了 手腳的問題解決了 馬賽克問題解決了 四肢亂跑的問題解決了 多人的問題也解決了 下面第三張極度nsfw注意 (全裸無露點)5
Re: [閒聊] 用CHATGPT跑團基本上就是記憶力(連結上下文能力)問題, ChatGPT的記憶能力「據說」是4000個token 約= 3000個英文單詞。 無論GPT3 API或者前天的GPT3.5 API也是這樣,超過的連結不到就會跑設定, 就算你自己串API都不會得到比較好的結果,只是據說沒有倫理限制而已。 那真的想這樣玩「可能」可以怎麼做?1
Re: [問卦] 為什麼人工智慧在這今年炸開了這一波是十年前的AlexNet才開始讓ML實用化 以往都只是研究 AlexNet橫空出世 GPU+大型CNN 辨識率高 忽然讓一堆人想到 啊幹 原來GPU能幹那麼複雜的事情 所以從2012年之後 ML/AI的研究如同雨後春筍呈現爆炸性的增長 ML從事的人多 想法就多 推出的模型多 成功的總會有幾個- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
[問卦] 哇靠 高雄中學校長說建中生需要教訓?爆
[問卦] 沒人覺得這種出征的風氣很噁心嗎爆
[問卦] 長官中風要出院了,送匾額題字?爆
[問卦] 檢察官關錄音偵訊是合法的嗎75
[問卦] 鄉民為何一口咬定麥當勞事件是「青鳥」77
[問卦] 湾湾自己就在搞文革! 還敢笑咱內地啊爆
[爆卦] Threads肉搜建中生的青鳥女拳師已關帳65
[問卦] Why 8年級在公司跟主管講話 底氣十足爆
[問卦] 脆出征建中生 建中校長出面道歉了56
[問卦] 到底誰看得出來建中生在嘲諷性侵事件?52
[問卦] 建中很混的學生 也是保底台清交吧?爆
[問卦] 當年有人抵制頂新林鳳營鮮奶嗎?48
[問卦] 為何最近出事的都建中北一女?40
[問卦] 為何搭飛機要提早2小時到?44
[問卦] 抵制麥當勞爽到誰?39
[問卦] 麥當勞有錯,但需要抵制成這樣嗎☹39
[問卦] 真假! 國軍連手槍射擊都用臥射!?78
[問卦] 吃麥當勞=挺性侵 這邏輯太可怕了吧爆
Re: [新聞] 快訊/北檢不服柯文哲等4人交保 向法院提29
[問卦] 建中學生具體違反了哪條我國現行法律?28
[問卦] 帥到排卵可以,正到射精為什麼不行26
[問卦] 房市霸王級寒流!!!!!30
[問卦] 麥當勞要做什麼才能洗白?25
Re: [新聞] 高鐵南延屏東方案底定 卓榮泰宣布:進高雄25
[問卦] 要殺多少人,詐騙多少錢,才會被判28.5年25
[問卦] 陸網友:台灣已被西方政確、 DEI綁架了19
[問卦] 高鐵確定南延高火,為什麼高雄板沒啥反26
Re: [新聞] 曾是沈伯洋論文口試委員!劉靜怡3年前22
[問卦] 這陣子一堆勞工死人為啥沒人檢討政府11
[問卦] 雄中校長參戰 痛斥挺吃麥當勞的雄中生?