Re: [新聞] 台版ChatGPT雛型曝光 國科會用4個月秀TAI
※ 引述《Waitaha (行人地獄)》之銘言:
: 1.媒體來源:
: 自由時報
: 2.記者署名:
: 記者吳柏軒/台北報導
: 3.完整新聞標題:
: 台版ChatGPT雛型曝光 國科會用4個月秀TAIDE初階成果
: 4.完整新聞內文:
: 美國Open AI去年秀ChatGPT引發人工智慧(AI)浪潮,我國國科會今年2月宣布要推台版
: 的生成式AI模型,耗時4個月今(14日)宣布第一階段成果,目前已投入70億個參數量,
: 針對繁體中文訓練,實測已達自動摘要、翻譯文本、寫信與寫文章,都有不錯表現,並首
: 度透露相關計畫經費約2到3億元,年底前希望釋出更大模型,推向商業應用。
: 國科會主委吳政忠表示,今年2月宣布要推動「可信任AI對話引擎」(簡稱TAIDE),集結
: 產官學研、公私協力下,眾人力量紛紛無私奉獻,不少義工加入,加上國網中心超級電腦
: 算力一半拿出來支持,4個月後今公布第一階段成果,相關經費編列2到3億元,雖跟國外
: 相比「小小小小小」,但確是台灣目前重要成果。
: 協助開發的陽明交通大學應用數學系教授李育杰表示,當國科會宣布台灣要有自己的生成
: 式AI,避免過度依賴外國技術,眾人便開始用跑的,打造TAIDE引擎,目前利用臉書公開
: 學界使用的LLaMA模型,投入70億個參數量(7B,AI訓練所需參數),達中模型規模。
阿肥外商碼農阿肥啦!
其實這四個月整個訓練框架大爆發,阿肥自己也有幫公司訓練了一個中文小羊駝(可商用版)給業務單位使用。
包含微軟自己開源的DeepSpeed(把學習人類對話的強化學習(RLFH)訓練框架開源給大家免費用,還有知名開源框架抱抱臉釋出一些模型壓縮方法可以直接無腦調用,整個訓練阿肥訓練130億參數的模型從無到有弄起來真的不用一個禮拜,新手最多兩個禮拜就可以掌握了,真的蠻無腦的。
不過像Llama這種由於參數量其實只有GPT-3(不是ChatGPT跟GPT-4)的1/10不到,所以其實效能也是有限,像小羊駝Vicuna在通用評價測試集上只有GPT-3的92%,不過只需要一張顯卡又傻瓜是真的值得什麼都不懂又只有小需求的訓練一下拿來玩,像阿肥現在會把他拿來做基石做一些有趣的事情微調到自己的領域上省去人工標註的功夫。
差不多4醬
--
李宏毅講過了
人家可以拿政府2~3億
但可以拿來幹嘛= =
弱弱一問可商用的中文語料來源都是哪邊的
阿?
30
Re: [新聞] USAF預計明年7月施行人類對AI演習為何對台灣來說最簡單也最有效的AI軍事武器:自動機槍塔 沒有人想要開發呢 現有的開源軟體框架已經很成熟,也有已經訓練好的物體偵測模型(yolo) 只要把通用模型針對特定目標做遷移式學習就可以強化特殊領域辨識率 訓練用圖像資料靠海陸弟兄幫忙模擬一下 (班長:徵求資料標注公差10名) 整個套件硬體成本其實很低,樹莓派+intel神經棒或nvidia jeston應該可以做到21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機14
Re: [閒聊] 文心一言AI繪圖(慎入)文心一言實力不如ChatGPT是理所當然的,微軟投資幾百億美元並且用微軟的雲端訓練整個網 路資料兩年了,到了去年底才終於開花結果 目前這種LLM模型,最重要的就是 資料 算力 和算法,其中基礎的資料是非常重要的,Chat GPT在建立模型的過程跟一般的Ai一樣要機器學習建立模型,而ChatGPT的基礎原理就是由上 一個字生成下一個字,週而復始,其中在訓練的過程還會經過人工挑選優質回答和一些和添17
[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。 LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT,但 是硬體需求大大降低,是個人電腦甚至旗艦手機都跑得動的程度。 根據他們paper的說法,LLaMA 13B的模型性能比GPT-3模型要好,可以作到基本對答。 一些LLaMA可以達成的任務11
Re: [標的] 3443創意 跳水台空Google 辛辛苦苦追趕 ChatGPT 好幾個月,還沒拿出什麼具體對策,OpenAI 今日又火上 加油發表 GPT-4 模組,在這條人工智慧賽道別說車尾燈,Google 現在要擔心的是被 OpenAI 套圈了。但究竟 GPT-4 有什麼威能,和現在聊天好好玩的 ChatGPT 有什麼差別 ?10
[閒聊] 讓黑川茜唱アイドル我不是日文母語者 但是底下日本留言表示聽不出違和感 看起來成品是蠻成功的? 以後不需要用V家唱歌了8
[閒聊] 來聊聊AI輔助作畫的願景首先novel-ai過份了 手腳的問題解決了 馬賽克問題解決了 四肢亂跑的問題解決了 多人的問題也解決了 下面第三張極度nsfw注意 (全裸無露點)5
Re: [閒聊] 用CHATGPT跑團基本上就是記憶力(連結上下文能力)問題, ChatGPT的記憶能力「據說」是4000個token 約= 3000個英文單詞。 無論GPT3 API或者前天的GPT3.5 API也是這樣,超過的連結不到就會跑設定, 就算你自己串API都不會得到比較好的結果,只是據說沒有倫理限制而已。 那真的想這樣玩「可能」可以怎麼做?1
Re: [問卦] 為什麼人工智慧在這今年炸開了這一波是十年前的AlexNet才開始讓ML實用化 以往都只是研究 AlexNet橫空出世 GPU+大型CNN 辨識率高 忽然讓一堆人想到 啊幹 原來GPU能幹那麼複雜的事情 所以從2012年之後 ML/AI的研究如同雨後春筍呈現爆炸性的增長 ML從事的人多 想法就多 推出的模型多 成功的總會有幾個- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
[問卦] 建中生吃麥當勞遭threads大炎上抵制爆
[爆卦] 公益揭弊者保護法三讀通過爆
Re: [新聞] 快訊/陳菊健康檢查發現腫瘤!出院前1日爆
[爆卦] 未來可能新增的放假日爆
[問卦] 欸!這是聯X科的尾牙菜色...?爆
[問卦] 為什麼關出來的人會變得溫和?93
[問卦] 為什麼當初要砍掉七天假?84
[問卦] 新竹市繳稅,高雄市花錢?97
Re: [新聞] 王義川發威?國會電爆黃國昌:最沒資格86
[問卦] 高雄當初是哪一步走錯了63
[問卦]如今陳橘的存活概率?52
[問卦] 找一部飛進黑洞的片62
[問卦] 北檢起訴書寫進教科書內 要列在哪個章節54
Re: [新聞] 快訊/北檢不服柯文哲等4人交保 向法院提爆
Re: [新聞] 許芷瑜男友稱柯家藏現金 北檢擬朝「財產80
[問卦] 聽說RTX5080要他媽1800鎂53
Re: [新聞] 陳佩琪遭爆「35天跑20幾次ATM」 他酸:87
[問卦] 八卦這麼嗜血,你真的OK?92
[問卦]黃揚明:就是有一群無知信徒 才會變這地步77
[問卦] 辛苦金流高手檢察官陳玟瑾!!!功成身退42
Re: [新聞] 快訊/法院裁柯文哲等被告交保 北檢:已45
[問卦] 2024年誰去世最印象深刻?36
[問卦] 新台幣3億元要怎麼放家裡阿24
[問卦]館長:二十幾歲怎可能作帳房 帳你媽雞八32
[問卦] 漢堡+雞肉捲+可樂$51塊 PR多少?87
Re: [爆卦] 林楚茵在立法院說鏡週刊是吹哨者 揭弊者26
[問卦] 我用Excel付茶資被打怎辦29
[問卦] 楊思敏的八卦?27
[問卦] 檢察官的職業道德與良心是指什麼東西?23
Re: [新聞] 「橘子」許芷瑜涉保管柯文哲賄款 檢方請