Re: [問卦] 聽說中研院AI花300萬?
※ 引述《sxy67230 (charlesgg)》之銘言:
: ※ 引述《Fortran (Fortran)》之銘言:
: : 如題
: : 本肥好奇,若這樣簡轉繁中,直接套用中國模型,應該不用花到300萬吧
: : 頂多就換個皮,簡轉繁中,連一個工作天都不用,1~5萬就夠了
: : 剩下的經費都....?
: : 有卦?
: 阿肥外商碼農阿肥啦!
: 推廣一下微軟Azure服務,這邊試算開一張A100機器折合台幣差不多8萬台幣/月,平均一: 天3000不到,中研院應該夠划算了,也算是現在市場公道價,反正都用開源簡中數據了,: 放Azure訓練也沒什麼資安問題,而且要撈90GB的模型檔案不到十五分鐘就載完了,Azure: 又快又好用。
: Llama現在一堆微軟、Nvidia都有釋出開源訓練框架,無腦載套件下來照教學拉下訓練con: fig就可以開始跑,推論也直接用Nvidia的inference框生成2048個字不到0.7秒不到,最: 多給你開發Gradio的介面框三天好了,這樣一天給研究人員一人五萬/天,十五萬加上Azu: re 8萬就二十萬不到耶!
: 三百萬真羨慕,我們政府很有錢吶!
: 嘻嘻
https://ppt.cc/fZf2Sx
中研院聲明專區
本院資訊所表示,CKIP-Llama-2-7b 並非中研院官方或所方發表的研究成果,而是個別研究人員公佈的階段性成果。此非臺版chatGPT,且跟國科會正在發展的 TAIDE 無關。
CKIP-Llama-2-7b 的研究目標之一是讓 meta 開發的 Llama 2 大型語言模型具備更好的繁體中文處理能力。這項小型研究僅用了大約30萬元的經費,將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另也包含臺灣的碩博士論文摘要、來自中國開源的任務資料集 COIG(CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答;在github網頁上也據實說明。
由於這是一項個人小型的研究,各界對該模型進行的提問測試,並未在原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),模型產生內容出乎預期,也是未來要努力改善的地方,研究人員今(9)日已將測試版先行下架,未來相關研究及成果釋出,會更加謹慎。對相關研究的成果,公開釋出前,院內也會擬定審核機制,避免類似問題產生。
==
原來只值 3 秒鐘啊。
--
套皮就拿30萬也是很好賺啊
30萬就五個月的薪水 差不多啦
從中國抄來的資料庫 嘻嘻 30萬
個人研究發新聞?
欸欸欸 出包了 誰有在研究AI,拿來擋一下
啦
又是個人的問題
55
Re: [問卦] 中研院自己做的大型語言模型怎麼了?阿肥外商碼農阿肥啦! 昨天晚上都在跟獵人直播來不及趕上大型翻車現場,這邊中午看hugging face hub還 可以進去,但現在已經進不去了。 這邊阿肥就直接說,基本上現在所有中文開源語言模型除了少數像chatGLM這種中國比較 早期做的自己完全從零訓練的語言模型外,大家都是從meta 的llama魔改的,差別在於預34
[討論] 中研院繁中LLM被爆直接拿對岸的來套!中央研究院詞庫小組(CKIP) 中研院資訊所、語言所於民國75年合作成立 前天釋出可以商用的繁中大型語言模型(LLM) CKIP-Llama-2-7b 以商用開源模型 Llama-2-7b 以及 Atom-7b 為基礎23
Re: [爆卦] 中央研究院詞庫小組大型語言模型阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~5
Re: [新聞] 中研院 AI 大翻車!繁中大型語言模型 CKI那個 我記得以前的新聞是這樣講的 防止簡體版AI偏見,產官學聯手開發繁體版AI語音模型 聯發創新基地負責人許大山博士表示: 「大型語言模型是近年來人工智慧技術進步的亮點 ,更是未來進步不可或缺的基石。聯發科技向來重視創新及科技發展,此次結合中研院及 國教院,成為台灣極少數能訓練大型語言模型的團隊,既發展自主訓練大型人工智慧模型5
[閒聊] MarioGPT 無限產生新的瑪利歐遊戲關卡哥本哈根資訊科技大學(IT University of Copenhagen,ITU)的團隊發表一篇全新論文 及相關的 GitHub 頁面,展示一種運用 AI 和程式產生瑪利歐遊戲的新玩法,他們稱之為 「MarioGPT」。 MarioGPT 以 GPT-2 模型為基礎,儘管名稱向 ChatGPT 致敬,但它並非對話形式的人工 智慧。GPT-2 為大型語言模型(Large Language Models,LLM)無法理解瑪利歐遊戲,研3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3dX
Re: [新聞] 國慶日變10/1!中研院認了「AI語言模型」不知道這個話題有什麼好延燒的,一個數據庫而已。 在中文環境,台灣本就貢獻有限,要研究,就必不可少用到對岸資料,重要的是語言模型的 表現怎麼樣。 至少從實際來看,回答邏輯通順,條例分明,也能準確理解提問的意涵並給出準確的答案, 這不就夠了嗎?2
[討論] 政客真的毋湯中研院、工研院、中科院,傻傻分不清楚 Posted on December 29, 2020 by Ronald 在和許多人聊天的過程當中,發現許多人不了解中研院、工研院和中科院的差別。我爸媽 不了解也就算了,但居然年紀相仿的交大畢業的電子電機博士聽到我說「我在中研院的實
爆
Re: [新聞] 獨家》新任勞動部長洪申翰出任 王義川遞37
[問卦] 各位滿意了吧 下去一個 換一個沒畢業的30
Re: [新聞] 深夜震撼彈!洪申翰接勞動部長 王義川遞18
Re: [問卦] 烏克蘭打了兩年的戰爭獲得了什麼X
[問卦] 只有我覺得社會對謝宜容太過分了嗎??18
Re: [問卦] 喬丹時代的籃球看起來很爽吧36
[問卦] 真的有外星人嗎?我非常存疑15
Re: [新聞] 深夜震撼彈!洪申翰接勞動部長 王義川遞76
Re: [新聞] 獨家》新任勞動部長洪申翰出任 王義川遞14
[問卦] 要怎麼克服怕飛天大蟑螂的恐懼?8
[問卦] 這部長選的不錯吧?33
[問卦] 靠北 搭訕現在變性騷喔?40
[問卦] 華堡 Q Burger 拉亞漢堡 呷尚寶你會選擇9
[問卦] 公務員現在484不如外面私企好?40
[問卦]民眾自主發起 反霸凌遊行需要各位鄉民41
[問卦] 為啥台南Josh還蠻容易吸仇恨的24
[問卦] 多米多羅跟上班不要看黃金交叉了!52
[問卦] 全女性公司是不是就不會有霸凌了9
[問卦] 為什麼ps5實體遊戲不用隨身碟16
[問卦] 幹你娘 詐騙有夠多 幹你娘垃圾黨8
Re: [新聞] 深夜震撼彈!洪申翰接勞動部長 王義川遞13
[問卦] 鄭智化最紅的歌是星星點燈嗎?13
[問卦] 欸不是 美國都公開外星人的存在了..4
[問卦] 台灣也有超高校級的人物?6
[問卦] 以前建中考上台大大氣科學的pr多少啊?3
[問卦] 謝宜容在那年紀算正妹嗎?24
Re: [新聞] 獨家》新任勞動部長洪申翰出任 王義川遞7
[問卦] 哇操勒比特幣99000了71
[爆卦] 泣台想抹藍謝宜容 黃益中爆:她藍綠通吃7
[問卦] 公務員全面配發密錄器,有搞頭嗎?