Re: [問卦] 聽說中研院AI花300萬?
※ 引述《sxy67230 (charlesgg)》之銘言:
: ※ 引述《Fortran (Fortran)》之銘言:
: : 如題
: : 本肥好奇,若這樣簡轉繁中,直接套用中國模型,應該不用花到300萬吧
: : 頂多就換個皮,簡轉繁中,連一個工作天都不用,1~5萬就夠了
: : 剩下的經費都....?
: : 有卦?
: 阿肥外商碼農阿肥啦!
: 推廣一下微軟Azure服務,這邊試算開一張A100機器折合台幣差不多8萬台幣/月,平均一: 天3000不到,中研院應該夠划算了,也算是現在市場公道價,反正都用開源簡中數據了,: 放Azure訓練也沒什麼資安問題,而且要撈90GB的模型檔案不到十五分鐘就載完了,Azure: 又快又好用。
: Llama現在一堆微軟、Nvidia都有釋出開源訓練框架,無腦載套件下來照教學拉下訓練con: fig就可以開始跑,推論也直接用Nvidia的inference框生成2048個字不到0.7秒不到,最: 多給你開發Gradio的介面框三天好了,這樣一天給研究人員一人五萬/天,十五萬加上Azu: re 8萬就二十萬不到耶!
: 三百萬真羨慕,我們政府很有錢吶!
: 嘻嘻
https://ppt.cc/fZf2Sx
中研院聲明專區
本院資訊所表示,CKIP-Llama-2-7b 並非中研院官方或所方發表的研究成果,而是個別研究人員公佈的階段性成果。此非臺版chatGPT,且跟國科會正在發展的 TAIDE 無關。
CKIP-Llama-2-7b 的研究目標之一是讓 meta 開發的 Llama 2 大型語言模型具備更好的繁體中文處理能力。這項小型研究僅用了大約30萬元的經費,將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另也包含臺灣的碩博士論文摘要、來自中國開源的任務資料集 COIG(CHINESE OPEN INSTRUCTION GENERALIST)、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答;在github網頁上也據實說明。
由於這是一項個人小型的研究,各界對該模型進行的提問測試,並未在原始的研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),模型產生內容出乎預期,也是未來要努力改善的地方,研究人員今(9)日已將測試版先行下架,未來相關研究及成果釋出,會更加謹慎。對相關研究的成果,公開釋出前,院內也會擬定審核機制,避免類似問題產生。
==
原來只值 3 秒鐘啊。
--
套皮就拿30萬也是很好賺啊
30萬就五個月的薪水 差不多啦
從中國抄來的資料庫 嘻嘻 30萬
個人研究發新聞?
欸欸欸 出包了 誰有在研究AI,拿來擋一下
啦
又是個人的問題
55
Re: [問卦] 中研院自己做的大型語言模型怎麼了?阿肥外商碼農阿肥啦! 昨天晚上都在跟獵人直播來不及趕上大型翻車現場,這邊中午看hugging face hub還 可以進去,但現在已經進不去了。 這邊阿肥就直接說,基本上現在所有中文開源語言模型除了少數像chatGLM這種中國比較 早期做的自己完全從零訓練的語言模型外,大家都是從meta 的llama魔改的,差別在於預34
[討論] 中研院繁中LLM被爆直接拿對岸的來套!中央研究院詞庫小組(CKIP) 中研院資訊所、語言所於民國75年合作成立 前天釋出可以商用的繁中大型語言模型(LLM) CKIP-Llama-2-7b 以商用開源模型 Llama-2-7b 以及 Atom-7b 為基礎23
Re: [爆卦] 中央研究院詞庫小組大型語言模型阿肥 中研院資訊所早已回應了 研究人員直接說這是幻覺~ 沒你說的這麼高端解釋啦~5
Re: [新聞] 中研院 AI 大翻車!繁中大型語言模型 CKI那個 我記得以前的新聞是這樣講的 防止簡體版AI偏見,產官學聯手開發繁體版AI語音模型 聯發創新基地負責人許大山博士表示: 「大型語言模型是近年來人工智慧技術進步的亮點 ,更是未來進步不可或缺的基石。聯發科技向來重視創新及科技發展,此次結合中研院及 國教院,成為台灣極少數能訓練大型語言模型的團隊,既發展自主訓練大型人工智慧模型5
[閒聊] MarioGPT 無限產生新的瑪利歐遊戲關卡哥本哈根資訊科技大學(IT University of Copenhagen,ITU)的團隊發表一篇全新論文 及相關的 GitHub 頁面,展示一種運用 AI 和程式產生瑪利歐遊戲的新玩法,他們稱之為 「MarioGPT」。 MarioGPT 以 GPT-2 模型為基礎,儘管名稱向 ChatGPT 致敬,但它並非對話形式的人工 智慧。GPT-2 為大型語言模型(Large Language Models,LLM)無法理解瑪利歐遊戲,研3
[AI] NVIDIA 繪圖研究推動生成式 AI 前瞻發展NVIDIA 繪圖研究推動生成式 AI 前瞻發展 預定八月在電腦繪圖大會 SIGGRAPH 發表相關 論文 (GNN 記者 紙箱 報導) 2023-05-03 18:21:50 #3dX
Re: [新聞] 國慶日變10/1!中研院認了「AI語言模型」不知道這個話題有什麼好延燒的,一個數據庫而已。 在中文環境,台灣本就貢獻有限,要研究,就必不可少用到對岸資料,重要的是語言模型的 表現怎麼樣。 至少從實際來看,回答邏輯通順,條例分明,也能準確理解提問的意涵並給出準確的答案, 這不就夠了嗎?2
[討論] 政客真的毋湯中研院、工研院、中科院,傻傻分不清楚 Posted on December 29, 2020 by Ronald 在和許多人聊天的過程當中,發現許多人不了解中研院、工研院和中科院的差別。我爸媽 不了解也就算了,但居然年紀相仿的交大畢業的電子電機博士聽到我說「我在中研院的實
爆
[爆卦] 球員兼裁判,衛環立委陳宜民接疾管署標案46
[問卦] 日本成人片在路上拉人拍攝是真的嗎?爆
[問卦] 辜仲諒說他3000萬可以馬上發 是開玩笑嗎92
Re: [問卦] 謝宜容安全下樁了嗎?26
Re: [新聞] 自爆做棒球球版涉賭被譙爆 館長:台灣人13
[問卦] 台灣辦一個甲子園有搞頭嗎?22
[問卦] 陳傑憲的髮型叫什麼阿?20
[問卦] 姓賈取什麼英文名字?28
[問卦] 魏德聖會怎麼拍這次的12強?20
[問卦] 八卦版要永遠當老二了嗎24
[問卦] 張誌家全盛時期是不是蠻厲害的???18
[問卦] 坐捷運看到這種的不會很害怕嗎?怕的莫點16
[問卦] 台灣第一胎的平均年齡是31.5歲26
[問卦] 衛福部在偷開大門嗎16
[問卦] 台灣米在日本賣光光13
Re: [新聞] 自爆做棒球球版涉賭被譙爆 館長:台灣人16
[問卦] 陳傑憲有機會選總統嗎爆
[問卦] 陳傑憲身高173交得到女友?14
[問卦] 沒人發現給小孩看電視根本就沒怎麼樣嗎!13
[問卦] 7-11這份量打著溫沙拉賣89認真?27
[問卦] 棒球2028奧運台灣隊奪金會暴動嗎?54
[問卦] 正名運動當時都是哪些人在反的?13
[問卦] 台鹽竟然漲價25趴19
[問卦] 林昱珉才21歲28
[問卦] 英國是世界上最偉大的國家不服來辯!6
[問卦] 只養寵物的人為什麼不直接養小孩?8
[問卦] 治安是多爛連水壺都有人要偷12
[問卦] 違停怎麼解?7
[問卦] 為什麼台灣隊要搭China Airlines?9
[問卦] 超商啤酒有推哪款嗎?