PTT推薦

Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」

看板Stock標題Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」作者
aPplAus
(燦爛)
時間推噓18 推:19 噓:1 →:11

原文恕刪

小弟剛好最近有跟到一些台灣LLM的發展,可以補充一下關於模型的部分。聯發科的研究單位聯發創新基地,做語言模型有一段時間了,之前有一版Breeze-7B模型,發佈了一篇技術論文放在arxiv:

https://arxiv.org/pdf/2403.02712.pdf

論文提到這個模型是從mistral-7B 繼續訓練而成,花了7000小時的H100,灌了650GB的data。如果有一半是中文,325GB,也灌了超過1000億漢字(3bytes=1word),其實很多了啦。

然後Breexe是從Mixtral訓練而成,是更大一級的模型,論文好像還沒出,但很多公司都有不同大小的模型,做法應該不會差太多(?)。最近有開放API試用:

https://huggingface.co/MediaTek-Research/Breexe-8x7B-Instruct-v0_1

跟ChatGPT的比較,最重要的點應該是,像Breeze-7B這種已經開源的模型,對能架伺服器的公司來說,是用越多越賺;跟token收費的ChatGPT 用越多越貴截然不同。Breexe不知道會不會開源就是了。

達哥的部分,沒有親自用過,但有認識的人用過。基本上就是平台,然後有一些功能,像是讀pdf等等。就把AI推廣給更多人的東西,應該是不錯啦。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.35.85 (臺灣)
PTT 網址

stlinman 04/10 20:42開源的 Breeze-7B 我是玩一下過,感覺還不錯!

stlinman 04/10 20:43

tomdavis 04/10 20:43推介紹!

addy7533967 04/10 20:48推推

xm3u4vmp6 04/10 20:50一看到h100 直接冷掉 一半人根本玩不起QQ

Sixigma 04/10 20:52做隔壁專業的,好奇這樣子也會有 emerging ability

Sixigma 04/10 20:52嗎,其實它變單一語種而且是繁中,和原始模型不能算

Sixigma 04/10 20:53同個東西了吧,而且英語的普及度又遠大於繁中,很多

Sixigma 04/10 20:54問題會受限吧,那個benchmark和GPT3.5也差一截

damn1120 04/10 21:00可以幫文組翻譯嗎 救命-.-

stlinman 04/10 21:05重點是企業設置私有AI模型運用,要能合規法循。所以

stlinman 04/10 21:06繁中未來還是有一定的市場可以開發。

turndown4wat04/10 21:08這樣發哥明天是漲還是跌?

avali 04/10 21:15聯發哥2000

Morphee 04/10 21:21這東西開發跟上好處很多 值得值得

Morphee 04/10 21:21受限沒關係啊 跟上就好

bj45566 04/10 21:29Mistral AI 這家法國新創有前途啊,微軟都要琵琶別

bj45566 04/10 21:29抱了

bj45566 04/10 21:30發哥有眼光

napyang 04/10 21:35個人覺得繁體中文最強的開源就是breeze 7B了,回答

napyang 04/10 21:35的都滿好的。

fukku100 04/10 21:56特點除了繁體,可以針對臺灣的內容回答得不錯

Isopod 04/10 22:00達哥也不是功能啦,大部分就是挑好model然後寫好pro

Isopod 04/10 22:00mpt來做各種事情

coffee112 04/10 22:04推推

Ken52039 04/10 22:05未來股王

stevegood 04/10 22:41講實話工作上能用很不錯

wayne0530 04/10 23:06繁中最大資料庫,是否能用ptt內的文章來灌進去訓練

Surrey00 04/11 00:29推推

qwe78971 04/11 01:19果然是拿開源拿來改== 給我一台H100 我也行

greatwu 04/11 07:22聞西,要你命3000,訊號來了