PTT推薦

Re: [爆卦] 中央研究院詞庫小組大型語言模型

看板Gossiping標題Re: [爆卦] 中央研究院詞庫小組大型語言模型作者
derekhsu
(浪人47之華麗的天下無雙)
時間推噓 1 推:5 噓:4 →:7

※ 引述《gaymay5566 (feeling很重要)》之銘言:
: : 從頭到尾中研院就沒有隱藏這件事,完全不知道前面好像發現什麼新大陸一樣。
: 看到這篇真的龜懶趴火
: 語氣還真的他媽的大啊 敢嗆鄉民去上LLM課程啊
: 誰不知道LLM的正確率一定會有誤差?
: 現在的問題是我國最高學術研究機構中央研究院直接拿對岸LLM套
: 且直接用opencc大量將簡體資料轉繁體資料!
: 這很嚴重啊
那是政治上的問題,我說的是說中研院直接拿Atom-7b模型來用的這件事

我想你大概沒有真的去比較過 Atom-7B跟中研院型的一部分
https://chinese.llama.family/

你用中國的模型去問「台灣是中國的一部分嗎?」它的回答是台灣政治上是一個獨立
的國家
https://i.imgur.com/0QIwKLT.jpg

圖 中央研究院詞庫小組大型語言模型

中國是否擁有台灣的主權?
https://i.imgur.com/ENwsZef.jpg
圖 中央研究院詞庫小組大型語言模型

蔡英文是台灣人還是中國人
https://i.imgur.com/DZjBeAG.jpg
圖 中央研究院詞庫小組大型語言模型

六四天安門的真相是什麼?
https://i.imgur.com/G1EleiR.jpg
圖 中央研究院詞庫小組大型語言模型

這個模型的研發團隊為何?
https://i.imgur.com/DXTrDM8.jpg
圖 中央研究院詞庫小組大型語言模型

各位可看一下,原本Atom 7B的模型回答的問題都還算中肯而且更完整,而且也沒有什
麼硬要把台灣變成中國的一部分

也就是說,這個模型在被中研院finetune之後變成了一個賣台製仗

拜託,千萬不要說這是簡轉繁或是直接拿結果來交差好嗎?

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.182.19.98 (臺灣)
PTT 網址

allahuakbar 10/09 14:18你想說什麼 敵人在本能室嗎

我只是說,中研院絕對有finetune過啊,因為它的回答跟Atom-7b明顯不同啊

SiFox 10/09 14:19所以嘴巴喊抗中保台 其實...我不敢想 嗚嗚

※ 編輯: derekhsu (175.182.19.98 臺灣), 10/09/2023 14:20:29

Qinsect 10/09 14:20把中國的模型進行思想改造

Osmium 10/09 14:20我們中出了叛徒

renna038766 10/09 14:23中研院就不能反串做做效果嗎 好了啦

SiFox 10/09 14:23中國:我賣給你們的 Atom 7B 是乾淨的喔

lianpig5566 10/09 14:23我比較想知道他是拿什麼資料去微調

firose 10/09 14:24說白了他的意思是 tune 壞了

SiFox 10/09 14:24中國:少在那邊挑起爭端 誣賴我們

yesonline 10/09 14:25中研院網站就已經說了 "補強"繁中處理

gaymay5566 10/09 14:28以下是中研院CKIP-Llama-2-7b:

gaymay5566 10/09 14:28https://i.imgur.com/phwhfcl.png

圖 中央研究院詞庫小組大型語言模型

gaymay5566 10/09 14:28https://i.imgur.com/O1P6HpS.png

圖 中央研究院詞庫小組大型語言模型

gaymay5566 10/09 14:29https://i.imgur.com/cMnCbI8.png

圖 中央研究院詞庫小組大型語言模型

la8day 10/09 14:29套model都套不好

z2wen 10/09 15:45鬼扯