[轉錄] Chatbot正加速華語文明崩解
1.轉錄網址︰
※ 網址超過一行 請縮網址 ※
https://www.upmedia.mg/news_info.php?Type=2&SerialNo=171610
2.轉錄來源︰
※ FB公眾人物、FB粉絲團名稱、其他來源 ※
upmedia
3.轉錄內容︰
※ 請完整轉載原文 請勿修改內文與編排 ※
中國長期箝制言論,卻又壟斷了全球華語出版市場。在牆內,大量符合北京意識形態的文本被用來訓練Chatbot,成為十億網民的知識來源,而網民貼文復成機器學習的素材,形成劣質資訊的惡性循環,加速華語知識封閉化與極端化。牆外,用華文訓練ChatGPT也出現偏誤,易使全球華語人受北京政治狗哨影響。由於語言會限制知識取得管道與內容詮釋,台灣應加速「英語與母語」雙語教育,以維護開放多元之民主價值。
大型語言模型的軍備競賽
近來ChatGPT, Google Bard, Meta Llama等大型語言模型的軍備競賽在商業著作權、教育學術倫理、政治宣傳、選舉干預、社會平等上引發疑慮。過去以Twitter訓練的
Microsoft Tay 在24小時內學會厭女與種族歧視。Meta BlenderBot 3 花一週學到反猶太、川普式極端言論。ChatGPT 則指出白人男性才能成為優秀科學家。史丹佛大學教授也示警 Chatbot會衝擊人與人的信任關係。重之以安全疑慮日增,矽谷業界更公呼籲開暫停超過GTP-4技術之模型開發6個月,以免競賽失控。
然而相較英語,華語訓練模型爭議更大:華語資料多樣性低且品質堪慮。許多標記的原始資料皆為審查過的文本。美國之音報導,用華語詢問天安門事件時,ChatGPT回覆「中國政府沒有發布相關信息,所以我們不能切實了解情況」。自由亞洲電台詢問ChatGPT有關達賴喇嘛、白紙運動時發現偏北京敘事觀點。路透社更指出,百度Ernie bot拒絕評論涉及習近平的提問。中國言論審查,已降低華語知識原創與多元。這些文本訓練的AI無可避免反映中共意識形態與偏誤,造成「垃圾進,垃圾出」。在「理想狀況」下,阿里巴巴的通義千問、百度文心一言會被訓練產生如新華社般官宣內容。但現實是,機器學習總有意外結果,常複製或極端化既有之偏誤。
華語文明先天不足、後天失調
華語文明先天不足,幾千年歷史卻從未發展出「民主」與「科學」。蔡元培認為,科舉制度比罷黜百家更有效箝制思想,將知識份子全吸引到科舉這座「獨木橋」來。科舉看似擇優取才,但因試題以儒家經典為主,使實際篩選到的人都是最符合君王意識型態者。陳獨秀與魯迅更批判儒家與封建皇權的共生關係。正因語言和思想密不可分,故胡適倡議文化革新「全盤西化」的首件大事,就是改革語言推動「白話文運動」。
華語文明更後天失調。中共長期鉗制言論自由,大量文本受官方與作者自我審查以符共黨思想。即便2008年國力日盛,仍難容劉曉波等人《零八憲章》倡議。「習總加速師」上台後,華語審查與政治宣傳變本加厲,壓制獨立思考與批判言論,致使中國科技發達,科學精神闕如。2020年李文亮根據醫學證據示警卻被官方強迫簽悔過書,無異於十七世紀宗教法庭令伽利略寫懺悔書。紐約時報更指出,中國年輕一代正失去表達自我的能力。中國華語知識的創新與多元,較之百年前五四運動不進反退。德先生與賽先生依舊被拒於牆外。
惡性循環的人機互動
不幸的是Chatbot的出現,使華語先天不足後天失調的困境更加嚴峻。人在訓練機器,但機器也在訓練人。數位極權下人工智慧內容生成(AICG)的人機互動,惡性循環乃無可避免:大量經審查文本被餵給AI,AI的輸出則成為十億網民的知識來源,網民的意見內容復成機器學習素材。長此以往,使牆內的知識循環囚困在封閉迴路,漸如死水。加速華語文明崩解。擁有全球12億活躍用戶的微信,更透過演算推薦系統,讓客製化的洗腦與大內宣投放更精準有效。作為第二大語言,華語的知識單調化與極端化對人類文明非好事。
封閉知識對民主多元的戕害
語言預設世界觀,人類也不斷將文化價值編碼進語言。華語過去受封建儒教影響,當代則受中共價值主導。全球14億華語人口以繁體書寫者約佔2%,不受思想審查者僅1.7%。在美國,簡體中文圖書在校園佔壓倒性多數。這些文本影響了五百多萬華裔美人的鄉愁認同與知識來源。單一化的價值論述除加深刻板印象,易使華人受習近平的政治狗哨與「中華民族偉大復興」號召。例如澳洲全國63%民眾認為中國是安全威脅,但澳洲華人卻僅28%贊同。中共也將言論審查擴展至海外,除邀請台灣教科書出版社訪華、誘捕出版社總編輯,更用手機apps監控美國華人言論。近日聯邦調查局(FBI)以華語呼籲在WeChat上受到網路跟踪與騷擾威脅的華美人報案,積極打擊中國跨國鎮壓與海外警察,以維美國國家安全。
習近平壟斷華語知識的全球戰略,亦是台灣嚴峻挑戰。牛津大學期刊的認知戰研究指出,中國以social bot操弄台灣輿論與選舉對立。而牆內雖看不到維基百科,北京卻積極修改繁體中文詞條以滲透學生與年輕人的知識學習。在台灣,只懂華語者的網路搜尋與可參閱書籍等知識來源,遠較懂英語者少。對華文媒體的外電譯文亦無查證能力。在大量簡轉繁的內容農場入侵下,信念與價值判斷易受單一語言操弄。蔡政府2030年雙語政策之優點,是將英語提升為通用語以擴展知識開放多元。惟其盲點在未檢討蔣介石殖民時期的華語地位,不利台灣各母語之復振與公平性,無法避免過去以華語為母語之族群的語言特權重演。
廢除華語之通用語地位乃大勢所趨
台灣本不通行華語。1915年國勢調查,台語是全島82%總人口的母語和87%的通用語(2020年主計處統計,台語仍是86%民眾的次要或主要語言)。戰後白色恐怖將全島變成再教育營,台人被改造成中國人,被迫說華語。「山地語」、「閩南語」等歧視稱呼也開始流傳,蔣家黨禁報禁,較之中共文字獄不遑多讓。但台灣民主化後,華語即國語的不義遺緒卻未曾檢討,使部分民眾仍陷威權時期華語僵化的思考窠臼,不利民主的價值多元與知識開放。中國數位極權崛起後,更將原本知識溝通與情感交流的語言媒介,轉化成假新聞與仇恨動員的武器,逐步侵蝕民主社會賴以運作的互信基礎。
因此,與其和中國在AICG與華語知識體系進行軍備競賽,台灣應從根本做起,以語言改革鞏固民主價值。在政府文書、各級學校教材、軍隊加速以英語為主要語言。利用國際貿易、學術合作、美軍協訓等契機,逐步廢除華語的「通用語」地位。使華語和台語、客語、各原住民語、新住民越語等一樣同享平等地位。讓台灣民眾的資訊網路連上更寬廣的全球知識體系,以提高知識經濟的競爭力與對資訊戰的免疫力。同時善用諸如史丹佛Alpaca
7B等開源輕量模型來復振各母語。在可預見未來,方能維護多元創新與包容批判之民主價值。
4.附註、心得、想法︰
※ 40字心得、備註 ※
不只是崩解華語
更要讓中國在這個世紀成為古文明
成為古代猶太以色列王國
剩餘的人流浪幾千年
※ 「Live」、「新聞」、「轉錄」此類文章每日發文數總上限為3篇,
自刪與板主刪除,同樣計入額度 ※
--
……..
chatgpt本來就是用英文模式思考的
腦子壞了?
阿鬼你還是說英文吧
89
Re: [閒聊] 另一半很介意講話唸錯音其實比起發錯音,你老公的不尊重其實比較嚴重。你該先做的是先讓老公認清且尊重,其實華語並不算是你最能流利使用的第一語言。並不是所有人的第二語言都能流利到接近母語程度,這是正常的。你先生明明知道,卻還當做你應該都要會,其實是你先生的問題。可以先試著和你先生溝通這個問題,讓他能夠理解。不然你就試著日常用台語來溝通,避免用華語就可以繞過這個問題。 另外,其他的版友其實只是華語本位的思考太重。沒有意識到台灣有其他語言母語者,更何況是延伸出華語學習的困難。希望你可以不要因此對於自己的語言能力感到沒自信,你只是在被用母語程度檢視你的第二語言而已。不然你看那些版友如果去其他國家講第二語言,有多少不會每天都被人揪錯。 最後,使用「台語」這詞絕對不是種錯誤,而是用詞的一種選擇。「台語」是該語言使用者所稱呼的用語,而「閩南語」是後來政府由上到下刻意選擇推廣的詞彙,為了政治目的(與中國連結)所強迫推廣的。尊重別人不同的用詞,甚或政治立場,也是你們夫妻倆需要好好溝通的部分。並不是你先生說什麼就是對的,你自己也要有自信,站穩立場。 ----- Sent from JPTT on my Samsung SM-G781B.36
[轉錄] 吳欣岱@台灣基進:本土語言優先1.轉錄網址︰ 2.轉錄來源︰ 吳欣岱@台灣基進FB 3.轉錄內容︰20
Re: [寶寶] 兒子快兩歲不願意說話會回這篇是因為國台語交雜被誤解的情況太嚴重,在回覆之前推薦大家先看語言治療師對 雙語家庭的QA 以下國語我會改稱華語,因為台灣的國家語言不是只有華語,台灣也沒有法定官方語言 為什麼說華台語(或任一本土語言)交雜的情況被誤解很嚴重呢?1
Re: [問卦] 為何反對雙語國家的都是英文好的?想了想還是自己回一篇好了,想讓更多人關注到這個議題:台灣目前的雙語政策走向與本土語言復振發展的衝突 台灣目前的雙語教育走向是極度不利本土語言復振的,它名義上是英語和國語,然而這個國語卻大細漢獨尊華語,本土語言經過政府多年迫害打壓,乃至民間社會的消極保守,恐活不過50年(包括台語),如果強勢語言從一個華語變成一華一英,本土語言將更加邊緣化 2019《國家語言發展法》通過,台客原馬華手皆應為官方語言,現在無魚蝦嘛好,有較贏無的折衷實際作法,可改成多語政策,讓英語與台灣語言並行 但其實經過長期的華語霸權,如果將華語的獨尊超高比例降低來補助危機在即的本土語言,華語本身有環境不會衰退,本土語言也能更快速更健康地恢復成正常的語言,這才是更符合人道的更優解 語言不只是溝通而已,是儲存文化的載體, 是文化的根基,政府不應繼續糊塗執意,棄養自滅了,應該要動起來,失去了,就再也回不來了,新加坡就是追求英語到本土語言滅亡的例子, 他們政府現在再努力挽回,也已風中殘燭,大勢已去了15
[討論] 母語必修政策合理嗎?目前文化部及教育部將國家語言正式名稱暫定為台灣華語、台灣台語、台灣客語、閩東語(馬祖語)、台灣原住民族語、台灣手語,原住民族語包含16族42個方言。 國家語言發展法(語發法)通過,111學年起中小學生必修本土語言,包括閩南語、客語、原住民語、馬祖的閩東語和台灣手語 為什麼所謂 華語 不是母語? 那確實是台灣有些人的母語18
[寶寶] 三語家庭是否讓孩子提早學英語各位爸媽們大家好: 先生是外國人,我與他使用彼此的語言與孩子們對話,我們之間則使用英語,目前大寶三歲也懂得分辨面對不同對象使用不同語言。 由於先生的語系使用拉丁字母(波士尼亞語-斯拉夫語的一支),許多詞彙與英語共通或相似, 例如英語字母J, 波士尼亞語發“ㄧ”的音 因此我們顧慮孩子們學先生語言時會與英語混淆,想說暫時別刻意教,但孩子們基本上也是處在英語環境,且偶爾會看英語卡通17
[心得]《語言學家解破台語》:心得筆記部落格圖文心得: 你會說台語嗎?先自首,身為打狗子弟的我會說,但稱不上「輪轉」。今天想介紹《語言 學家解破台語》這本小巧的台語文法書。別被「文法」兩個字嚇著了,不管你會不會說台 語,作者有趣又有料的解說絕對會讓你腦洞大開! 當初在三餘看到此書就被封面的「囂俳(囂張)」文案所吸引:11
Re: [閒聊] 讓孩子練習台語原本我兒子都在聽牽囡仔e5手 來聽囡仔古跟故事雜菜羹,最近他迷上一個布袋戲Podcast -- 布袋戲,講予恁聽 我自己覺得非常好聽,長知識又好笑,氣口又很好,比較沒有被華語文法影響,可以聽到8
Re: [新聞] 雙語國家發展中心草案遭反對 陳建仁賴神當閣揆時,推動務實台獨的其中一個重點,應該就是讓台灣人盡量減少使用中文。 這是繼108年課綱之後,民進黨政府的一項重大教育政策,讓英文老師來教數理科的專業。
爆
[討論] 王義川 幼童宣講 真的有人覺得ok嗎75
[討論] 黃國昌通過的憲訴法有一條寫公布即刻生效59
Re: [討論] 高雄最近幾年有變好嗎38
[討論] 藍白為什麼這麼怕倒閣呀65
[討論] 藍白軍師黃揚明說不副署,在野黨可提釋憲34
[討論] 藍白這麼下幹? 圍起來打?29
[討論] 倒閣對藍白的好處?31
[討論] 辭職信被集體無視,柯文哲怎麼辦?23
[討論] 台南,高雄,藍營還有心要選嗎?28
[討論] 不好意思 318當初跟蕭旭岑密會的是誰34
Re: [討論] 沒用的60席,不釋憲也不倒閣 還能幹嘛 ?爆
[黑特] 罷免徐巧芯 李彥秀連署啟動78
[討論] 認真問不副署,藍白真的不敢提倒閣嗎 ?22
[討論] 前天國家快毀滅,今天玩到非常累17
[討論] 蘇巧慧:三讀版本害新北少了200億20
[討論] 賴清德現在每天都睡不好吧~~21
Re: [討論] 藍白軍師黃揚明說不副署,在野黨可提釋憲19
Re: [討論] 藍白軍師黃揚明說不副署,在野黨可提釋憲X
[轉錄]黃國昌FB DPP兩面手法 癱瘓國會失敗交易23
Re: [討論] 藍白是卡bug故意癱瘓憲法法庭嗎?18
[討論] 夜壺是近期後座力最強的形容詞嗎?18
[討論] 目前反財劃法的首長14
[黑特] 請政治廚放過MyGo!!!!!13
[討論] 現在藍綠誰會比較急12
[黑特] 柯文哲簡直走向阿扁後塵!23
Re: [討論] 認真問不副署,藍白真的不敢提倒閣嗎 ?10
Re: [轉錄]黃國昌FB DPP兩面手法 癱瘓國會失敗交易12
[討論] 好險賴清德在蔡英文後面接任9
[討論] 民進黨不喜歡的法案就是惡法11
[討論] 我終於知道黃國昌為何立法都不通過了