Re: [問卦] 繁簡轉換程式為何面麵、后後不分?
※ 引述《reppoc (稍會)》之銘言:
: 我知道是因為繁體的後=簡體的后字
: 繁體的麵=簡體的面字,
: 簡體轉繁體時,
: 明明只要把所有有關字詞取代成正確的就好,
: 也沒多少個特例,
: 繁簡轉換程式就是做不到,
: 常常看YT影片字幕都會看到面麵不分、
: 后後不分,強迫症發作實在讓人很不舒服。
: 為什麼都沒有要改?
: 卦?
因為書寫的中文不像書寫的英文,有用空格分開成一個個的token,
書時使用的人造符號比較少,以致後面要用電腦處理時困難較大,
具體來說,就是中文的tokenization會比英文的tokenization更可能造成不理想的效果
例如:
后面>後面(O)
皇后面對質問>皇後面對質問(X)
結論是,不能隨便拿份對照表來匹配,很危險
如果書寫中文有人造符號事先切割成「皇后 面對 質問」
那用簡轉繁工具可以用最簡單的對照表、依匹配原則先長後短的方式處理
所以簡體版的「皇后」優先配對到,對應成正體版的「皇后」
(當然如果pattern長度一致時該先匹配誰又是另一個問題)
整體來說,書寫英文的人造符號比中文多,所以不只簡繁互換,
在很多事情上,書寫英文要處理起來相對問題比較少,
例如英文句首必然是大寫,但中文沒有大寫,
句首必為大寫,可以是一個很好用的規則,
例如一篇文章中,.?!"'等符號,後面接的1或2個空格後,理應出現大寫(當然有例外)
書寫中文當然也有人造符號,標點符號就是一個,
早期中文書籍是沒有標點符號的,至少沒有統一的標點符號
反過來說,書寫英文多了空格,在電腦處理上比書寫中文方便許多,
但也是有人主張應該反璞歸真,
取消書寫體中的人造符號,例如空格及標點符號,讓書寫更接近口語,
也就是讓「文」更接近「語」,不過幸好這種言論太邊緣了沒人理
但由於書寫中文在第一時間使用的人造符號比較少,後續要彌補已經很難,
除非用AI處理tokenization有極高準確率,
然後文章要先經過AI的tokenization後再去簡繁轉換,
不然后後不符、面麵不分不可能解決
--
一勞永逸法就是在來源端就規範簡體鄉
民輸入後、麵。
一勞永逸法就是把當初提簡化字的被消失
不是啊 我看他們靈位也寫皇後啊
用錯太久就變笨了 變文盲
後后 翻一次看看?
認真回 推一下
12
[問卦] 台灣可以積極推廣日文 々 的書寫餓死抬頭, 相信會日文的人對於 々符號是不陌生, 是一個加在漢字後的疊字符號, 例如 「人人」寫作人々、 「時時」寫作時々,13
[問卦] 能直式書寫的文字中文書基本上直式、橫式都有 但英文書只有橫式 突然好奇 全世界這麼多語言 除了中文,日文跟韓文1X
[閒談] 若談2030雙語國家,應增英文申論題政府明年起刪除公文,增加英文的配分,我想如果可以實際點,要不然全部的社會人文科 目(如行政學、政治學和心理學…)全改英文出題與撰述,理由很簡單,文獻幾乎都國外 來的。若規定只能用全英文撰寫也呼應國際潮流,反正現今申論紙也是從左到右書寫,沒 有太大影響。 至於法科部分(如行政法,刑法等)則保留中文書寫,這樣才能反應考生的雙語程度,用6
[閒聊] 朱紫圖鑑的問題是不夠在地化嗎?之前不是一直在討論一個議題 就是翻譯成其他國家的語言是否要有在地化的元素 很明顯這次朱紫的圖鑑 以英文來說 英文的確都是橫式讀寫 英文沒有在直行讀寫的狀況 所以會出現當書本立直6
Re: [問卦] 幹嘛要有女字旁的「她」有人說英文也有He跟She的分別 那中文是不是顯得很落後 因為中文的讀音相同 在口語上根本無法分辨 因為不管是在口語跟書寫上都能分別1
Re: [問題] 在「真」外商工作的英文能力首先追求量化標準就錯了 你要找一個懂中文的外國人 你當然是找他來講中文聊天 不太可能在履歷上找通過中文檢定的 因為你從來沒考過中文檢定2
Re: [問卦] 為啥不當中國人就不能用中文?英文表示: 而且我們用的是楷書 正楷 標楷,只是加點標點符號和注音拼音而已,又稱正體中文 繁體中文。 真要講,台灣使用的中文從漢章帝開始就在使用,而且這種楷書幾乎都是上流人士 才會書寫。2
Re: [問卦] 「英文文法不重要,敢講就好」怎反駁?文法最大影響在writing,如果生活不用寫 很多英文文章那真的不太重要 去國外旅遊或度假打工這種藍領工作本來 需要書寫的機率就低,日常生活speaking 使用率遠遠高於writing1
[問卦] 英文書寫體國外常用嗎?小弟妹我的朋友啦 說之後要去歐美留學 要來練習寫英文書寫體 不然很丟臉 我多益只有200分不太清楚國外的事情啦
58
[問卦] 棒球的國際推廣程度為什麼這麼低?38
[問卦] 領基本工資,有辦法存活嗎= =...?23
[問卦] 台灣棒球為什麼就是打不贏日本棒球?24
[問卦] 澳洲有可能一局拿9分嗎?80
[問卦] 勞發署謝分署長本週會回去嗎會秋後算帳嗎?33
[問卦] Chinese 的中文是中國還是中華?90
Re: [新聞] 嘆民進黨欠他很多! 余天:曾說要給華22
[問卦] 綠鬣蜥很可怕?76
[問卦] 你們覺得台灣隊最後會拿第幾名啊26
[問卦] 跟棒球比,台籃根本就是垃圾吧?22
[問卦] 找一部主角老是亂丟盾牌的片13
[問卦] 日本為什麼沒派大谷翔平&山本由伸?17
[問卦] 台籃是不是台灣體育最大的笑話?18
[問卦] 羽球 棒球 桌球 籃球 發展順序 你怎排?17
[爆卦] 中國科學家讓薛丁格的貓活了23分鐘20
[問卦] 在台灣不看棒球會有多邊緣?18
Re: [新聞] 目睹爸爸砍死媽媽!彰化9歲兒「絕望顫抖17
[問卦] Beat It 是MJ最紅的歌嗎?19
Re: [問卦] 綠鬣蜥 抓一隻500元 一晚400隻 比醫生賺17
[問卦] 當年SHE唱“中國話”有多震撼?38
[問卦] 明天會贏古巴證明實力嗎?16
[爆卦] 台灣隊晉級世界12強棒球賽複賽!!!12
Re: [問卦] 劉寶傑是個爛貨?7
[問卦] 古巴棒球跟日本不分上下?10
[問卦] 12強是不是只有亞洲在瘋而已14
[問卦] 12強目前為止您給中華隊打幾分?97
[爆卦] 瘋啦 曾頌恩二壘安打 兩分回來啦12
[問卦] 你們講的綠什麼蜥的中間怎麼唸5
[問卦] 可以先恭喜中華隊進入四強吧13
[問卦] 蝦皮道教和合秘法是什麼(圖