PTT推薦

Re: [閒聊] 起點網站部分文字無法轉繁體

看板CFantasy標題Re: [閒聊] 起點網站部分文字無法轉繁體作者
linzero
(【林】)
時間推噓 6 推:6 噓:0 →:3

: 有問題的會變成這樣
: https://imgur.com/AOI8K6K


: 推 BenShiuan : https://i.imgur.com/dmI1ooe.jpg 看起來不像正常 10/31 14:41

圖 起點網站部分文字無法轉繁體

顯示 伴隨着
字碼 伴隨#58016

58016轉16進位是E2A0

Unicode碼裡E000~EFFF是私人造字區
也就是大家遵守的規範裡沒定義
這區是讓人自己私下定的
這區的字如何顯示是看個別系統而定

比方把 冏rz 擠成一個字的寬度字形圖像
定義成E001
這樣字碼是E001(#57345)就會顯示成 冏rz
但在別的系統就不是
可能無法顯示(不支持這字碼定義)
或者顯示別的(比如別系統定義成 ^_< )

應該是起點拿去定義中文字用
而起點網站系統有對應字
在起點系統上可以被正常顯示
而換個系統會有問題
(所以有些盜版網站會有顯示 #....或看來像是亂碼 的情況吧)

簡轉繁的機制
是把UNICODE碼裡的簡體字轉成UNICODE碼對應的繁體字
而這區自訂區的字,簡繁轉換機制無法處理
仍然用該字碼(像E2A0)
而這字碼是靠起點系統顯示的
所以簡繁轉換用自己的字形
起點自訂的字用自己訂的字形
且這自訂字形看來對應的是簡體
才造成兩者簡繁、字形不同的情況吧



不過 着 這個字UNICODE碼裡也有
不知起點為何要另外定義

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.31.194 (臺灣)
PTT 網址
※ 編輯: linzero (61.230.31.194 臺灣), 10/31/2020 21:47:51

johnny12728 10/31 21:58為了防盜版?

linzero 10/31 22:09有可能

LeonBolton 10/31 22:11所以有些就會出現缺字?

serene0414 10/31 22:23感謝,不過如果是起點,又怎麼有些書有有些書沒有?

我猜也是防盜版 然後熱門新作把一些字轉成對應的自訂新字 等過段時間 盜版都盜的差不多後 再轉回原本正確的UNICODE碼 甚至這個自訂新字還可以隔段時間再亂數更換 讓盜版網站自己無法用程式把這對應新字轉成正確的原本字碼 除非盜版網站手動查詢尋對應新字 但盜版網站有的要省人力都是程式自動盜的 可能沒那人力人工查詢 甚至轉換編碼可以把會員帳號弄進去 這樣盜版網站如果原封不動地把這些碼也搬過去 這樣起點也可以查到這盜版是哪個VIP帳號的

※ 編輯: linzero (61.230.31.194 臺灣), 10/31/2020 22:34:39

serene0414 10/31 22:34原來如此,那看來以後繁簡轉換都會這樣了......

tv1239 11/01 01:55有點意思的方法XD

fr75 11/01 08:27原來如此

aiglas0209 11/01 16:08之前不是說某些又大又全的站背後根本是起點嗎@@

aiglas0209 11/01 16:08不然新人的書才幾萬就被盜也不知怎麼那麼閒