PTT推薦

Re: [問卦] 機器學習有可能讓我們懂馬雅文嗎

看板Gossiping標題Re: [問卦] 機器學習有可能讓我們懂馬雅文嗎作者
stmilk
(我男的)
時間推噓 1 推:1 噓:0 →:11

其實是有機會啦,說讓機器理解應該目前是不可能,但是讓機器幫助人們理解應該是非
常可行的。
就你提到的文字的特性我目前想的到的有以下一些可以被機器學習應用的性質:
1. 文字都是方塊
2. 文字有拼接特性
這些影像辨識就很有用啦

我們有一堆 data 文章(我想像的文章是像埃及壁畫那樣,一張畫裡有許多文字,並在
描述一個事件),可以抓到文章大概的方向。於是藉由影像辨識去分析這篇文章中某個
文字出現的頻率。
接著我們就有文章-文字的對應。這個方法理論上應該可以非常巨大地幫助猜文字的意義。不用自己慢慢翻文獻,東西馬上生給你XD

或是我們可以把一個已知是拼接的字分開,直接應用上影像辨識去找所有字中有這個部
分的字。這也可以很快地整理出一堆有的沒的。
也可以用一樣的想法,去把一個不知道的字分開,去搜索看有沒有類似拼接的字,有就
是拼接,沒找到可以猜可能是融合字。

其實能延伸的地方還很多。比較簡單的像是上面的方法文字是用一個方塊做單位,可以
延伸變成兩個以上的方塊做單位,都能夠快速找到對應出現的地方以及頻率。

以上是我想像中的解讀方式,然後簡單想一下給一些機器學習可以幫忙的地方XD
----
Sent from BePTT on my Sony XQ-AU52

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.218.218 (臺灣)
※ 文章網址: https://www.ptt.cc/Gossiping/M.1615653479.A.5D4

ah93760903/14 00:39樓下 馬雅人

tmacfly03/14 00:48我覺得比較可行的方法是詞向量 而不是影像辨識欸

stmilk03/14 01:00詞向量問題在我們不了解這些字的意思吧,那個是上那個是

stmilk03/14 01:00下也不清楚呀XD 我的理解啦

stmilk03/14 01:04而且我的目標取向是由人類理解文字,在馬雅文字的規則沒

stmilk03/14 01:05確定下前,用詞向量的概念(上下文字與中間的字的關係)

stmilk03/14 01:05去解可能會有問題。我的詞向量是用word2vec的模型,你應

stmilk03/14 01:05該是說這個詞向量吧XD

stmilk03/14 01:08我其實有思考用nlp,只是我是覺得一般nlp的規則都不可行

stmilk03/14 01:08,畢竟那都是在我們相當了解文字,用這些規則去計算可能

stmilk03/14 01:08意義的分佈或分群。這對未知的文字理論上有問題的機會是

stmilk03/14 01:08非常高。