Re: [問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒閒著
看了一下原FB文內連結到的協同行為分析方法大公開的文章
裡面有AI Labs.tw的研究論文可以取得
Exploring Atypical Online Coincidental Behavior on PTT
不過要填姓名跟信箱就是了
花了一點時間看完了論文,基本上呢研究的方法沒甚麼問題
都是使用很基礎的Data mining 算法,consine similarity、tf-idf
其他看起來也沒有甚麼大問題,在clustering用的數學式是合理可以將族群分開的
唯一大概能說的就是在threshold的參數選擇上並沒有多加說明,這部分會有疑慮
裡面對於phi-coefficients設定>0.35的說明竟然是an expert-defined threshold
連引用資料都沒有,這要是碩士論文肯定被電飛
但本文重點不是探討研究方法,主要重點:
用得出的數據去探討結論這件事情很有趣,給不同立場的人看,會有不同的結論產生
而本篇論文的立場個人感覺超級偏頗,某方面來說是對的,換個角度想又覺得怪怪的
有興趣的往下看請搭配該網站得到的論文服用,就不截圖了
---------
以下是節錄翻譯
------------------------------------------------------------------------------名詞定義:coincidental users/group(協同用戶/組),大致上是指由演算法分群得出的
User grouping基本上有兩個規則
考慮UserPair(UserA,UserB)
1.一個小時內用同一個IP上線推發文
2.越常同時出現在一篇文章中,或同時沒出現越容易被分到一組
若一人在一篇文章中出現,另一人沒出現則降低phi-coefficient
以該文章敘述的數據,本人推敲大概是兩個條件符合一個就會被分到一組
-----------------------------------------------------------------------------
在論文中的圖3(a),該圖是熱點圖,顯示出了"所有"協同用戶在一天中的活動時間
通常是在下午兩點達到高峰,而圖3(b)則是與非協同用戶進行比較顏色越紅表示協同用戶相對比較常在這時段一起出現,藍色則相反
而這段得出的結論我蠻認同的,畢竟下午兩點就是防疫記者會召開的時間,所以關注疫情發展的人就會上來看/推/發文
-----------
論文的圖9,將不同的協同組分別製成熱點圖來看活動時間
可以看出,即使皆被分類為協同用戶,不同組之間的活動時間也是相差甚遠
-----------
圖12,
group 3 --- 67人 ---620則推文
可以看出這群人主要探討的主題皆圍繞在奧運以及與中國隊的對抗上
-----------
圖13,
group 11--- 25人 ---17338則推文
主題圍繞在乃木坂46,少部分有提到疫情跟疫苗
-----------
圖14,
group 18--- 26人 ---5854則推文
分為兩個部分
第一部分為使用負面詞彙指責DPP使用中國作為得不到疫苗的藉口
第二部分為奧運與中國的對抗上
----------
圖15,
group 19--- 19人 ---930則推文
在"國產"此一詞上擴展出"棒棒"、"受制於人"
是在諷刺地表達對國產疫苗的不信任與進口疫苗缺乏的不滿
而"穩到"
則是在諷刺台灣政府在疫情時的無效政策
---------
圖16,
group 32--- 15人 ---19450則推文
這組人最少卻有最多的貼文
基本沒有具體討論的主題,而只有具有攻擊性的侮辱詞彙,且大家用的詞彙都差不多
"他媽(Fucking)"
"肥宅(Fat nerds)"
"臺灣價值(Taiwan value)"
可以看到用這類侮辱來反映對臺灣處理疫情的不滿
然而這組對於中國的敵意卻是最強的
"臺灣統一中國"、"臺灣才是正統中國"
--------
另外比對圖9跟圖3,
可以看出當考慮所有的協同用戶時,看不出有明顯的活動時間
但考慮個別協同組時,可以看出群體表現出或多或少的模式傾向
雖然不是全部都可以觀察的出來(例如第3組)
--------
在本論文中,根據共用IP、活動時間、敘述,研究人員得出結論,這些模式不是隨機產生他們是有意識地,合力地參與了討論。
儘管無法證明其意圖是操控輿論,但研究人員找不到其他合理解釋說明這些行為具有正當性。因為他們與非協同用戶是如此不同。
--------
可以觀察到以下六種行為:
1.每個協同組有相似的活動時間
2.更喜歡參與推文而非發文,且有更高的煽動值
3.協同用戶們展現出較高的操縱模式
4.不同協同組展現出了不同的行為偏好
5.一些協同組只使用一個負面/操縱口號,而其他則使用多個或根本不用
6.不同協同組展現不同的敘述偏好跟詞彙選擇
--------
而在1985個事件之中,有880起非典型事件(這裡大概是指有協同用戶/組),約佔一半表現出了操縱行為,而且可能且確實發生在各種主題上,包括體育、商業、娛樂、政治等。
--------
節錄翻譯結束,以下感想
--------
好了,你各位阿
每天生活作息規固定時間上來PTT看熱鬧的鄉民
在這種算法上都很容易被歸類為協同用戶/組(網軍/公關公司?)
確實這種算法是有機會抓出網軍
但光看數據我就覺得這裡面的誤差肯定很大
討論奧運都可以被抓出來
奧運本來就是特定時間有特定選手/比賽所以會同時討論
人本來就會有自己的偏好,不論是行為還是愛好
八卦版基本上甚麼都可以討論
可能有人就想討論個奧運、地震發文告白、承認包莖,盜懶覺^Q^
在推文底下嗆人肥宅,嘴人媽媽
更何況在心理學上早就有研究表明人無意間會受到他人影響,而改變自己的行為模式
還有意見領袖,在各個論壇都會存在
常常會有人看到某個ID發文,底下一堆先推再說的,不然就是先給尊重
現在通通要被當作協同(認知)作戰的打手囉
建議杜先生請把論文中提到共用IP、且行為模式相近的帳號做一波整理
直接送往帳號部請他們確認是不是異常帳號
看到底有多少的網軍帳號可以抓出來
而不是用別的平台來影射PTT裡面很多中共內應
然後實際上在PTT上被抓出來的大部分都是塔綠班的內應喔
還有要不要做一篇協同作戰分析正面論述天天對塔綠班歌功頌德的
是不是跟罵政府的一樣會被你抓出來有共同行為模式呢?
整篇論文的結論竟然是
"雖然不能證明有在操縱輿論,但研究人員想不出來這麼做的正當性"
那我也懷疑有人在操縱大眾輿論,抹黑PTT,因為我想不出這麼做的正當性
--
這些人跟苦無不就一個樣 面對塔綠班就閉
嘴了
連引用資料都沒有,就不用看了
參數在Data Mining之類的數據科學超級重要的 有些情況下可以透過調整參數來得出相反的結果
一堆反串怎麼抓
簡單說就是包裝比較好的文字獄 說你五
毛就是五毛
結論很簡單討厭民進黨的都是中共同路人
就問你杜老爺一句,名單呢?
其實名單在他們提供的github上面是有檔案可以抓的 我是沒有抓啦,我這邊半夜想說閒來無事看他到底怎麼分析的 看完就馬上來發文了
※ 編輯: sami012985 (185.205.48.180 瑞典), 03/28/2022 13:20:29我比你更短的結論 苦無證據 先抹再說
推
可能想當網軍的創世神吧 ptt創世神名號沒價
那不叫研究,那叫專欄社論
值了
簡單一句話.我沒有證據.但是肯定是這樣
來八卦版本來就是來討論類似議題
影射最有殺傷力
舉手提問,請問論文只有研究八卦嗎?
其實以他的研究方式,研究前幾熱門板
也是會得到一堆偕同群組吧?
該篇研究只探討八卦版 個人認為套用到其他版大機率可以得出類似的結論
喜歡參與推文那也是因為發文限制較多
沒錯 很多因素都沒有考慮,單拿數字雲來說有人在協同作戰當內應 我只能說 非!常!奇!怪!
※ 編輯: sami012985 (185.205.48.180 瑞典), 03/28/2022 13:22:57抓到乃木坂46的網軍
靠腰 發文少臭了嗎
倚靠的就是 相信我之術
你太認真了吧= =
把PTT給的限制造成的影響當作觀察也是搞笑
超譯逐字稿 ZZZZZzzzzzz
抓蟑螂和瑋豐需要証據互相連結論証,
抹鄉民五毛只需要”感覺和苦無”
不要限制發文不要整天檢舉 那我還不發爆
先抹贏一半 選我正解
人的行為都會有模式可循的 不然社會科學
論文綠舔狗有正當性,收錢吹喇叭
就不用玩了 不能說有模式就是網軍阿
苦無證據,但我想不出正當性 所以你是協同作戰喔 啾咪><
但,就苦無證據:3
發文活動時間也是 會來看八卦板通常都是有點
感謝解答,那他這個研究方式一點用也
推用心
沒有,頂多抓出有同群人對相同話題
有興趣而已...
閒但得正經做事的時候 簡單說就是大家上班偷
懶時段 所以當然活動時間類似 這些根本屁話
而且論文內提到的negative slogans 很多根本就是塔綠班自己說過的話被拿來當梗用 玩梗也要被當作網軍,那請問那些鬧出這些笑話的是不是才是中共同路人
塔綠班網軍都已經被抓到被判刑 檯面上沒
有一個敢嘴的 笑死
正經坐在電腦前
參考一下公園阿北的聊天群聚
差不多的內容 每天準時開講
比起五毛 我覺得在八卦找到更可悲的現
9000萬的成果 可悲
象
就拿政府標案生些XX騙經費吧
也有可能是無辜的大學生或是碩士生 被教授找去做這種研究吧 個人看這篇研究的感覺是 應該有人生出基礎數據 然後讓人拿去大作文章
Holo 廚也是在西洽協同作戰的意思啦
,尤其開直播的時候
沒有錯啦
※ 編輯: sami012985 (185.205.48.180 瑞典), 03/28/2022 13:32:06原來如此
惡魔旅館如果每天定時發文,也可能
會判協同作戰
HOLO廚協同作戰...我被說服了
那些常在金城武文推文的是什麼人
冒充我的鄉民們 不過大家玩得開心就好 我沒關係的
※ 編輯: sami012985 (185.205.48.180 瑞典), 03/28/2022 13:33:42Ptt
噁心巴拉
算法
應該先用這個算法抓綠色網軍
我文組看不懂啦,反正你們都網軍啦
一個綠色集群都沒有公信力=0
杜真的是跌落神壇
holo廚笑死
綠色一堆用LINE成群刷推噓的
抓不到半個 好了吧 人工智障實驗室
這個研究八成是要拿去繼續申請經費的啦
,虧你還這麼認真
在國外念書 偶爾還是關心一下臺灣 OK8 反正科系也相關 看起來不會很吃力 倒是翻譯不是我強項 順便練習練嫌
※ 編輯: sami012985 (185.205.48.180 瑞典), 03/28/2022 13:43:08笑死 嘴台灣價值就是五毛 這個真的是鄉民
嗎做的研究嗎
先射箭再畫靶的研究論文 拿去跑政黑板看看
其實杜先生拿出來的演算法 其實基本上都正確 如我文章所述 但就真的在結論上讓人感覺濃濃的先射箭再畫靶阿 論文中也承認,某些推文集中在下午兩點是因為防疫記者會都是下午兩點召開 怎麼到最後寫結論的時候這些該拿出來說可能會造成誤差的因素都不見了 只留下因為想不到正當性所以合理懷疑的結論
有人會說台灣統一中國 正統中國才奇怪
喊ptt有五毛=財富密碼
感謝分享論文搜索方法,我這邊看代碼也
有看到奇怪的coefficient,我本來以為是
有做實驗得到的,結果真的鳥
先抹啊,他只是一隻超大綠色蟑螂而已
不知道這篇paper 是怎麼過審的,像這種
超參沒實驗沒給reference 肯定被我研所
教授釘到起飛
跟著黨媽媽 有肉吃有湯喝 標案一大堆超爽
升官發財 請走...
※ 編輯: sami012985 (185.205.48.180 瑞典), 03/28/2022 13:49:50跟關貿差不多,一起吃香喝辣
不管啦 說你們五毛就五毛
這年頭 作賊喊抓賊才是顯學
你在瑞典讀CS嗎?感覺很猛 他創立的那個la
b根本來搞笑的==
我在瑞典讀IT 那個LAB也不是全部都這樣的啦 也有產出有些在不同領域的AI運用論文 稍微瞄過幾篇,也是有幾篇有水準的
反串的有辦法區分嗎
有前後文,且能分析的資料夠大 是有機會區分出來的
推分析文!
有錢能使神當狗
垃圾進,垃圾出
推
嗯跟我想的差不多
結論就是討厭民進黨的=中共同路人
基進側翼科科
欸不對欸 該不會杜先生的國際論文 是在自己架的網站放上一篇用英文寫的文章 就變成國際論文了吧 !?!?
※ 編輯: sami012985 (185.205.48.180 瑞典), 03/28/2022 14:16:16對杜真的是失望透頂
認真分析推
你跟苦無系認真就是你輸
高機率啦幹,概率支語
已修正 概率是支語喔
想當PTT滅世神了吧,至於為什麼會有這樣的
轉變… 要問杜先生自已了
阿不就先射箭再畫靶 笑死 這樣抓一
定有相似行為啊
主要問題是 今天這份研究產生出來的結果是 1.大部分被分群找出的協同用戶/組都有自己相似的活動時間、模式 2.還是僅有文章中抓出來的四個組有 這兩個在意義上差別就很大
不要這麼專業好嗎
這只是一條龍的抹黑鏈的其中一環...
辛苦您了 他們只是在畫星座而已
創世神早就跌落神壇
民進黨把台灣人民當笨蛋嘛= =?
這種東西能不能過碩論都要問號了
AI給的權重值很重要 GIGO知道吧
概率哪邊是支語了 只是台灣比較少用而已
總而言之就是用COSINE相似度做分群
然後用高大上的名詞,協同過濾
Collaborative Filtering來包裝解釋
分群這種做法解釋起來要很小心
這篇論文和AI有關的部份只有預處理用BERT?
說你五毛就是五毛,莫須有
想硬套結果操縱輿論者想不出正當性很合理
上班早餐同路人,上班廁所同路人,上班抽煙
同路人,以上請勿同時發廢文...謝謝
杜先生這種文章很可怕的 可以騙到多數智商
不高的人 又成功黑了ptt一波
這篇發表在那裡啊?用google scholar 搜
不到 原本也想來拜讀一下的
在他們自家的ai labs網站上做的"國際發表"喔
我們只研究對民進黨不利的,有問題嗎?
黨說你是五毛你就是五毛啦
根本不用演算法,貼一篇蔡英文的新聞
下面噓文的全列為五毛就好
專業推
台灣統一中國 蔡垃圾總統 塔綠班網軍死
全家
就算找出相似行為的用戶組 他怎麼得到有
內應的這個結論? 內應是誰的內應?
目前並沒有看到有針對烏俄戰爭事件進行的分析 網站上只有找到針對疫情期間的協同分析 所以無法確定到底是誰的內應 不過看杜先生的文章明顯在影射中國內應吧
推專業+認真
推
哈哈哈哈哈
這種無聊套工具算法上去分析的結果如果是
「研究人員想不出來這麼做的正當性」的話
很可能根本就只是非常正常的自然現象
找不出實例、因果,就只有我發現了一個不知
道是不是自然的模式,就冒然認定這是種特徵
然後再跟自己的想法聯結,這是在做研究?
推,這些都是Data mining很基本的方法
標準垃圾進垃圾出的東西耶..
好專業的文
苦無
如果10年前ptt也有grouping的現象 那
又會怎麼掰呢^^
推
這種作法至少也要有多參數的結果 更不要
說這種人類行為學的資料居然用tf-idf 整
個感覺就是在湊算法跟參數導向自身期望
人類心理、社會行為學很複雜 從眾心理、厭惡損失、鏡像神經元對行為的影響等,這些都還只是心理學的基礎 今天他找出有些群體有接近的行為模式 他應該說說,目前為止的結果很有趣 這裡應該是可以往下繼續研究探討的問題點,為何看似隨機的狀態中間會有一群人有這些 行為 不是單單說一句 喔 "這裡可能有人在操縱輿論 並且也沒有其他具有正當性的說明"
理組苦無
垃圾演算法當然就是先預設你就是五
毛 先抹先贏
笑死
推專業整理
推
看了幾個分析他方法的,你講的最好
推
最一開始 一個小時內用同一個IP上線推發文
這比例不知道有多少。如果佔比超少甚至沒有
那整篇就變成"話題的群聚現象研究"而已
回樓上,我這邊看論文,他的phi coeffic
ient分佈顯示大部分的用戶都在0~0.05之
間。說實在,很難找到明確統計有大量網
軍在操縱
phi coefficient 的升降可以看那幾條gro
up 規則
某種角度來,用語言學的脈絡來說,本來
相似的文化圈就會流行相同的術語,把PTT
解釋成30老漢次文化圈也是合理的
90
大停電期間,有三個鄉民被AI判定是中共同路人。 A:我發文說停電了,被認定是中共惡搞台灣電力的在地協助五毛。 B:我發文說有電,被認定是嘲諷沒電的人製造分化和混亂,是中共在台灣安插的五毛。 C:我手機沒電沒發文,AI覺得我一定是買了中國製的劣質行動電源... -----------------------------------------2
其實想想跟黨國時期還有點像, 對象(同):反對聲音 主觀認知(同):都認為是中共同路人 目的(同):想要讓這些聲音閉嘴。 篩選方式(同):是否跟中國一樣長期批評民進黨。18
那我看抖音上面一堆留言支持烏克蘭,加油去幹死鵝爹的, 支持烏克蘭士兵用標槍、毒刺去鐵鍋燉大鵝打直升機坦克的, 看到NLAW打爆T-90就一堆人樂開懷的 罵那些支持俄羅斯的中國人是鵝黃子孫、黃鵝子的 好好的中國人不當去當普丁鵝子的,1
還有一種可能 那就是各方媒體先後獨立觀察推論出烏克蘭情緒勒索世界這個事實 沒有誰協同誰的情事 古代東方人觀察到月有陰晴圓缺 古代西方人也觀察到月有陰晴圓缺12
ptt八卦板有沒有五毛內應我不知道啦 反正你們大人物手握國家預算 講話有份量,死忠的也很死忠 不過我想請問一下齁3
我覺得有內應阿 政治是門好生意 那麼大的利益 有網軍很正常啊... 網軍收人錢財與人消災36
好像不是靠ai耶10
用話術包裝再多 用意不就是用來殲滅少數派的 第一 如果真的是共諜就抓起來阿 第二 網路言論不就你抄我我抄你的 有哽的關鍵字拿來用 記者都互抄農場文 通訊社了 這種病毒傳播 有相似之處有什麼特別的19
逐家好: 我曾經以為我在民主國家,原來是共產國家。 既然身在共產國家,被党點名到了,我就該自我審查。向鄉民們道歉。 沒有跟烏克蘭人民站在同一邊,罪該萬死。7
其實我就覺得很好笑了 說真的 俄烏戰爭 和台灣沒什麼關係 大家隨便說說 每次都要上升到是政治對立的問題 杜大可以解釋一下
爆
Re: [問卦] 紫微斗數的「夫妻宮」,交往能算嗎?新的修文回應: 感謝版友的肯定與厚愛,推文經計算後大概千來人參加抽選,很顯然是並不容易抽到@@ 過年後我會再寫一篇文章推廣斗數與命理觀念,並再多安排一些額度抽選。 年初三用程式抽選的結果如下: A組中選:yun1989 HarukaLM爆
[問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒閒著創世神的臉書貼文貼了一張圖 說明 3/9 PTT的問卦 和 3/25 中評社的報導 協作 是烏俄戰爭的駐批踢踢內應所為 PTT 0309 發文問卦 烏克蘭情緒勒索 ->Dcard 0313 發文 烏克蘭情緒勒索爆
Re: [問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒欸,我PTT外商碼農阿肥啦!現在還在當研究員,有六年機器人語意理解的研究經驗啦! 請杜先生可以認證我是同路人,我真的無所謂,就把我當在地五毛好了,反正我未來想換 工作也不打算投你們公司履歷。 不過我自己用午休15分鐘已經把你開源的代碼opinion那個看完了,還沒找到你說得國際 論文,先以你的代碼來推測。爆
Re: [問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒閒著創世神除了架了PTT 請問還有什麼其他東西? PTT這20年也一直在改變 實際上很多功能都是後來的站方弄的 他其實就是在PTT紅了之後出來蹭的爆
Re: [問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒閒著抓到 那就去檢調舉報啊 反滲透法吃乾飯的嗎? 今天檢察官可以因為懷疑松鼠鳥是被人丟到高壓電塔上的 而動用公部門力量全面徹查78
Re: [問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒閒著個人對資訊戰、認知作戰到現在的協同行為稍有研究 基本上這三種東西都是同一個脈絡 我稍微做個整理方便大家理解 關於資訊戰起因 2019美國出了一個調查54
[問卦] 沈伯洋說有白綠都有網軍的證據沈教授說這是他的證據的期中之一 其餘兩個皆在安全研究院的網站裡 我大概略讀了一下有關PTT影響力那篇63
Re: [問卦] 沈伯洋說有白綠都有網軍的證據我剛看了一大半 但內容已經讓我想吐血三升 幾乎每一個結論都毫無根據,而且歸因有極大錯誤 在第10頁關鍵要點的部份 他們首先說PTT並不歡迎支持中國的言論29
Re: [問卦] 杜奕瑾:烏俄戰爭駐批踢踢內應的也沒阿肥外商碼農阿肥啦! 剛好阿肥是這塊領域的研究員,大概工作也有六年是在這塊機器人語意理解領域了。 直白來說,現有的不管你要叫AI或是內行一點要叫ML/DL,這塊領域當前最好的SOTA模型 從數學直觀理解都驗證機器對於模式識別是很強的,但是分析永遠不是ML的強項。 也就是說當前不管是BERT還是GPT 3等等等,他們強項就只是找到序列詞組的關聯性,最
爆
[問卦] 為何很多社運學運的後來都變垃圾?爆
[問卦] threads:劉德華支持留島不留人爆
[問卦] 德國人叫台灣女生sushi算是歧視嗎?爆
[問卦] 通常都怎麼判斷有沒有逃亡之虞的?爆
[問卦] 橘子真的有被通緝嗎?爆
[問卦] 有什麼經典的邪教口號?71
[問卦] 棒球版在吵什麼?72
[問卦] 台南地檢地院跟台北地檢地院哪裡不一樣64
[問卦] 檢座:台灣人目無法紀 這樣算是誰的鍋60
[問卦] 東大寺真是太美了,為什麼媽祖廟不學學?60
[問卦] 謝票 謝謝投給我的大家 嗚嗚嗚46
[問卦] 青鳥收到誰的指示開始嘴劉德華了47
[問卦] 西班牙光是一個隧道就找到45具屍體34
[問卦] momo 雙11 爛91
[問卦] 靠北喔 真的有人可以這麼蠢?49
[問卦] 錫蘭為何一直狙擊台灣YTR啊爆
[問卦] 給你11億,但是要逃往海外,要嗎???24
[問卦] 第一次當版主有什麼要注意的嗎?嗚嗚28
[問卦] 你挺遠雄還是中職?25
[問卦] 陳偉殷為什麼感覺沒有王建民強?16
[問卦] threads怎麼一堆做愛文16
[問卦] 台棒打捷克9局2:2 算國恥嗎?66
[問卦] 飯店「不提供備品」 房費可以降多少?爆
[問卦] 青鳥怎麽看慶富案台鹽綠能?19
[問卦] 青鳥一直出征對岸大咖幹嘛?20
Re: [新聞] 快新聞/劉德華演唱會嗨唱〈我是中國86
[問卦] 幹人妻有多爽18
[問卦] 安芝儇、南珉貞穿這麼漂亮18
[問卦] 步驚雲去俠王府搶冰魄不是很無禮嗎9
[問卦] Why大奶細腰正妹 會喜歡檳榔刺青+9?