Re: [新聞] 搶太妍門票僅須4秒!警破獲首宗AI搶票黃牛 逮30歲台大畢
阿肥外商碼農阿肥啦!
其實就是使用langchain加上類GPT 3.5-4(當前很多開源的,一張4090就可以運行起來),透過模型輔助加上langchain可以直接接上Google等搜索引擎或特定網站解鎖語言模型讀取最新資訊的能力,這樣就可以規避掉官方要識別人類(粉絲?)的特殊問題。
然後圖片驗證識別這個目前就被玩爛開源Acc都可以到99%以上了,基本上你想用CNN或swin transformer來做效果都非常好。
至於自動爬蟲程式,阿肥最近也再跟公司的爬蟲同事一起研究有打算搜集一些人類點擊速度跟滑動速度的資訊讓模型學習一些策略做反防爬蟲,這個我印象中也是有幾篇論文在研究只是不多,主要是搜集人類瀏覽軌跡的資料比較困難,而且要搜集這東西要做也只能暗著做。
差不多4醬
--
可是他五年前就開始了耶
五年前圖片驗證技術就很成熟了,中間也可能優化他的爬蟲程式啊
問題是賣黃牛有罪....
那如果用程式自己搶會有罪嗎
不是你搞這個能賺嗎 拿去弄量化模型不是比
較好?
量化交易
搶票這個我不知道,不過反防爬蟲公司一直有這個需求啊,反反防爬蟲也是一個剛需。
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:55:11反爬蟲又能兼顧使用者體驗搞 爆賺吧
這個窪地網站最擅長了 各種奇葩反爬蟲
不過我猜都會搞到使用者不爽
以前google打一大串文字最不爽 現在好多了
Selenium 就行了。為什麼要用到AI?
主要是Selenium的點擊模式很好識別啊,就算是你設定一個亂數隨機也很好抓,抓到就直 接band掉ip,又不是每個人都有幾萬組IP可以使用的。
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 08:08:11好奇圖形驗證碼需求單純用CNN現成package
能不能做到 還是需要自己蒐集圖形資料貼
標籤train
可以直接用市面開源框架的OCR模型,連gpu 不用可以直接用cpu推理不用1秒就有結果, 實測直接拿他們官網提供的模型跟常見的圖形驗證就有9成命中率了,我推測他們也是有 拿那些數據加上大量其他的圖片文件去練蠱,所以效果連微調都不用。
自己搶沒問題 加價賣有罪
自己搶一樣有罪,文創法10-1
了解 感謝大大解答!
好奇javascript腳本的點擊模式也很好
抓嗎?搭配chrome的擴充功能也能做出i
sTrusted = true的click,應該不好抓
嗎?
爆
Re: [問題] 繪師有權力禁止別人學習畫風?兩邊都有學一點,試著回一下: 「繪師能不能禁止AI學習他的畫風?」 其實這個問題預設條件就錯了,現行的AI其實追根究柢到最後都是統計技術, 那種「會自己思考」的AI還不存在,可能也還要很久才會出現。 現在所謂的AI技術幾乎都是指深度學習、類神經網路等技術,X
Re: [請益] 每日FBX之亂到此結束?低調回覆這篇, 小弟之前做投資網站時有寫爬蟲去抓每日FBX官網的報價, 然後有發現網站 雖然寫要看每日報價必須登入會員, 可是其實他技術上根本沒有阻擋, 就算沒有會員的 cookie, 打下面這個API就能拿到近一年的每日報價了... 拿到的json檔案想方便觀看可以用下面的網站解析json:30
Re: [新聞] USAF預計明年7月施行人類對AI演習為何對台灣來說最簡單也最有效的AI軍事武器:自動機槍塔 沒有人想要開發呢 現有的開源軟體框架已經很成熟,也有已經訓練好的物體偵測模型(yolo) 只要把通用模型針對特定目標做遷移式學習就可以強化特殊領域辨識率 訓練用圖像資料靠海陸弟兄幫忙模擬一下 (班長:徵求資料標注公差10名) 整個套件硬體成本其實很低,樹莓派+intel神經棒或nvidia jeston應該可以做到15
Re: [閒聊] 用AI圖在ci-en被開創作者帳號被婊的心得突然想到 還有人說模型訓練的時候 用的圖沒經過繪師同意 這樣bad 那chatgpt訓練使用的資料也都有經過同意嗎7
Re: [閒聊] 沒人樂見AI繪圖技術的誕生嗎?大家都從藝術創作創意與著作權的方式去探討。 其實對於AI演算法而言,一切都是數據,Garbage in garbage out. 好的數據集才能產出好的訓練結果,大數據甚至可以量變產生質變。 產生出革命性的新技術來賺大錢。 類似這種蒐集網路公開數據然後分析產出有價值的衍生數據的爭議很早就有了。3
[請益] 國內外公開書籍資料的網站?因為最近有大量的ISBN書籍資料網站需要查詢(就是書名,圖片,價錢) 加上自己也有做過相關的爬蟲資料 但是爬一些商業網站,像是ebay 或是 Amazon 博客來.... 都已經做到高度的防護,我的爬蟲技術也已經無法跟上 想問一下各位大大,因為我只是想查詢書籍的資料2
Re: [請益] 大家爬蟲都爬什麼好玩?其實很多能寫啊 像我最常用的是寫各種js腳本 前年寫了一支腳本搶小米折價券 原理只是一直用js click()按鈕而已 花不到10分鐘為我帶來五千塊的收益2
[討論] 小玉 若用明星訓練的AI做A片 還會被關嗎?現在主流認為 用網路爬蟲去抓未授權的影像回來訓練 AI 模型 再由 AI 模型生成的資料是可以合法賣錢的 (例如 Midjourney, chatGPT, Dall.E2) 這樣說 小玉 若用明星訓練的AI做A片 還會被關嗎? #他只是生不逢時 --- 如提, 最近用了vba爬蟲與vba整理訊息+line bot 結合 產生了自己的股市最新新聞~即時的喔 比如說加權指數 道瓊 盤後資訊 最好用的應該是即時新聞資訊,
- 我認為要先釐清楚一點,要做AI的模型並非只能透過Python, 大家都用Python原因在於AI套件都已經由國外的大神做好了, 甚至有些套件都事先訓練好資料,提供weight檔案,可以直接使用應用在某些專案, 若只是要用這些AI套件,使用Python非常方便 Python的優點:
爆
Re: [新聞] 早預感黃珊珊鬧翻藍白合!蕭旭岑爆柯42
Re: [新聞] 早預感黃珊珊鬧翻藍白合!蕭旭岑爆柯46
[問卦] 魚油是不是真的很強啊?29
Re: [新聞] 早預感黃珊珊鬧翻藍白合!蕭旭岑爆柯30
[問卦] 為何台電不自己賣綠電?30
[問卦] 原來紅線半夜都是合法停車場25
[問卦] 禮拜六早上麥當勞為什麼一堆人?50
[問卦] 沒人發現投幣式洗衣店都不知道誰在去的!28
[問卦] 剛剛高雄大爆炸聲37
[問卦] 現在南部豪大雨19
[問卦] 棒球板半夜一直吵架在吵什麼事情21
[問卦] 這個人體標本是薄熙來的情婦嗎?11
[舊聞] 影視颶風Tim閃電宣布和網紅妻離婚 曾被15
[問卦] 開空氣清淨機,不如開空調?36
[問卦] 30年後的台灣 會怎麼評價非核家園26
[問卦] threads變個工溫床?28
[問卦] 沒人發現在台灣抗議也沒用了吧?12
[問卦] suzuki的機車也太好看了吧22
[問卦] 台麥是不是找到流量密碼了?1X
Re: [新聞] 柯文哲涉侵占政治獻金 北檢扣押木可近7
[問卦] 臺灣這場贏定了吧?日本選手剩二軍?9
[問卦] 台灣海洋大學有比國立地名大學好嗎?9
Re: [問卦] 8051可做的最高階產品是什麼?8
[問卦] 烏克蘭真的能接受和平方案嗎7
[問卦] 祖克柏跟馬斯克誰會先入獄?7
Re: [新聞] 川普找反疫苗大將小羅勃甘迺迪任衛生部長27
[問卦] 日本神奈川齒科大學算不算是波波呢?7
[問卦] 今天有個穩贏16%投資?4
Re: [新聞] 早預感黃珊珊鬧翻藍白合!蕭旭岑爆柯9
[問卦] 牙醫是不是該入健保了?