Re: [討論] 盜用模型是什意思?
笑死!你連開源意思都搞錯,難怪雞同鴨講
開源是指系統開源可不包括訓練資料開源
而這種抓取他人資料來從事訓練的行為
在國外被稱為Webcrawler網路爬蟲,至少牽涉到下列幾種法律問題
1. 著作權侵害
著作權法保護原創性之著作,而美國著作權法除了要求受保護之著作必須原創性之外,尚必須附著於一定媒介物。2007年美國聯邦第九巡迴上訴法院在Perfect 10, Inc. v.
Amazon.com乙案中,指出電腦記憶體、網路伺服器都是一種媒介,因此附著於記憶體
或伺服器的軟體程式碼,如有原創性,亦可受著作權保護。
網頁上之具有原創性的著作內容物受到著作權保護,因此未經授權爬取網頁上之受保護之著作內容,將構成侵害網頁內容之著作權,並無疑問。
2. 違反使用者條款
多數商業網站均訂有使用者條款,以規範到訪和或使用網站之條件,用戶必須根據對這些條款之約定到訪或使用網站。儘管,網頁爬取行為展現科技的新用途,然而這種行為可能因為使用者違反使用者條款以抓取網頁資料,因而引發違反使用者協議之爭議。
多數情況下,目標網頁主張網路爬蟲違反使用者條款之舉證責任,往往較主張著作權侵權之舉證責任為高。後者,網頁抓爬之目標網頁僅須證明為網頁所有人與抓爬標的為受著作權保護之標的已足。證明違反使用者條款,網頁抓爬之目標網頁不但須證明使用者條款具拘束力且可執行、且必須證明抓爬的行為違反適用者條款、以及抓爬行為構成目標網頁之損害。
2007年在Southwest Airlines Co. v. BoardFirst, LLC案,被告BroadFirst的軟體提
供一項商業服務,以協助西南航空的客戶,利用西南航空公司的「開放」座位政策與辦理登機手續(check in)以獲得飛機優先座位之利益。在本案由於網頁的使用者條款用語明確限制網頁使用者作為非個人與商業用途之使用,因此,法院認為被告的行為屬於使用者條款所欲規範的範圍且與條款之內容直接相關,因此不同意被告主張該使用者條款欠缺明確而無執行力。本案審理之德州地方法院,因而判定被告BoardFirst使用西南公司網頁之行為,已違反了西南航空的網頁中使用者條款,因為條款禁止使用者利用網頁為個人與非商業目的用途(personal and non-commercial purpose)。
3. 電腦詐欺與濫用
美國法院認為網絡爬取行為如果違反網站使用者條款,同時可能違反電腦詐欺濫用法案(Computer Fraud and Abuse 簡稱CFAA),該法案禁止「未經授權」或「逾越授權」進入電腦、網路、伺服器或資料庫。一般而言,只要電腦是公開可進入,並且不受密碼或其他保護安全措施,法院拒絕認定網路爬蟲任何造訪網頁行為違反CFAA。然而當網路爬蟲進入受保護之網頁,且網頁透過技術措施防止未經授權之進入網頁,或有明確停止未經授權之警告通知,則有可能構成違反CFAA法案。以下有2案涉及進入網頁抓取資料是否違反CFAA為審理。
4.不公平競爭之違法行為
2022年9月,公平交易委員會(下稱公平會)以公處字第111070號處分書,將抄襲競爭對手網站及APP經蒐集整理之資料而混充為自身網站及APP內容之行為,認定為榨取他人努力成果而足以影響交易秩序之顯失公平行為,違反公平交易法第25條規定並處以罰鍰
原告北京某信息技術有限公司訴稱,其運營的某網站主要服務汽車消費者投訴受理,消費者在網站提交針對汽車質量問題的投訴后,網站會與汽車廠商聯系並督促解決。自2014年成立以來,該網站已累計處理了約39萬條消費者投訴信息,建立起了包括消費者投訴處理、汽車產品缺陷問題檢測等為一體的服務體系。
2021年6月,原告發現,被告北京某公司運營的網站中有52000余條消費者投訴信息與原告網站展示的信息相同或者近似,且投訴日期均晚於或等同於原告網站上的日期,部分投訴信息的附圖中甚至還帶有原告水印。此外,被告網站顯示的投訴編號數量超過11萬,但無處於該網站投訴流程中“完成”狀態的投訴信息,原告認為,被告網站的投訴數量及
處理進展均為虛構。原告遂將被告訴至法院。
法院經審理認為,原告主張權利的5萬余條用戶投訴信息系經過長期經營、管理、維護而形成的數據信息,能夠給原告帶來特定的社會效益和經濟效益,屬於其市場競爭優勢,應當受到法律保護。被告在其網站中使用原告網站5萬余條投訴信息的行為,本質上是不正當利用原告網站投訴信息、違法將該信息據為己有的行為,違反了誠實信用原則和公認的商業道德,給原告造成了實際損失,應當適用反不正當競爭法一般條款予以規制。此外,被告在其網站虛構投訴數量及處理進展等行為,容易造成相關公眾對其網站經營規模、影響力、服務效率產生誤認,亦構成虛假宣傳的不正當競爭行為。最終,法院判決被告停止涉案不正當競爭行為、消除影響,並賠償原告105萬元。
※ 引述《dakkk (我是牛我反芻)》之銘言:
: OpenAI的open不也就是開源的意思
: 從openAi獲取資料來建自己Ai到底有什錯?
: 我們所有人也都是站在前人的巨人肩膀往前看
: 不曉得在不爽什麼
--
OpenAI的資料也是爬蟲爬來的
這種單純資料 不符合著作權標的
笑死!原來你不知道著作權法上有編輯性著作這種東西嗎? 第 7 條 就資料之選擇及編排具有創作性者為編輯著作,以獨立之著作保護之。 編輯著作之保護,對其所收編著作之著作權不生影響。
※ 編輯: treasurehill (42.70.83.123 臺灣), 01/30/2025 17:27:47這不就open ai幹的破事,法律也不能拿ope
n ai 怎樣,然後就被人家用你的魔法來對
付你了
他只是輸入資料 輸出也沒什著作權違反疑慮
回去重念著作權法啦! 第 7 條 就資料之選擇及編排具有創作性者為編輯著作,以獨立之著作保護之。
※ 編輯: treasurehill (42.70.83.123 臺灣), 01/30/2025 17:28:53但是蒸餾是用別的AI的產出來訓練自己的AI,
這就不符合純資料喔
資料拿來輸入訓練 根本不是編輯 你真沒料
還要硬拗
老天你是真不懂還假不懂? 編輯性著作就是指資料庫啦! AI訓練出來結果也是資料庫的一種 撇開AI能不能擁有著作權之爭議 他也是編輯性著作的一種 你連人家在講什麼都沒搞懂就別在那邊跳針耍寶了好嗎?
未經授權拿別人訓練結果二次加工就是偷
如果openai告得成deepseek, 我看光是美國
要告openai的就會從東岸排到西岸了
支那腦:偷一部份不算偷啦~ <<笑死
小草就不讀書
kuni又來丟臉了
看不起你這種舔執政黨的行為
那舔貪汙犯呢
3樓復活帳號
Ai跟資料庫哪裡一樣 Ai就是類神經網路 就
像人一樣大量閱讀 然後寫出自己見解 這跟
著作權一點關係也沒有
笑死!誰告訴你類神經網路訓練出來的東西不是資料庫的? 你真的很愛自曝其短喔! 什麼是向量資料庫?
向量資料庫是以數學表示形式儲存的資料的集合。向量資料庫使機器學習模型更容易記住 先前的輸入,從而允許機器學習用於支援搜尋、推薦和文字產生用例。可以根據相似性指 標而不是精確匹配來識別資料,從而使電腦模型能夠根據上下文理解資料。當人們參觀鞋店時,銷售人員可能會推薦與人們喜歡的鞋子類似的鞋子。同樣,在電子商 務商店購物時,商店可能會在「客戶還購買了...」之類的標題下建議類似的商品。向量 資料庫使機器學習模型能夠識別類似的物品,就像銷售人員可以找到類似的鞋子以及電子 商務商店可以推薦相關產品一樣。(事實上,電子商務商店可能會使用這樣的機器學習模 型來進行推薦。) 總而言之,向量資料庫使電腦程式能夠進行比較、識別關係和理解上下文。這使得能夠建 立進階人工智慧 (AI) 程式,如大型語言模型 (LLM)。
綠狗又要來集合了
dak 你寫那三行露餡了 還是不要出來丟人
現眼了~
向量資料庫就不是你想的那種 輸出資料也不
會有什著作權疑慮 有openAi自己第一個被告
翻
類神經網路背後運作原理就是向量資料庫啊 每一個權重就是就是Hyper space的法向量啊 其訓練結果也是以向量方式儲存啊! 你對類神經網路原理很不熟喔!
※ 編輯: treasurehill (42.70.83.123 臺灣), 01/30/2025 17:51:02而且跟編輯是有什屁關係
你貼的這一堆東西跟著作權根本沾不上邊
是編輯性著作不是編輯 不要當法盲好嗎?
http://www.copyrightnote.org/ArticleContent.aspx?ID=9&aid=2605「編輯著作」是因為著作人對既存之「個別著作」加以「選擇及編排」而具有「創作性」 ,而受到著作權法保護。所以,關於「編輯著作」,著作權法是保護著作人「選擇及編排 而具有創作性」之部分,而不是使其對所「選擇及編排」之「個別著作」,亦享有著作權 。因此,著作權法第七條第二項規定:「編輯著作之保護,對其所收編著作之著作權不生 影響。」
※ 編輯: treasurehill (42.70.83.123 臺灣), 01/30/2025 17:53:50看無,那個AI不爬蟲?
你講的每個AI都有吧?
臭俗辣,小偷,賤人
其實開源也是有分的,不是在license cop
yright 那邊寫一寫就好,但大部分人不是
碼農,說了他們也聽不懂
支那賤畜無物不偷
這件事情的重點又不在開源授權LICENSE
他不只爬蟲了,可能是直接接上ChatGPT
的輸出結果
才會回答出GPT的內容
會覺得接上輸出結果的不知道是笨還傻,
Open ai價格這麼貴,而且應該有偵測機
制,這樣打一次就燒一次錢,如果是真的
這造假本非常之高欸
不用跟草認真啦 你解釋他們也不懂 你用A
答它只會用B回 讓牠們繼續鬧笑話就好 柯
憐阿
是拿他的東西來訓練
不是使用的時候接上好嗎 = =
差很多
而且我哪一句說造假?
你有沒有實際用過tf生成過任何一個NN...
模型用向量資料庫儲存?
微軟也沒說他造假阿
基本上只有民進黨說造假
草連法條都看不懂了,要草看懂AI爭議太
為難了吧
也只能抓著這點打了
這篇成立的前提是要有能審判中共的存
在, 上帝嗎? 還是地外文明?
推個
爆
[心得] 第1次吉三星就上手 冷筍訴狀分享大家晚安 今天輾轉獲得打贏三星的起訴狀 補充說明一下 這是已經獲勝訴判決的訴狀 裁判字號: 內湖簡易庭 113 年度湖簡字第 399 號民事判決爆
[討論] 日本律師:AI仿畫合法 單方面禁止無效如題 關於之前的AI仿畫風波 日本律師指出 根據著作權法30條50
Re: [閒聊] 使用VPN觀看日本動畫有違法嗎?一、可能違反什麼法律? 首先必須先釐清,本文討論的前提是在合法網站、具有正當的會員身分,但透過VPN服務 改變原本的IP位置,觀看限定IP區域的動畫的行為,理所當然地和「盜版」不同。 或許可能某些動畫網站會在通常不會有人看就按同意的使用條款裡,聲明區域限定,禁止 其他地區觀看,但使用條款屬於私法契約,僅可能有違約的侵權損害賠償責任而沒有違法49
Re: [心得] (代PO) 金融業工作心得分享(代PO) 作為一名純血四大資工碩士,我在國泰擔任工程師,深感榮幸能夠參與這家頂尖銀行的發 展。 你們或許不知道,國泰在現代化核心系統方面投入了巨大的努力和資源。 這不僅是為了提升內部運營效率,更是為了提供客戶更優質的服務。28
[討論] 本版有人洩漏女友日記被告了?如題 剛在法院網站公開判決書看到的 簡單說就是男方看了女方的日記 因為女方腳踏多條船的事跟女方爭吵 後來約定不再談這事也不會公開女方日記33
[情報] 株式會社寶可夢對中國盜版公司提告求償【#寶可夢盜版遊戲公司被索賠5億# 】 株式會社寶可夢 現已開始對營運“口袋妖怪復刻(口袋之旅)“的“中南文化”等6家相關 公司提。原告認為該遊戲中存在大量侵犯原告權利人遊戲著作權的內容。案件涉案金額人 民幣5億元。目前案件已進入訴訟程式,尚未開庭審理。 原告 株式會社寶可夢 對六家被告公司的要求包括:停止運營、釋出、提供、宣傳涉案侵權8
Re: [問卦] 多米多羅是哪一步走錯了?最近才看到民事判決書(案號:臺灣新北地方法院 板橋簡易庭一一二年度板簡字第二零 五九號),內容很長、但也很好笑... 開頭先說重點:(僅就法官的想法作說明,經 ChatGPT 整理) 【本訴】 法律背景與原則:6
Re: [新聞] PTT八卦版罵人低能兒挨告 辯「我能證明他是: : 我的意思是說, 早就有判決講清楚, : 所謂的指名,是限定現實人的名字, : ptt上的代號, 真正使用人是誰不重要, : 而是代號本身能不能連結到現實中的人。1
Re: [討論] 塔綠班浮木 吳子嘉 07/12 宣判再看「臺北地方法院 112 年度重訴字第 502 號」民事判決摘要: (一)言論自由和名譽權,都是人民憲法上之基本權利,應給與相等之保障,二者有所衝突 時,法院應予以權衡。如果是「客觀事實陳述」(事實性言論),亦受言論自由保障,在 他人主張因「客觀事實陳述」導致名譽權受侵害時,法院不會要求該言論客觀、絕對真實 性,否則將會造成言論自由之過度限縮。但是,如果該「客觀事實陳述」與事實不符時,
爆
[討論] TVBS民調 黃國昌、國民黨滿意度奪冠45
[轉錄] 黃揚明(剝雞)FB 向矢板明夫先生道歉45
[黑特] 賴在清算正國會???31
[討論] 賴清德施政快一年,政績26
[黑特] 笑死 綠委林岱樺認證:政治干預司法30
[討論] 民進黨議員陳怡君剛裁定羈押禁見26
[討論] 高雄市長DPP黨內初選候選人25
Re: [討論] 有一說一外省人水準真的比較高 但是WHY24
[討論] 31%同意罷免藍委,44%反對罷免19
[討論] 2026國民黨高雄穩了19
[黑特] 一日兩案 大罷免還走得下去?9
[討論] 靠北TVBS這民調又超過100是不是急了?20
[討論] 林岱樺脫黨參選能當鍾東錦第二嗎21
[討論] 傅崐萁說他代表中央政府20
[黑特] 林岱樺民調最高是真的嗎?21
Re: [討論] 民進黨議員陳怡君剛裁定羈押禁見16
[討論] 賴屠殺前起手式。藍白還笑的出來?17
[討論] 林岱樺:政治干預司法、司法干預初選13
[討論] 哪時候可以罷免賴威廉?17
[討論] 助理費除罪化好嗎?14
[討論] 林岱樺跟許智傑在鳳山誰風評好??16
[討論] 朱立倫:綠營在金門要抄名單連署比較難16
[討論] 現在高雄市長民調最高是誰?13
[討論] 青鳥能出來罷免林岱樺林宜瑾了吧?12
[討論] 小草現在怎麼看高虹安65
[黑特] 傅崐萁被抓包確實在香港9
[討論] 王義川還是立法委員嗎?9
[討論] 潘孟安當高雄市長不好嗎?X
[討論] 有一說一外省人水準真的比較高 但是WHY8
[討論] 林岱樺財產申報