Re: [討論] 有哪些工程師不會被AI取代的嗎?
※ 引述《xross (xross)》之銘言:
: AI 比你想得有料
: Andrej Karpathy 自己都說他自己大部分時間都靠 AI 生 code 了
: https://karpathy.medium.com/software-2-0-a64152b37c35
: 這篇老文章就有說
: 空間時間複雜度?? 可以吃嗎
: Software 2.0 告訴我們
: Constant running time
: Constant memory use
: 內文也提到
: 人類智慧結晶 搞出來的 cache-optimized B-Trees 直接被 AI 幹翻
: (版上臥虎藏龍 手魯industry-ready-B-Tree的高手可以出來嗆一下嗎?)
: "outperforming cache-optimized B-Trees by up to 70% in speed while saving an: order-of-magnitude in memory."
: 這讓我想到 DLSS 也是藉由 AI/DL 直接做到以前一堆專家搞出來的upscale + AA根本: 到不了的好效果
: 說了這麼多
: 希望能盡快看到 官方 PTT app
: 目前可能 AI 還在學習怎麼寫
下班前看到就認真回覆一下,
先說你有點搞錯Karpathy所謂的Software 2.0了,Software 2.0也不是什麼很新的概念。
他的概念就是過往我們使用從底層打包上來的Library來顯式開發API為Software 1.0,而2.0則是只有定義數據集,定義神經網路框架跟訓練,最後將網路編寫成二進制透過工業化流水線軟體平台部署。
不過有一個很大的前提,「定義搜索空間跟優化方向」,這個神經網路優化方向是需要人工來定義的,這邊其實前幾年AlphaTensor就有做出實驗,直接透過強化學習去找矩陣乘法的最佳解,結果確實找到了一組可以應用的比原本最佳矩陣乘法快了20%的解。
定義目標的依舊是電腦科學家/工程師,不是說什麼老闆/PM啊,你去跟老闆/PM講解Low rank tensor decomposition ,他只會跟你說聽不懂。
其實Software 2.0就是現在我們在做的深度學習/LLM這件事情,理論上有可能讓一個夠大的模型來解決一切的問題,讓神經網路包覆整個底層軟體。如果要做一個複雜功能就直接給兩個Software 2.0模組組合去一起做反向傳播優化,然後就可以去配適到我們的開發任務上,只是那個結果我們可能很難解釋他(90%的ACC不一定代表能夠fit到所有未知的數據上)。
如果模型參數量不夠大還是會有No free lunch的問題,所以未來很長一段時間依舊是會有神經網路搭配顯式編程的方式持續,Karpathy後面也有提出Software 2.0的限制,不是絕對樂觀看待的。
以上
--
Low rank tensor decomposition 工程師可能也不懂
就只是low rank decomposition矩陣擴張成三維而已,大學線代有認真上課看一下就懂了 ,模型只是我們把已經知道的算法透過神經網路跟強化學習做空間搜索而已
※ 編輯: sxy67230 (101.10.6.129 臺灣), 05/30/2023 19:00:28 ※ 編輯: sxy67230 (101.10.6.129 臺灣), 05/30/2023 19:00:54sw2 web3 工業4 5g網路 炒股口號不知何時可以湊滿
難得有認真討論文,而且是正常ML背景的文章
推
這個矩陣乘法化簡是今年的唄,哪有幾年前那麼久
30年前就被問過這題
56
首Po自從ChatGPT的出現,全球好像進入了AI快速發展期 各大科技巨頭最近都在發展AI 不管是研發AI軟體還是AI晶片 感覺這幾年全球AI技術會大幅進步 那問題來了,AI的快速發展很好沒錯21
越複雜越少量多樣的工作,比較偏硬體晶片客製化的,越難被AI取代。 畢竟AI的運作邏輯就是靠大數據做input, 然後再output運作。 像是寫code刷leetcode等這些大眾化的能力,被AI取代性老實說蠻高的。 不過AI被設計出來,本來就是幫資本家省成本,以及賺錢用的。不然一堆寫code的在美國 一年隨便都拿15萬美元以上,對資本家來說成本很高的。4
應該是要反過來問吧? 到底工程師能用 AI 做什麼事情? 來看個很好笑的例子 AI Babysitter For Dog STUNS Over Instant Replacement Companion7
寫程式不會被取代 但現在在寫的這批人可能會 現代軟工主要的競爭門檻是把想法轉換成程式碼的能力 簡單來說就是C++翻譯 python翻譯 java翻譯... 其實跟英文翻譯 日文翻譯很像的 以後程式語言逐漸往最高階語言 自然語言邁進 現代軟工的競爭優勢就大大降低了 讓AI寫code有點像給小孩玩的那種Scratch? 不用知道那麼多細節 甚至也不用管用哪種資料結構或演算法1
阿肥外商碼農阿肥啦! 我自己是蠻愛用新工具的,包含ChatGPT Plus跟AWS toolkit 裡面的code whisperers(這 個目前不用錢)。先說,當前所有的這類工具只是輔助型態,簡單的任務確實可以直接給 他生成甚至不用改,難的就一定要先細看他的code再請工具修正或是你自己先改一點給他 看他才知道。9
AI 比你想得有料 Andrej Karpathy 自己都說他自己大部分時間都靠 AI 生 code 了 這篇老文章就有說 空間時間複雜度?? 可以吃嗎5
一篇基本上paraphrase為主的回文目前就有5次修改 讓人很難正常討論 搞不好明天又改惹 先從最重要的 Software 2.0 當然有 limitation (Who/what does not?) 可是顯然 人的 limitation 多得多 光是翻譯 一句只有小學單字(run, walk)的簡單句型 "Run, don't walk..."
71
Re: [閒聊] AI畫圖是不是大數據拼圖?只要是深度學習AI,原理都是把圖轉換成矩陣,通過神經網路作back propogation學習特 徵,在整個模型的運算過程中只有矩陣,不存在任何圖像拼接的過程 你認為圖很像,是因為那個tag底下的圖大多有類似特徵,模型通過矩陣學習到這個特徵 當然,也有一些generator的算法是會拿部分來源當輸出,不通過矩陣運算的,怎麼選也 是讓模型自己學,類似概念可以參考pointer network或residual network之類的算法37
Re: [請益] 想從零開始轉行當AI軟體工程師這篇應該算是AI勸世文 如果你之前沒有任何工程背景,想要直接轉入AI的話,那真的是建議放棄。 AI發展至今,其實要入手真的非常容易,某種程度上只要知道如何呼叫API (Python為介面)就可以完成很多事情。 我經歷過幾個用deep learning的實際例子,都是要解決既定的工程問題,9
[心得] AI/ML software engineer工作心得之前還是學生的時候在版上發文詢問過方向,到現在已經工作約半年了, 分享一下我後來學習的方向和目前的工作內容,當作回饋。 簡單描述當初發文詢問的原因,想知道詳細內容可以a我的id: 碩班讀AI,畢業後想去日本工作,如果想進外商該如何準備。 ============================================================7
[選校] CMU MRSD/CMU MSE各位好 今年2022 Fall的申請真是非常艱困 目前拿到兩個Offer接近deadline想請大家給些意見 我本身已經是工作5年多的軟體工程師 未來想留在美國就業一段時間 這兩個Offer都在SCS(School of Computer Science)底下6
Re: [討論] GPU加速Transistor層的模擬器我有把你下面推文的兩個連結看了以確定我盡量能理解你的目的。 文中你提到transistor-level與邏輯閘層(gate-level)模擬, 這兩個用詞在你的語境下所代表的意思有點模糊, 我用我的理解以及上篇crossbar的觀點來定義一下: - transistor-level:- middle frontend/fullstack software engineer senior frontend/fullstack software engineer 我是hiring manager請聯繫我或直接申請。謝謝!
- 如題,現時有自由軟體基金會定義的自由軟體(Free Software,不是免費) 使用者可以取得程式原始碼自由修改並散佈 例如GCC編譯器 但是最近出現了非自由的網路服務一說 (Non-free network services)