PTT推薦

Re: [請益] 想往資料科學領域前進

看板Tech_Job標題Re: [請益] 想往資料科學領域前進作者
jerkoffme
(摩德男孩)
時間推噓 3 推:3 噓:0 →:7

※ 引述《GGSuperInIn (ㄚㄛ)》之銘言:
: 本人資歷:
: 中字財金學士
: 實習0
: 英文托福:91
: 剛退伍
: 目前手上面到目前大概四間offer,
: 1.銀行風險管理部門:
: 工作內容大致是用SQL、R處理財務資料後用tableau視覺化報給上級主管做是否借貸的決定
: 目前大致行情爲年薪700k台幣
: 2.外商市場分析研究員:
: 工作內容是根據客戶需求,發放問卷和訪談,之後用spss、excel做資料分析後視覺化給客
: 戶
: 報價533k台幣左右
: 3.外商保險業資料分析:
: 從銀行裡取得財務資料,並用SQL、excel分析風險,做成可供主管決策的dashboard
: 報價一樣533k上下
: 4.廣告資料分析師:
: 主要工作是guide下面組員最基礎的excel、SQL擷取資料和清洗、優化資料擷取到清洗的?: 程。
: 行情一樣533k上下
: 我非理組純資工出生,自知條件差,在學的時候自學python、SQL、進階的R統計分析,在: 伍的時候拿了一張好像沒啥卵用的GoogleDataAnlytics證照。
: 我希望自己能在第一份工作裡面拿到該拿的DA前端資料清洗、分析的技能包(希望做2年?: 右),再出國讀DS碩,看有沒有機會在美國工作(在美國有家人)。
: 請問現階段的我,在出國這兩年間有什麼需要做的,為未來前往DS領域鋪墊?(ex: Goog: DataScience認證之類的)
: 希望各位前輩們能指點迷津,謝謝


我自己身為轉職 DS 領域的過來人分享點經驗和想法

目前30 初頭

轉職 data 領域約 5年目前在 IB 交易室做 DS 底薪 110K 不含獎金,年薪約 2M

我自己四大文組,工作前兩年是系統廠 PM ,完全不懂軟體,下班之餘自學沒有任何補

習。

後來一開始有小公司願意收當 DA 年薪 500K,一開始一定是 data cleaning,data

manipulating,寫 SQL script 和做 dashboard,但如果只是停在這個階段,那我會說競

爭會非常激烈,薪水要往上走也很難,市場上 BA,DA 競爭者非常多。除非你英文幹強。

一開始我也是先學 R,但我覺得會 python 機會會多很多。


下班之餘我一直刷 Kaggle 的比賽,學習 ML 和 DL 以及強化程式架構和邏輯,你可以在

過程中學習處理資料的技巧和思考邏輯。能在有獎金的比賽 private leadboard 進到

TOP 20 大概就有一定程度了。在深一點可能要讀一些 Paper,在這邊我很推薦

- 李沐大神的深度學習影片。


再來現在大公司基本上資料都是用 Hadoop 的生態系在做,因此會 Spark 能在往上

一階。不過個人練習只能用 local mode,這部分比較吃機緣能碰到相關職缺累積技能。

以我自己的 DS 工作內容,基本上要做非常多的東西也很雜,要做 data engineering

建立 data pipeline,相關框架如 airflow,Kedro,Prefect,dagster 等等,也需

要 build ML modle 和寫 crawiling。不過還是要看公司和職位導向,做網路業的

product DS 就需要大量的A/B testing 技能包。這我就幾乎不太會。


外商大部分工作都需要和 global team 的同事合作,因此雖然是 DS 你也要很熟

git flow 以及 DevOps 相關等等,不會只是一個 main.py 或 SQL script 寫到底,要考

量整體 project 框架,參數紀錄後續維護,設計 ML pipeline,job maintain 還有

monitor 等等。


一路走過來,我自己覺得這條路很辛苦,以剛畢業或初學者只擁有上述那些技能確

實跟我剛出會時能拿到的薪水 range 差不多。

因為台灣 data 相關缺很少,AI 很紅的情況下大家一頭熱的投入。我個人覺得非常的捲。

國外的 DS 可能建議要讀到 PHD。

data 領域有非常多需要學習的地方,也是很難很深的領域。我覺得不用灰心,設定好目標

擬定好學習計畫並確實執行,當機會來了好好把握住。以上



-----
Sent from JPTT on my iPhone

--
推 maxxV3:說真的 有人總統想選一個女人家嗎 = = 04/19 21:48→ teremy:韓國總統都是女的了。韓國還不夠大男人嗎? 04/19 21:49噓 miler22020:樓上是遠古時帶來的嗎 04/19 21:49→ miler22020:樓樓上 04/19 21:49推 Top5566:樓樓樓上 04/19 21:50→ miler22020:樓樓樓樓 幹 算了 04/19 21:50

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.164.63 (臺灣)
PTT 網址
※ 編輯: jerkoffme (223.137.164.63 臺灣), 01/27/2024 23:51:48 ※ 編輯: jerkoffme (223.137.164.63 臺灣), 01/27/2024 23:52:28 ※ 編輯: jerkoffme (111.250.0.44 臺灣), 01/28/2024 00:06:13 ※ 編輯: jerkoffme (111.250.0.44 臺灣), 01/28/2024 00:10:39

DrTech 01/28 00:12ML很圈,data不卷,台灣做data的反而少數吧

※ 編輯: jerkoffme (111.250.0.44 臺灣), 01/28/2024 00:19:28

shiwa 01/28 00:17但很多data的缺都只是title掛data但實際上做的根本

shiwa 01/28 00:17無關

cs410567cs 01/28 01:05kaggle 要top20我覺得很難

cs410567cs 01/28 01:08這樣才算有一定程度 我看一堆人要跳樓了

TsmcEE 01/28 01:14我還以為ib只收純血cs/ee

zxp9505007 01/28 02:19現在主流是往AutoML發展 pipeline自動規劃

Louisdoudou 01/28 03:13機器學習這種方法已經不是難事,重點是要用在那,問

Louisdoudou 01/28 03:13題是什麼,不然用語言模型就解決大部分的問題了,因

Louisdoudou 01/28 03:13為機器不會問問題