PTT推薦

[心得] UPenn MSE Data Science 就讀心得

看板studyabroad標題[心得] UPenn MSE Data Science 就讀心得作者
patrickchou
(派翠克)
時間推噓15 推:15 噓:0 →:0

Medium 好讀版: https://bit.ly/3P4vz9t
------------------
[前言]
去年發了一篇錄取心得文後得到了很多反饋,也有許多人來信聊聊自己的申請目標,蠻喜歡這種分享幫助到人的過程,因此趁著現在學期結束實習開始前寫一篇 Penn DS 的心得,記錄一下這一年的經歷,也希望藉此希望吸引更多台灣人申請這個 Program!

[背景]
Education
B.B.A. in International Business, National Taiwan University
GPA: 4.00/ 4.30 (WES 3.88)

Work Experience
一年正職 Data Analyst, 四段實習(一段與數據分析相關)

[Program 介紹]
Penn Data Science 的全名是 University of Pennsylvania, MSE in Data Science
(DATS),是 Penn Engineering 於 2017 年新成立的一個科系,主要優勢在於其強大的修課彈性,讓每個學生都可以安排自己的課表。近幾年科系本身也在不斷調整課程制度,有積極詢問在讀學生對必修課程的反饋,也持續增加 Pre-approved 選修課程清單,對學生需求算是很有心解決

錄取學生背景
DATS 近幾年有擴招的趨勢,加上從去年 Deferral 的碩班生大約有近一百位,從其他
Program 轉系或雙主修大約有 15 位,大學部學生 Submatriculation 大概有接近 50 位。背景主要以 CS / Math / Stats 為主,但就我所知也有 Business / Econ / Fin /
Engineering / Bio / Physics / Chem… 等背景的學生,有應屆畢業生也有工作十年來
完成美國夢的人,相對一些 DS 科系來說背景比較多元,再加上 Penn 一直喜歡少量多次發放錄取,因此估計文書內容的重要性還是蠻高的。成績背景上初步看起來 GPA 是蠻重要的指標,有無 GRE 錄取者但大部分人的 GRE 都不低,建議分數還是考高一點會比較有競爭力。國籍分佈上中印美三國大約各佔 1/3,台灣人本屆有三位。

課程安排
DATS 是 Semester 制度,十堂課畢業,可以決定一年半 (3322) 或兩年 (334 or 343)
完成,課程安排主要分三個部分
1. Foundations:兩堂課 (Intro to Programming, Linear Algebra),若大學
有修過可以直接憑成績單 Waive 掉
2. Core Requirement:三堂課 (Stats for DS, Big Data Analytics, Machine Learning)3. Technical Electives:五堂課,主要分作以下八個 Bucket:
a) Thesis/Practicum
b) Biomedicine
c) Social/Network Science
d) Data-centric Programming
e) Surveys and Statistical Methods
f) Data Analysis, Artificial Intelligence
g) Simulation Methods for Natural Science/Engineering
h) Mathematical and Algorithmic Foundations

學生只要五門選修課中有橫跨其中三個 Bucket 就可以畢業,若兩門 Foundations 都
Waive 最多可以修到七門選修課程,粗略區分可以發現同學選課會分成以下方向
1. Software Engineering 路線:課程主要在 Bucket D, F, H
2. ML / DL 路線:課程主要在 Bucket D, E, F, H
3. Statistics 路線:課程主要在 Bucket C, E, F, H
4. 理論課路線:兩學分可以選擇 Thesis 找教授做論文 (Bucket A),理論課集中在
Bucket E, F, G, H

選課的彈性是這個科系最大的特色,基本上可以選擇所有 CIS, STATS, ESE, EMN 的課程,其他課號也沒有問題(包含 Wharton),唯一的條件是課程本身需要跟 "Data" 有關係,而是否真的有關也是 Director 的主觀判定,經驗聽下來基本上只要說得出這個課對你的職涯有什麼幫助,Director 都會讓你選。CIS / ESE 課程在選課優先順位上 DATS 都是 Tier 1,基本上想選都選得上。

選修課程的 Pre-approved List 也因應學生反饋有逐年在增加,近年增加了不少
Wharton OIDD, STAT 相關的課程,算是滿足了很多人想蹭一蹭 Wharton 風采的夢想
(?) 有鑑於此,我個人其實很推薦商科背景且對 Data Science 有一定熟悉度的申請者可以嘗試看看這個科系,有需多 Business x Data 交叉的選課機會。

個人體驗
Semester 1:必修課為主
CIS 590 Programming Languages & Techniques
因為大學沒修過任何 CS 課程因此無法免修,主要涵蓋 Python / Java 基本語法,對有在寫 Code 的人來說就是一堂幫助平衡找實習 loading 的水課,作業量偏大但不難

CIS 545 Big Data Analytics
一堂野心很大的課,課程主軸可以當成是在針對 Data Science 的做廣泛的說明,基本上整個數據專案的 Pipeline 都會接觸,並在每一個主題結束會提及「想要深入了解這個部分可以選 CIS XXX 課程」,基本上可以當成一個 High-level 的 Overview 課程。課程中期開始以 SparkSQL 和 SparkML 為主軸,缺點是對 Apache 生態系著墨除了 Spark 外都只有很粗略的帶過,若想走 Data Engineer 這堂課程可能不太足夠。若有 DS 背景作業算輕鬆,但若無 DS 背景會覺得這門課相對發散,什麼都碰但什麼都學不深

ESE 542 Statistics for Data Science
涵蓋範圍蠻全面的 Stats 統計課程,前半段重點是 MLE/Likelihood Tests,中後半段會帶到 Regression/ Classification,最後提 Statistical Learning Theory。為人詬病是作業跟考試難度和上課難度有落差,但整體來說是一個很好的 Stats 複習課程,作業跟考試偏難但給分很甜

第一學期因為個人安排以找實習為目標,因此主要以 Loading 較低的必修課為主,讓我策略性地放更多重心在準備實習面試上,這個策略個人認為算是成功也讓我在第一學期就找到實習。

Semester 2:選修課為主
CIS 520 Machine Learning
以 Bishop's PRML 為核心的 ML 理論課,作業和考試皆以數學推導為主,借教授說法是一堂未來想利用 ML 做研究的人必須上的 ML 入門課,很適合對 ML 有基本概念想要深入了解理論的學生,不適合想要做專案累積履歷的人,作業量大但收穫良多

MKTG/STAT 776 Applied Probability Models in Marketing
基本上是我這一年下來最喜歡的課程,整門課程以 Professor Fader 的論文為主,內容涵蓋 Timing, Counting, 和 Choice 三種情境下的機率模型和各種 Marketing 應用情境,課程中後期開始環繞在 Customer Lifetime Value 談論教授畢生的核心研究,是一堂以 Empirical Bayes 為主幹的課程,對想以 Marketing DS 方向為目標的我來說是非常重要且收穫滿滿的一門課

STAT 927 Bayesian Statistics
PhD Level 的傳統貝式統計課程,課程主體就是 Andrew Gelman 的 Bayesian Data
Analysis 這本書,一堂課一章節快速涵蓋這本書的內容,是一門講解清晰容易上手的
Bayesian 課程

第二學期開始以個人規劃為主,這學期三門課程恰好都跟 Probabilistic Modeling 有很深的關係,上一學期的 ESE 542 幫我重新打了一個很好的基礎,也讓我三門課上起來有很好的互補,學期間甚至出現一段時間三堂課都在講 HMM 這種荒謬情況 XD

其他課程
以下隨意羅列一下聽過身邊的朋友上過的課,主要是想讓大家了解這個科系的多元可能性,以下課程都可以當選修,且如果 Foundations 全部免修最多可以修到七門選修!
1. Software Engineering 路線:CIS 548 Operating Systems, CIS 555 Internet andWeb Systems, CIS 505 Software Systems, CIS 502 Algorithms, CIS 550 Databases,etc
2. ML / DL 路線:CIS 521 Artificial Intelligence, CIS 530 Computational
Linguistics, ESE 546 Principal of Deep Learning, CIS 581 Computer Vision, ESE650 Learning in Robotics, ESE 514 Graph Neural Networks, etc.
3. Statistics 路線:STAT 920 Sample Survey Methods, STAT 921 Observational
Studies, ECON 705 Econometrics, etc.
4. 理論課路線:MATH 513 Computational Linear Algebra, ENM 502 Numerical Methods,ESE 504 Optimization Theory, ESE 605 Convex Optimization, ESE 674 InformationTheory, etc.

簡言之:不怕你上!

[實習/全職就業情況]
Disclaimer: 認識的人不多參考就好!

根據 LinkedIn 上搜尋和 New Student Orientation 官方的資料,基本上這個 Program找工作的狀況非常不錯,產業涵蓋科技業、金融業、管顧業,職位部分也因為這個科系的彈性涵蓋了 Quant, DS, MLE, SWE, Consultant, DA,.etc. 以身邊極少數認識的例子
來說,就有聽到 Meta, Amazon, Netflix, Microsoft, Uber, LinkedIn, IBM 等科技業,金融業部分有聽過 DE Shaw, Capital One, Amex, Bloomberg, JP Morgan 等,管顧部分 MBB 都有聽過,感受上不存在因為地理位置或學校非理工強校而比較不好找實習的問題

有一點想說的是因為這個科系的彈性,大約有 20% 的學生主要還是以 SWE 為找
工作的方向,I-20 上是清楚的 "Computer Science" 所以身份不會有問題。悲觀來看也許可以說這代表 DS 還是相對難找工作,但樂觀來看也可以說 Penn DS 給了你很大的舞台,你想做什麼就去做什麼

Academic Field Study
Penn Engineering 在 2021 Fall 正式啟用了類似 Co-op 的制度叫 Academic Field
Study,主要就是可以在第二年的 Fall Semester 進行 Full-time CPT 實習,條件是在第一年必須修完六門課程並 GPA > 3.3。這個機會似乎還不是每個學生都知道,但我個人在入學前就有先了解並且也試圖尋找 Fall Internship 的機會,最後很幸運的也即將在Summer / Fall 兩個學期各做一段 Full-time internship

這項制度個人覺得有好有壞,優點是能體驗不同類型美國公司文化,了解不同 Data
Science 工作內容的偏好,並在最後一個學期針對自己感興趣的方向再去選課;缺點是必須要在最後一學期修四門課程,loading 應該會是不小,同時原本其實可以一年半就完成也就因此延後到兩年。話雖如此,對我這種轉領域的學生來說,能有更實際的機會了解不同 DS 面貌是很可貴的機會,因此如果有這個需求的同學照過來~

[課外體驗]
Penn 的研究生在體驗上和大學部學生其實沒有太多差異,校區相同且許多課程也是
cross-listed 在高年級大學部,因此有很多參與校園生活的機會。除了去各種
Community Group 活動拿免費用品跟 食物外,有幾個很不錯的 DS 相關資源值得大家留意。

Wharton Analytics Fellows
這個 program 主要會配對一名 MBA 學生 + Engineering 碩士生擔任 Lead,帶著幾位大學部/碩士班學生幫客戶做為期八週的專案,Final Presentation 來的都是 Senior
Manager 以上的主管,是一個很有挑戰性的專案。過去兩個學期我體驗過兩種不同身份

1. 從 Technical Lead 角度了解怎麼 Define & Scope Data Science 問題,去思考怎麼找出適合客戶的解決方案並分配任務,過程中也試著去學習如何做 Training 和 Code
Review。這個經驗讓我從更高視角了解一個專案的進行方式,相較之前自己做 DS 專案更能看到許多邏輯上的盲點,注意到更多先前從沒注意到的細節

2. 從 Business Lead 角度了解怎麼定義 Deliverables,怎麼 Explain to non-technicalpeople,怎麼從現有方案整合客戶資源延伸到 Potential Impact。這個經驗讓我學到怎麼跳脫了 Engineer 的思維去跟商業需求和應用做結合,對往往需要很多跨組合作的 DS來說是個很珍貴的經驗

Penn Data Science Group
說來慚愧因為太忙到後面有點淡出 XD 但這是一個校園內很不錯的 Data Science 組織,有 Journal Club 會定期有人分享有趣的 Paper,有 Kaggle Club 會定期組織一起參加Kaggle 比賽,也有對客戶的專案組協助客戶解決問題(類似前面的專案但 run by
student)即使沒有太多時間參加各種專案,我覺得把自己泡在同溫層中的過程也讓我學到很多,認識一些志同道合的戰友,是一個很不錯的資源!

Research Assistant
Penn 絕大多數院所都排名在全美 Top 20 ,Program Coordinator 時不時會在 Piazza
上分享各系所研究助理的職缺,對於想踏入研究領域或是了解交叉應用的人來說是很好的機會!這學期我參與了 Wharton Political Lab 的研究,主要做了一些 NLP 方向的分析,這樣的應用對我來說也是開了我的眼界。如果你對 ML 研究很感興趣,Penn 也有
PRiML 的研究資源

[適合人群]
說了這麼多,這個科系到底適不適合我呢?我認為這個 Program 適合以下類型的人:
1. 想要拓寬賽道、對自己方向有所規劃的人:多元的選課讓你有機會去嘗試或
拓寬不同賽道,若有特別想精進的方向也有很多彈性讓你自己量身定做課表
2. 想多結合商業應用的人:Wharton 的機會很豐富,DATS 也可以選很多相關的
Stats 課程,前面提到的 Wharton Analytics Fellows 也是我大推的一個學習管道
3. 想體驗校園生活的人:Penn 很大資源很多,只怕你不去找!

相反的,我認為這個 Program 相較不適合以下的人:
1. 初入 Data 領域,對目標還不太清晰的人:研究生並沒有太多基礎的課,可能會需要花很多時間自己學習,且太自由的選課反而適得其反
2. 看重歸屬感或團體感的人:有些同學我一年下來都沒有一起上過課,大家各有目標所以也會稍微比較分散一些,團體感可能比較沒有必修多的 Program 來的高
3. 重視地理位置的人:費城畢竟不是紐約和灣區,雖然是個大城市但當地機會和娛樂也相對沒這麼多

[結論]
沒什麼結論,主要就是想推薦大家多多看一眼這個 Program!近年學校也開始新建新的
Data Science 大樓預計在 2024 啟用,顯示了學校對 Data Science 的重視,雖然目前在 Data 方向上 Penn 的知名度沒有其他理工強校這麼高,但我認為這個 Program 的彈性和同儕素質都很不錯,適合對 Data Science 有經驗且想要自己安排課表的學生,期待更多人來申請這個 Program!

今年申請季也要快要開始了,如果想要聊聊的朋友歡迎搜尋之前申請心得文下的聯繫方式跟我聯絡,很樂意幫助大家,祝大家申請順利!

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 71.230.161.115 (美國)
PTT 網址

mistrust052505/07 13:06推!

unmolk05/07 13:25推 好想去UPenn

nniouu05/07 13:30推推推 對你的申請文超印象深刻

angellee010205/07 15:41推推!感謝分享~

joycejou05/07 17:22推~~感謝分享!!!

zzzz893105/07 18:49一年半 (3322) 或兩年 (334 or 343) <--這是寫反嗎?

nctukmdick05/07 19:06寫的好棒 推推推

homesa05/07 20:55謝謝細心的分享~

psythe00105/07 22:08大推用心分享~有機會也想去UPenn唸書~

cooper7605/08 03:08用心分享推

tim7655huang05/08 04:54推心得!

Illenium05/08 10:54

pennylins05/09 00:47推推 有課程分析真的很棒

Jim4305/09 05:34推推

Garatee12305/09 16:36介紹的真完整