[請益] 如何將網頁的數據自動轉成csv?
hi 各位好
我覺得這個問題應該難不倒大家
但我發現我不太知道怎麼下手
我目前在統計中國cov感染的數據
比方說安徽省的官方統計數據可在這邊找到
http://wjw.ah.gov.cn/news_details_54250.html
這是1月30日的
我有把從1/22-今天的html都下載到一個資料夾下
共40幾個html檔案
我希望能寫個script將 不同日期的新增確診病例
自動產生csv 報表
類似這樣
一月22 一月23 一月24 ...................三月五日
合肥 xx
蚌阜 yy
阜陽 zz
六安 aa
銅陵 bb
池州
黃山
..
.
.
我是想過用linux bash 去寫一個script 不過有點卡住
或是用panda應該也可以
能否請各位指點一些方向呢??
感謝!!
--
估狗 generate csv file in <你熟悉的程式語言>
用爬蟲 parse dom呢?
read file然後分析然後save csv
啊原來是這個樣子的資料, 那就抓字串分析了
資料來源只有新聞嗎? 這樣只能手動整理了
selenium
使用這些數據之前應該要先問這些中國給出的數字可信度有多
少 ...
不是很建議這種超級不具格式的資料.. 先不論正確與否啦...
真要做,可能也等所以資料都塵埃落定不再變動 才開始寫對應
的parser...
用Excel阿 貼到excel 在存檔 存成CSV
PapaParse
蒙恬 掃描筆???orz
你可以用C寫 這樣應該會更快一點 咚
這個連表格都沒有 很難用程式處理吧
這個怎麼做都可以吧就字串處理mapping在塞到csv裡.
例如regex 擷取,前後的四個數字。 ex:(合肥50例
),(豪洲20例) 之類的
沒有特定格式就抓關鍵字
感謝各位提供的資訊。
23
[請益] 新手如何入門第一個script語言各位板上前輩好 小弟剛入職軟體業 以前主要專長是寫C++ 沒寫過太複雜的script 最近在跑測試和蒐集數據的時候 使用到很多前人留下來的script 心裡想著這些script真厲害 我也想自己試著寫看看來增加工作效率 打開來看後才發現十分複雜 裡面有各種符號縮寫 我以前寫過的根本幼幼班等級 而且不同的script還使用不同的語法 目前有看到 bash, tcl, tcsh, perl, python11
[討論] 自製PLG數據工具更新-沃許本得分機器?我自製的PLG數據網站: 更新部分 1. 數據統計方式新增Per36(換算每36分鐘數據) 2. 可以單純查看數據表並下載csv檔案11
Re: [分享] 谷鱒神獸對決另一個稀有之處自己文章自己回~ 滿多人好奇「揮空3次」這種類型三振的數據來源 所以我去查了一下 Twitter那篇分享的數據應該是來自Statcast 進去後有一堆參數可以填9
[軟體] 有能統計csv的軟體嗎想把資料從Notion搬出來 notion有個功能是能統計table裡的值 例如整欄相加 或是不重覆個數 mac能用numbers開啟csv file,但是如果要用公式的話 就需要儲存成.numbers檔6
[情報] 占星術不支持斜槓人生我們現在是圖片制所以請點連結觀看 造成不便請海涵 ==== 從大數據雜質到人生雜質2
[請益] IB的交易報告下載不見了?自己都是1季整理一次交易報告 記得按報告就可以選擇 日期+格式 下載交易報告 今天登錄IB找不到可以下載的地方...是否被移除了呢? 只能先自己定義報告內容,再下載csv報告,很不方便... --2
[分享]自行車功率課程產生器(by台北單車go)台北單車go最新力作:室內自行車功率課程產生器? 這個工具軟體讓你可以免費打任何功率訓練課程(在edge碼表上)2
[請益] 群暉 420+ 下載異常請教最近幾個星期發現使用兩年多的420+ 有怪怪的狀況 以下是大致的情境 下載檔案前先另存該檔案的封面圖片 win10自動開啟資料夾 選擇NAS所在的儲存地後儲 存圖片 接著下載檔案 win10自動開啟剛剛選擇的資料夾 然後下載檔案(免空)- 可以試看看tune my music 自動同步要額外月費,可以支援的平台常用的都有(spotify tidal am kkbox…etc) 如果只是要搬歌單那一次性免費版就解決了 像spotify他可以直接讀公開歌單連結蠻方便的 但我只有親測過sp->am