PTT推薦

Re: [分享] 特斯拉FSD beta 來比眼力有沒有比AI好

看板car標題Re: [分享] 特斯拉FSD beta 來比眼力有沒有比AI好作者
ewings
(火星人當研究生)
時間推噓11 推:17 噓:6 →:53

※ 引述《ykjiang (York)》之銘言:
: 從最基本的原理來說,光達跟雷達就是用來測距,理論上只有一維的資訊
: 三維的部分是經過一些設計、運算後得到的
: 反而鏡頭得到的一開始就是二維資訊,然後可以經過運算得到三維的資訊,

這邊看完,我的感想只有“供三小?”

雷達與光達在原理上是利用掃描的方式,取得距離與向量,本質上資料的維度就是大於二維了。

是什麼時候變一維的?如果要這麼瞎扯,那鏡頭裡的CMOS一次也只能讀一個cell的資料,一樣得要逐個掃描才能得到二維影像(這個就是所謂的果凍效應的成因),
照你的說法,鏡頭不也一樣是一維的?

: 特斯拉更進一步從中取得四維資訊(多的那維是時間軌跡預測)

這邊也不知道在供三小

在半個世紀前,雷達後處理技術就已經發展出利用比對前後時間目標的變化,預測目標未來位置,
並且持續追蹤的技術。甚至還有類似合成孔徑雷達(SAR)那種利用時間與位移積分,
利用二維掃描形成3維雷達影像的技術。

而利用都卜勒濾波技術,甚至不需要比對前後時間的資料,就能直接得到目標的速度,
在半個世紀前,雷達就能直接利用都卜勒測速,外插推估目標的未來位置。

但也沒人講雷達是四維資料的探測器。

而特斯拉的前鏡頭並沒有構成立體視覺,就算加上時間預測,也只能構成2.5D,
(三個定焦鏡只能利用影像模糊的程度大致判斷距離),這也是特斯拉自動駕駛在視覺深度一直為人所詬病的地方。


: 以目前的技術:
: 距離方面,光達的精度比較高
: 平面部分,鏡頭的精度較高,然後鏡頭還可以判斷顏色這個重要資訊
: 以自動駕駛而言,兩者的精度都超過人眼了
: 所以關鍵還是在 AI 等其他方面

無腦特粉才會覺得只靠鏡頭和AI就行

真的在搞自動駕駛的,在研究的是怎麼做多感測器的融合。

https://global.kyocera.com/ces/img/sensing-technology/sec11_img03.jpg

圖 特斯拉FSD beta  來比眼力有沒有比AI好
像是直接將光達和攝影機做成同一個感測器,就是其中一個方向。

: ※ 引述《airforce1101 (我不宅)》之銘言:
: : 影像、雷達、光達不太一樣,我把影像與雷達、光達拆成兩類好了,影像對於訊號處理來
: : 說屬於二維陣列,但是雷達與光達可以帶回三維的目標資訊,雷達就是低頻段的光,因頻
: : 率特性不同,所以適用場景不同,光達的脈衝時間很短,所以較於雷達相比,對於相同目
: : 標,可以帶回更高精度的資訊。
: : 光達的領域上有關延展性目標,可以參考K. Granstrom, M. Baum, and S. Reuter 所著
: : 的這篇文章 Extended object tracking: Introduction, overview, and application.
: : 在AI輔助下,或許環境良好下影像能做到光達能大多數能做的事,但某些判斷影像與光達
: : 先天上的差距還是存在。
: : 其實也好奇,傳感器與影像間的關聯是否讓AI找出並學習其特徵向量,有待高手解答了。

--
亂餵流浪狗的人其實和渣男沒什麼兩樣
一個是讓狗以為自己是有主人的狗,一個是讓人以為感情有了歸宿
但都只是做半套不想完全負責而已

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.76.142.11 (臺灣)
PTT 網址

techih 04/09 02:37特斯拉也有雷達OK 不是只靠鏡頭

techih 04/09 02:40我看完你寫的感想也是公三小?!?

ewings 04/09 02:46特斯拉的前雷達分辨度大於7度,在50公尺外並排行駛

ewings 04/09 02:46的兩輛卡車,特斯拉雷達上也會辨識成同一個物體。

techih : 兩個鏡頭就能構成立體視覺了 難道你有三個眼睛?

04/09 02:47 特斯拉用的是三個焦距不同的定焦鏡 對同一個物體只會有一個鏡頭有較清晰的影像 這種鳥玩法是弄不出立體視覺的。

ewings 04/09 02:49而特斯拉用了這種等級的雷達,雷達測距資料與影像資

ewings 04/09 02:49料的融合,基本上和用AI預測擲筊結果差不多吧

※ 編輯: ewings (42.76.142.6 臺灣), 04/09/2021 02:52:14

techih 04/09 02:50螢幕顯示一輛車 並不代表他就只能看到一輛 只是你

techih 04/09 02:50看的越細需要的電腦資源就越多 那有沒有這個必要

techih 04/09 02:53我認為特斯拉比較著重在視覺辨識,雷達只是輔助

techih 04/09 02:57我覺得不太需要下定論啦 如果真覺得光達終勝那可以

ewings 04/09 02:57特斯拉用三顆定焦鏡的鳥玩法,反而增加了電腦運算的

techih 04/09 02:57買Mobileye股票 應該會賺翻

ewings 04/09 02:57需求量。光達+鏡頭,關聯性演算法的需求可以低到只

ewings 04/09 02:58用單晶片距離,但是特斯拉就要用到礦卡級的處理器。

techih 04/09 02:59但我記得NIO用光達卻配了4顆N牌高階處理器耶

techih 04/09 03:02 https://i.imgur.com/xnmwZQW.jpg

圖 特斯拉FSD beta  來比眼力有沒有比AI好

ewings 04/09 03:12人家NIO要搞的ADAS,是要直接衝Level 4,才要開發這

ewings 04/09 03:12個規模的硬體。可沒像特斯拉還要求車主雙手不能離開

ewings 04/09 03:12方向盤呢。

ewings 04/09 03:30另外,用NIO沒像特斯拉小器的使用低解析度的攝影機

ewings 04/09 03:30,影像串流處理的量本來就比較高,把tops去除pixel

ewings 04/09 03:30數量,特斯拉用的運算資源還比較高勒。

Guideboy 04/09 03:36三個定焦鏡是指三個不同焦距的鏡頭?

Guideboy 04/09 03:37是的話對同一物體可以同時準焦吧

問題是鏡頭內的影像不會只有一個物體,而且這三顆鏡頭的焦距範圍各差了100公尺 相當於戴著單筒望遠鏡,還傻到要建立兩眼立體視覺一樣搞笑

Guideboy 04/09 03:39只是成像時物體大小會不同 不會只有一個準焦

Guideboy 04/09 03:41不會有你說的一個鏡頭清楚 其他模糊的情況

a1445979 04/09 03:42到底在公三小,講的好像特斯拉沒有要衝Level4一樣

a1445979 04/09 03:43你要針對物件辨識、車輛辨識、道路辨識好像不用運

a1445979 04/09 03:43算資源一樣

※ 編輯: ewings (42.76.142.6 臺灣), 04/09/2021 03:52:09

kmlvli84 04/09 03:48你好像分不清焦距跟對焦距離的差別,特斯拉用了三

kmlvli84 04/09 03:48顆不同焦距的鏡頭,但是這三顆鏡頭的對焦距離基本

kmlvli84 04/09 03:48上可以視為泛焦。加上三顆鏡頭的位置並不重疊,是

kmlvli84 04/09 03:48完全可以計算出深度的,可惜的是並不是全畫面都算

kmlvli84 04/09 03:49得出來。

ewings 04/09 03:53你講的不就我上面已經講過的2.5D?

ykjiang 04/09 03:53而且特斯拉前向的鏡頭總共有五個,另兩個在側前方

ykjiang 04/09 03:53側前方那兩個鏡頭的規格是完全一樣的

https://qph.fs.quoracdn.net/main-qimg-18ea7bf48a6f7dfdce9e384c2ef80840

兩個側前方的鏡頭,和前方鏡頭視角重疊的範圍只有十幾度,而且還不是在車的前方。 這個分配是要怎麼弄出兩眼立體視覺??

※ 編輯: ewings (42.76.142.6 臺灣), 04/09/2021 04:00:51

kmlvli84 04/09 04:03你對緯度的定義有問題,兩顆鏡頭只要能看到同一個

kmlvli84 04/09 04:03物體,就必定可以辨識出三維的位置。可辨識範圍不

kmlvli84 04/09 04:03會影響維度。而且這三顆鏡頭只有一顆是長焦的,你

kmlvli84 04/09 04:03的望遠鏡舉例根本不合邏輯。

ykjiang 04/09 04:04不知你怎麼看出十度,而且只要那兩個重疊夠大就夠了

kmlvli84 04/09 04:05你忽略了wide forward camera跟main forward cam

kmlvli84 04/09 04:05era的重疊區了。

ykjiang 04/09 04:08十度應該是廁後方那兩個鏡頭

ykjiang 04/09 04:11重點是Tesla這樣的鏡頭配置行之有年了,

ykjiang 04/09 04:11要真有如此低級的設計錯誤發生,早就更正了

ykjiang 04/09 04:59查了一下Tesla 3D視覺主要是靠正前向的那三個鏡頭

ykjiang 04/09 04:59可行的原理如 kmlvli84 說的

ykjiang 04/09 05:00只要兩個鏡頭拍出的同一個物體有不同位置或大小,

ykjiang 04/09 05:01理論上就能估算出距離

ykjiang 04/09 05:03不同大小,可以因為視角範圍不同或焦距不同造成的

ingmu 04/09 07:58好了別吵 來看資料 Tesla其實用單鏡頭就能判斷距離

ingmu 04/09 07:59原理說明 http://bit.ly/TeslaHere519

ingmu 04/09 08:00實測遮到剩一個鏡頭還能在路口轉彎

ingmu 04/09 08:00https://bit.ly/TeslaHere609

ssss127 04/09 08:12無腦特黑的最高表現?理性討論不行嗎

ssss127 04/09 08:29不懂就虛心求教 整天扣人帽子

sted0101 04/09 08:32嗯嗯 口氣很大水準很高 哈哈哈哈哈

pavaro 04/09 09:00供三小 然後咧 其他車廠現在在幹嘛

bluemkevin 04/09 09:17單鏡頭理論上可行,但是特斯拉目前的鏡頭規格有風險

bluemkevin 04/09 09:17...

ssss127 04/09 11:05換鏡頭分分鐘的事情而已 目前特斯拉鏡頭解析度不高

bluemkevin 04/09 11:19不光是鏡頭的問題,早些年前晶片設計接收鏡頭影像格

bluemkevin 04/09 11:19式的接面可能也不堪使用。

bluemkevin 04/09 11:23現在的鏡頭不會只丟純影像的內容給晶片,還會伴隨其

bluemkevin 04/09 11:24他感測資料,然後車用鏡頭這幾年吃記憶體頻寬越來越

bluemkevin 04/09 11:24恐怖,車用壓縮也不太可能用lossy的方式,不過這看

bluemkevin 04/09 11:24車廠對於風險的拿捏。

zxcbrian 04/09 12:55那篇果然沒內容

largesperm 04/09 13:02你太小看軟體了

moboo 04/09 16:39感覺你是在硬體廠,現在軟體單鏡頭就能看深度了。

moboo 04/09 16:39看物體大小加上時間就能判斷

moboo 04/09 16:39上面推文很多人寫了,而且這是潮流

milichang 04/10 01:09謝謝你帶來歡樂

shadowppt 04/11 01:41做硬體的怎麼不知道景深這件事.....