PTT推薦

Re: [分享] 特斯拉FSD beta 來比眼力有沒有比AI好

看板car標題Re: [分享] 特斯拉FSD beta 來比眼力有沒有比AI好作者
ewings
(火星人當研究生)
時間推噓 3 推:12 噓:9 →:40

※ 引述《ykjiang (York)》之銘言:
: ※ 引述《ewings (火星人當研究生)》之銘言:
: : ※ 引述《ykjiang (York)》之銘言:
: : : OK, 以雷達波的特性,的確如你說的,可以一個雷達波出去,同時有多組天線接收: : : 這部分跟光達有差異。
: : 笑死,光達輸出的資料從來就是三維的,只有一維的叫雷射測距儀。
: : 如果是更早之前還在用LADAR為名的時代,還有更多是利用全像原理,用相位差生成三: 維資料的技術。
: : 對系統來說,不過感測器是用甚麼原理,輸出的資料格式如果是三維的,那就是三維,: : 有差別的只是更新率而已。
: : 而光達輸出的一直都是三維資料,即使是平面光達,也是三維資料降維。
: 我沒說光達最後的輸出資料不是三維,我只是說初代的光達是用一維的雷射測距,經巧: 妙設計後得到三維的資料

笑死,你又把你自己的妄想拿來當證據了,啥“初代光達”!

https://www.researchgate.net/publication/250192756_Three-Dimensional_Imaging_Laser_Radars_with_Geiger-Mode_Avalanche_Photodiode_Arrays

20年前,連名稱都還沒統一叫Lidar時,就已經在研究使用光電感測器陣列直接生成三維影像了,

一開始研究光達的時候,就有人從雷射全像技術出發,從來沒有你想像的“一維”Lidar

: : : 你講的應該是 Rolling Shutter 造成的果凍效應,
: : : CMOS 會採取 Rolling Shutter 有很多因素,例如為了功耗、快門速度、共用元件等: : : CMOS 後來也有 Global Shutter 的設計
: : : Rolling Shutter 是同時一排 cell 曝光(不算逐個 cell,硬要挑的話)
: : : Global Shutter 是全部的 cell 一起曝光
: : : 至於 CCD 是採用 Global Shutter 的設計
: : : 你說的為了輸出 NTSC/PAL 逐個 cell 掃描,是發生在後段處理上
: : 笑死,再掰嘛
: : 特斯拉用的就是CMOS影像感測器,照你的講法,那也是一維的。
: : 現在不管是哪種攝影機,都是輸出序列訊號,不管是用rolling還是globe shutter,: : 都是一個一個cell的資料丟到暫存器,再以一維資料格式(NTSC)輸出
: 這部分也是,我一開始表達的也是 camera 的感測元件一開始就是二維的 cell 陣列
: 一個 cell 一個 cell 讀是你要抬槓,才提出來的,然後你還提了果凍效應佐證。
: 另外,camera 一般內部有 buffer 儲存完整的 2D data
: 輸出時才用你說的 NTSC 序列輸出,NTSC 基本上是舊時 TV 格式,高解析度的 camera: 不用這種輸出格式了。而且 NTSC 還有奇偶交錯的問題,在處理上容易碰到另一種跟果: 凍效應有點類似的問題,不過這也扯遠了。
: 其餘的輸出格式還有很多,也是各種取捨,不再贅述。

總歸來說,就是你自己鬼扯說啥“一維”的鬼東西,結果,CMOS的工作原理打你的臉罷了。

CMOS要在每一個cell就將電荷轉換為電壓,就注定只能逐個掃描讀取,
就剛好打臉你所謂“光達是一維,而攝影機不是”的蠢說法


: : : 1__2_.5e834778af184.png
: : : 80m鏡頭,我是敲「側」前方的兩個前向鏡頭,不是敲(正)前向鏡頭
: : : 而且這已經不是重點了,
: : : 如之前推文說的,特斯拉 3D 視覺,主要是靠正前方那三個鏡頭
: : : 基本上沒側前方那兩個鏡頭的事了
: : 別搞笑了
: : 特斯拉的三個鏡頭焦距相差那麼多,說能構成視覺深度,是你在幻想吧
: : iphone手機上面有兩到三顆鏡頭,但是還不是乖乖的上Lidar?
: : 不同焦段的鏡頭,物體的影像在鏡頭內的像素差距非常大,光是判斷是不是同一個物體: 都要消耗不少演算力了,
: : 還妄想能構成深度視覺?
: : 更別提特斯拉用的還是非常悲劇的1.2M像素鏡頭。如果像NIO用的是8M的,還勉強有點: 機會構成2.5D
: : 如果兩個焦段差那麼多的鏡頭就能構成深度視覺,你都可以去apple總部前面嗆他們白: 癡才要額外用Lidar了。
: 我不確定你說的 2.5D 多出的那 0.5D 指的是什麼

笑死,連2.5D都沒聽過,那你是要啥資格在前面鬼扯深度視覺的東西?
第三維的資料精度只能當參考用,統計學上達不到七成的可靠度,就只配用0.5D


: 不過前面推文中也有人給連結了,證明一個攝像頭就能測得深度,多個攝像頭更準確。
證明啥?證明用Lidar的apple公司是傻子,你才是天才?

要用偽測距騙這種傻瓜特教教徒還不簡單?

直接假設路人的身高是170公分,再用攝影機焦距和像素高度換算,就得到偽測距了,
這個方式在100年前就出現了,像狙擊鏡上面就有刻度讓射手可以用人當參考物,粗略的估算距離。

但是如果路人身高不到150,又恰巧特別瘦,或是行進間突然彎腰,使像素高度變化率大幅改變,
讓偽測距出現很高的誤差怎麼辦?
你以為特斯拉之前出包,撞上橫躺地上的貨車、撞上等等紅燈的機車的事件是怎麼來的?

AI再怎麼訓練,還是會有大數據資料沒涵蓋到的少數情況。當自駕車數量增加至上千萬輛時就算這些少數情況發生機率再低,在這麼大的母體數量下,發生次數也會變得很高。
所以對自駕系統真正負責任的公司,才會用光達等可以真測距的感測器來設計。

: 因為車子行進間可以拍很多個對同一物體不同距離下的 frame
: 至於特斯拉是怎麼辦到的細節部分,我不知道,唯一確定的要耗費很多算力,
: 連結如下:
: 《Autopilot》AK談論AP開發細節 (2020/02)
: https://www.mobile01.com/topicdetail.php?f=741&t=6137451
: 《Autopilot》FSD初探25-遮住鏡頭還能在路口轉彎嗎?
: https://www.mobile01.com/topicdetail.php?f=741&t=6246238

--
亂餵流浪狗的人其實和渣男沒什麼兩樣
一個是讓狗以為自己是有主人的狗,一個是讓人以為感情有了歸宿
但都只是做半套不想完全負責而已

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.200.47 (臺灣)
PTT 網址

bluemkevin 04/10 11:14CMOS sensor 接觸到的都是逐行送出資料。

bluemkevin 04/10 11:16車用的也是

as6633208 04/10 11:20純影像我覺得至少可以判斷自己有沒有碰到啦,但要去

as6633208 04/10 11:20提前推估距離或深度到很準,我覺得就有點難了,不要

as6633208 04/10 11:20說機器,網路上一些誤導是立體的圖片人自己肉眼都很

as6633208 04/10 11:20難判斷了吧,機器光用影像怎麼可能就可以解決==還是

as6633208 04/10 11:20要結合別的傳感器啦

ewings 04/10 11:21coms是循序讀取,先放在暫存器中,後面才是你看到的

ewings 04/10 11:21逐行輸出。基本上還是延續過去電視機的線掃描原理。

※ 編輯: ewings (42.72.200.47 臺灣), 04/10/2021 11:22:36

ingmu 04/10 12:45撞貨車的是AP不是FSD 撞機車的沒開AP 搞清楚再來...

ewings 04/10 12:49笑死,你是特黑吧?連ACC都要測距了,你這樣講就是

ewings 04/10 12:50特斯拉黑心,AP都不測距的?

ssss127 04/10 13:04喔 你比Elon更懂摟 請問現在哪裡高就?

ssss127 04/10 13:05是世界自駕系統權威 還是計畫主持人?

ewings 04/10 13:44又有一個傻瓜特教教徒自以為比apple公司厲害??

ssss127 04/10 13:48可憐 特黑沒本事 也只能在這裡發文該該叫

ssss127 04/10 13:48這麼強 怎不發篇世界級自駕論文

ssss127 04/10 13:49以自己貧弱的知識 還不知道自己丟人現眼

kazami 04/10 13:52我想要比elon懂的人很多吧 他只是個CEO, 能有多少

Elone Musk成功的關鍵在於他能把失敗視為工程改進上的大收穫 像最近SN-8~11全炸了,但是他眼睛也不眨一下。 問題在於你要不要當他的白老鼠.....

kazami 04/10 13:52時間去碰觸這塊 難道你覺得庫克就很懂apple雙鏡頭

kazami 04/10 13:52三鏡頭運作原理跟細節嗎?

ewings 04/10 13:53笑死,傻瓜特教教徒怎麼不先去SAE門口叫囂說特教FSD

ewings 04/10 13:53神器居然只拿到level2?

bluemkevin 04/10 13:59目前以循序讀取大宗,所以我不知道他到底要表達什麼

bluemkevin 04/10 14:03即使是同時曝一整張圖,讀取還是得逐序,感測器不可

bluemkevin 04/10 14:03能同時讀一整張圖跟倒一整張圖出來。

其實真的要說,現在的電子掃描雷達天線,因為使用MIMO的設計,還稍微比較有跳脫循序掃描的感覺

※ 編輯: ewings (42.72.200.47 臺灣), 04/10/2021 14:14:47

bluemkevin 04/10 15:02一次要倒一張圖也可以,備夠大的記憶體,單一圖點10

bluemkevin 04/10 15:03bit數,整張圖是很可觀的數量級。

ykjiang 04/10 16:01最後輸出的當然序列的,其他數位裝置也一樣,省接線

ykjiang 04/10 16:02果凍效應跟最後輸出的介面無關,是曝光順序

ykjiang 04/10 16:04相關細節可以參考 CMOS Image sensor 的原理介紹

bluemkevin 04/10 16:38sensor內會備有記憶體,因為要達到real-time,現行

bluemkevin 04/10 16:38的大量儲存裝置都不合適,因此備的幾乎是SRAM,但SR

bluemkevin 04/10 16:38AM不會備到整張圖的大小,因為真實還是得依序讀取An

bluemkevin 04/10 16:38alog的值。

ssss127 04/10 16:39現在是誰在叫囂 你怎麼不去特斯拉門口靠北 我自己

ssss127 04/10 16:39很屌 你們都廢物 沒我懂

ssss127 04/10 16:41特斯拉自駕部門leader是業界權威 你???天橋底下

ssss127 04/10 16:41說書都比你行 臉皮還超厚 被打臉還不覺悟

ssss127 04/10 16:44整天被打臉還一直開文章 特黑都這副德性

ykjiang 04/10 16:44SRAM 太貴,當然能省就省,只要備到能趕上輸出即可

ssss127 04/10 16:45不懂就虛心請教很難 人家y大也是很客氣回覆討論

bluemkevin 04/10 16:46global shutter 類似先把資訊鎖在浮閘內,再讀出,

bluemkevin 04/10 16:46但讀還是得依序讀。

ssss127 04/10 16:47就你自以為 比世界最先進自駕公司之一還屌 臉皮厚

ssss127 04/10 16:47成這樣

bluemkevin 04/10 16:48再更以前,資訊無法鎖住,就只能要讀到記憶體前感應

bluemkevin 04/10 16:48

ykjiang 04/10 16:50原來是存在浮閘,類似flash,果然工程師都很會省

ykjiang 04/10 16:51不過浮閘也算記憶元件,原理跟SRAM不同就是

bluemkevin 04/10 16:53其實也不是省的問題,是效果好太多,成本應該比較高

bluemkevin 04/10 16:53,不過我大概知道y大和e大哪裡認知不一樣了。

bluemkevin 04/10 16:57Sorry剛剛去翻一下,Global shutter不是用浮閘鎖資

bluemkevin 04/10 16:57料,更正一下。

ykjiang 04/10 16:59沒差,工程的問題,就效果跟成本的拉鋸

pavaro 04/10 17:30快來看 其他車廠救世神在這

sted0101 04/10 19:07這一串看下來 高下立判了

sted0101 04/10 19:07電動車 apple no.1 tesla no.2

shadowppt 04/11 01:50Lidar也是有難辨識的狀況,就各有有缺

shadowppt 04/11 01:52Global shutter硬傷是速度沒rolling快啊