Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不

AmosYang 發表於 2024/11/2 上午10:14:10

看板Soft_Job標題Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不作者

AmosYang

(twy30)時間Nov 2 10:14:10 2024推噓 6 推:6 噓:0 →:12

PTT推薦

※ 引述《angus850503 (安格斯)》之銘言：
: 不過之前就一直對生成式 AI 有個疑問
: 就是"幻覺"到底有沒有根本上的解決方法?

目前還沒人能證明「有」，也還沒人能證明「沒有」。

有興趣的話可以追蹤這個「 LLM 幻覺排行榜」：

* https://github.com/vectara/hallucination-leaderboard/
* HN 相關討論： https://news.ycombinator.com/item?id=38286761

有興趣可以翻翻這排行榜的 Git 歷史，看看各 LLM 的進化歷程。然而，這排行
榜的評鑑方式也是公開的，各 LLM 也有可能 (不自覺地) 針對這類評鑑方式去優
化，所以這些資料只能做為參考。

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 136.61.16.51 (美國)

※ PTT 網址

→

angus85050311/02 10:23Cool 感謝提供網站

推

shortoneal11/02 19:21竟然還有這種榜

推

abc2108699911/03 01:42我記得昨天才在Reddit上面的OpenAI AMA串看到誰回覆

→

abc2108699911/03 01:42說幻覺很難解決，因為人類也是有同樣的狀況

推

gino071711/03 01:46雲觀眾也是一種幻覺

→

abc2108699911/03 01:49https://i.imgur.com/772P8fS.png

*感覺上* pattern recognition/matching 的低垂水果已經摘得差不多了；就看資本/信仰能不能撐到下一個突破口，例如： Detecting hallucinations in large language models using semantic entropy

https://news.ycombinator.com/item?id=40769496

※ 編輯: AmosYang (136.61.16.51 美國), 11/03/2024 04:44:24

推

angus85050311/03 13:30這就是我想詢問的幻覺沒解決 AI的下一步到底在哪

→

DrTech11/03 15:41幻覺為什麼一定要解決才能做AI產生生產力？不用解決也可以

→

DrTech11/03 15:41啊。不是所有任務都要靠LLM生成不可靠的資訊。例如很多人

→

DrTech11/03 15:41做RAG+QA問答，都無腦用搜候選結果，然後用LLM生成最後答

→

DrTech11/03 15:41案，當然一堆幻覺。架構上改成拿LLM當選擇器，或限定next

→

DrTech11/03 15:41tokens，只能輸出選擇1.2.3.4。在多個答案裡面挑一個，最

→

DrTech11/03 15:41後靠程式輸出完全沒關鍵的答案。立刻解決幻覺問題。

→

DrTech11/03 15:44LLM當特定task模組(不要拿來當最後輸出結果),結合傳統NLP

→

DrTech11/03 15:44各種解決方案，任何一個功能任務，都可以"完全沒幻覺"，能

→

DrTech11/03 15:44力又比傳統NLP強很多。

推

neo527711/03 16:33樓上這個有專有名詞叫做rerank 我開發系統時有設計

推

Chinwei856211/04 14:22酷

同系列文章

[討論] 大家會擔心 ai 寫 code 讓工程師飯碗不

其他人也閱讀了

PTT 熱門相關