Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析
總覺得這個橫空出世的deepseek有點貓膩
像LDPC大所說 感覺好像真的用了openai 的ChatGpt的數據來創造訓練資料 但openAI很難證明自己的東西被偷了
我去看了一下deepseek的python api怎麼用
很有趣 結果deepseek用的是 openai的library https://api-docs.deepseek.com/
```
# Please install OpenAI SDK first: `pip3 install openai`
from openai import OpenAI
client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "You are a helpful assistant"},
{"role": "user", "content": "Hello"},
],
stream=False
)
print(response.choices[0].message.content)
```
難道OpenAI裡面出了個中國間諜?
※ 引述《LDPC (Channel Coding)》之銘言:
: 目前就在旁邊吃瓜觀望@@ 成本這種本就是用開源後的可以拿已有的模型去當輔助下降成?
: 最常見作法就是拿gpt-4o當judge或者當數據產生器 去精煉數據集 如果再沒有gpt-4o: 情況下 很多高質量資料去產生就花很錢 最經點例子就是LLaVa 一個博士班學生 用gpt-4
: 去產生高質量多模態數158k 極小量數據集 用8xA100 1天時間 就幹爆之前所有
: 多模態大模型 能打贏saleforce的一間大公司堆出來的多模態BLIP-2模型
: 這傢伙精髓站就是在gpt-4模型巨人的肩膀上
: 資料的quality會影響大模型 而資料可以透過開源高質量模型去萃取
: 如果再套用COT 這些都可以繼續進化 paper有些細節像是數據集這類如何精煉
: 反而可能會是一個重要一環 但大家都會藏這類細節 @@/
: 2025現在大家都殺到LLM Agent去了 LLM刷模型任務分數熱潮有點下降
: 大部分都跑去搞LLM決策部分 和COT (思考鏈) 多步驟分析任務
: 像是waymo自駕端對端的決策都搞了一個EMMA 用Gemini 去往上蓋
: (這時候自駕公司有自己的很強的LLM就很有用了 隨手不負責預測亞麻zoox會拿自家
: LLM或anthropic來搞end-2-end多模態)
: 然後LLM Agent如果要放在機器人和自駕
: 一定得on-device 因為雲端延遲太慢 風險高 所以1B~4B這陣子的on-device模型
: 能力也在不斷突破 所以on-device LLM不太會在是AI-PC 除非是屬於私密資料等應用場景
: 而edge/on-devcie AI 可能突破點會在機器人
: 自駕的趨勢之後會跟LLM走上同陣線 在某個時間點 等閉源LLM開始時 就是差不多AI模型
: 的盡頭開始產業化 也許端對端LLM決策 可以強化視覺上標籤數據不足 (不確定這點
: 但直覺上認為 思考練LLM Agent可以降低場景車用數據量..QQ 基於模型泛化能力)
: 這會給其他車廠追上特斯拉的機會 特斯拉自身的LLM可來自grok 而3D基礎模型
: foundation model 像是李飛飛的空間模型 有一定機會能幫助自駕 可以直接融合LLM
: 產生端對端多模態 而李飛飛又跟狗家走很近 所以想單賭個股 可以賭賭看狗家
--
=_= https://reurl.cc/vp2dgj 請大大刪上推文
你才是大大 改好了 :)
wow
哪裡來的菜雞 OpenAI的lib已經是standard protocol
開源還想賺錢 哪個開源軟件有賺錢
你這個AI圈的人應該都知道了,以為只有你知道?
開源的也沒啥阿
相信股板AI大師 一定是抄的偷的 我們知道天安門
是不是菜雞啊 到底知不知道自己在打啥文章
我的確是菜啊 m大分享知識 感恩
不懂沒關係,不要亂講吧
不是啦 是DeepSeek裡面有大巨人在運作啦
著眼點不同,大神研究模型算法跟效能,有些人只關注
訓練過程有沒有記得輸入天安門….
這樣也被你發現
說不定華西街不知道 求記者報導
我問 “可以談談為什麼毛澤東要發動文化大革命嗎”
他叫我別聊這個 聊別的 太有趣XD
笑死這篇超菜 那已經是通用的接口格式了
美國大廠肯定沒請到原po這種人才XD
==只是一個名稱而已
笑死
笑死,六四天安門不能問
菜爆www
北七,就Restful接口標準化,根boto3去兼容aws一樣
連openstack最後都要把api接口做的跟aws兼容
你不懂還要硬說人抄襲?
當你發現的時候 是不是覺得贏過世界上頂尖工程師了
你都發現了,怎麼不做一個台灣人版的deepseek呢?
你是電你是光,你是唯一的神話
算到8964就自動當機 這種AI誰敢用?? 笑死 XDDDDD
你是反串還是菜啊
29
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預會恐慌是美國那些公司的心態有問題,他 們幻想的是自己能獨佔AI領域,幻想他們 燒大錢最後生出來的大模型可以抬價收費 meta的模型號稱開源講白了就只是因為差 openai太遠所以把資源丟出來靠龐大共享17
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高不用恐慌,Meta繼Stargate之後,也宣稱要投65B計畫搞大基建。 現在是有AGI了嗎?最快也要看今年底 假設Deepseek R1相當於OpenAI O1好了 成本只有1/20 那為何不出一個成本1/210
[問卦] deepseek會刺破ai泡沫嗎?原來訓練ai並沒有那麼昂貴, 中國Deepseek 公司用低成本就能訓練媲美OpenAI的gpt 中國低價策略根本讓高成本美國巨頭無法招架 Deepseek 會刺破ai泡沫嗎?有台積股票的會顫抖嗎? 有卦?9
Re: [請益] Deepseek v3 對台積電有影響嗎沒想到吹沒多久 當問DeepSeek-V3:"你是什麼模型" DeepSeek-V3竟然回答:"我是chatgpt"9
[問卦] 要收費的OpenAI是不是完蛋了感覺美國的這些AI公司都講好了 開源的模型不能超越閉源的 很明顯這些開源的大公司有在禮讓 不能把別人的飯碗全部端走 讓OpenAI這個閉源的可以繼續撈6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI8
[心得] 用 ChatGPT 幫忙整理 Code Changes部落格: GitHub: 相信大家對 ChatGPT 不會很陌生,這是目前在生成式人工智慧 (AIGC: AI Generated Content) 內的當紅炸子雞,然而 ChatGPT 對於軟體工程師有什麼影響呢?能否透過 ChatGPT 改善團隊流程或協助開發?而我現在想到最直接的就是用 ChatGTP 幫忙寫 Git3
Re: [情報] Live 蘋果發布會 WWDC 2024看到推文很多人跟網紅說蘋果要當個平台商, 但是就我的理解, 蘋果這個操作是完全放棄當平台商, 蘋果無法當個AI平台商抽取蘋果稅, 因為蘋果直接使用OpenAI API,2
[問卦] 有沒有DeepSeek的八卦?中國製的AI,左踢Meta右踹OpenAI 不到1/15的經費卻遙遙領先並遙遙領先 這麼牛B的軟體,有沒有DeepSeek的八卦啊? 輝達要一根了嗎? --- 小弟最近寫了一個python要呼叫openAI 的api翻譯pdf 剛才買了chatGPT的會員發現沒辦法呼叫openAI 的api 花錢買api服務值得嗎 有無八卦 --
18
Re: [新聞] 去年12月總薪資平均近6.5萬刷新高 金飯15
[情報] 114年02月17日信用交易統計7
[心得] DeepReserch: 市值型 > 高股息10
Re: [請益] 台灣貿易順差超大 但為何台幣貶成這樣?7
[情報] 2032 新鋼 達注意標準 1月自結 0.0012
[情報] 00946 114/03/06 預估除息0.025元26
[情報] 3189景碩 113EPS 0.11(Q4 -0.55) 股利14
Re: [新聞] 首檔 ETF 分割來了!0050將重返發行價 49
[心得] 券商app年度回顧25
[情報] 2942京站 獨董彭振聲 因個人生涯規劃辭任11
[情報] 5864 致和證 113年EPS 1.98 股利 0.4+0.87
[情報] 8028 昇陽半導體1月自結0.431
[情報] 114/02/17 八大公股銀行買賣超排行1
[情報] 0217 上市櫃股票週轉率排行3
Re: [新聞] 川普「對等關稅」預計4月2日上路衝擊歐日1
[情報] 0217 上市櫃外資投信買超金額排行