作者:李煥更新時間:2025-02-18 09:12:32點擊:
由於(yu) 同時具備強大的推理能力及開源模型兩(liang) 個(ge) 特質,導致幾乎所有科技公司都在研究怎樣和 DeepSeek「深度融合」一下。
華為(wei) 、騰訊、百度、字節等互聯網巨頭,盡管都有各自自研的模型,但不妨礙紛紛第一時間在自己的雲(yun) 服務器裏接入 DeepSeek,一群因為(wei) 「服務器繁忙,請稍後再試」的用戶得以曲線救國,雲(yun) 服務商得以也接住了潑天流量。
芯片、金融、電信等行業(ye) 的頭部玩家也因為(wei) 相似的邏輯接入了模型。畢竟大家都希望體(ti) 驗一下 R1 模型的最強大腦。
不管在業(ye) 務層麵起到了多大的幫助,大部分公司的股價(jia) 至少都漲了。不過有一個(ge) 行業(ye) 稍顯例外,那就是汽車行業(ye) 的主機廠們(men) 。
截止 2 月 13 日,已經有包括比亞(ya) 迪、吉利、東(dong) 風、長城、極氪、智己等超過 20 家車企宣布完成和 DeepSeek 的深度融合。
不過,新勢力裏的蔚小理華米,以及特斯拉均沒有宣布和 DeepSeek 的相關(guan) 融合信息。
大模型上車,現階段最大的問題,是還沒有展示出足夠好的場景。相反,在一些主機廠的微博評論區裏,車主更在意一些已有的功能能否及時通過 OTA 得到優(you) 化。
可以看出,技術並不是用戶最在意的點,用戶真正在意的是產(chan) 品體(ti) 驗。
如何用更好的模型獲得更智能化的體(ti) 驗,才是用戶真正在意的。相反,如果現階段不能達到更智能的體(ti) 驗,那麽(me) 用戶更在意的是這車好不好開,內(nei) 飾舒不舒服,還有便宜不便宜。
用戶想得到的是一輛「更智能的車」,但並不代表他們(men) 要在車上用車機寫(xie) 出一篇高考滿分作文。
01車企排隊接入 DeepSeek?「如來」
在目前各主機廠釋出的有限信息裏,DeepSeek 上車後,智能座艙中的人機交互,有望成為(wei) 第一個(ge) 深度融合的典型場景。
智己、吉利發布的兩(liang) 條視頻裏,展示了 3 個(ge) 和智能座艙有關(guan) 的使用場景,分別是:
場景 1:激活座艙模型,調用 DeepSeek 進行文本生成,如案例演示中「生成一篇文章慶祝亞(ya) 冬會(hui) 金牌誕生」。
智能座艙通過 DeepSeek 進行文本生成 | 圖片來源:視頻截圖
在這個(ge) 場景中,座艙通過接入 DeepSeek 的 API,把 DeepSeek「好文筆」搬上了車。和絕大多數人習(xi) 慣在手機、電腦端操作略有不同的點在於(yu) 添加了語音作為(wei) 新的交互方式。
場景 2:提問在某段裏程中遇到的一個(ge) 湖叫什麽(me) 名字。
DeepSeek 通過調用車輛行程記錄、地圖等信息,推理給出了相應答案。
通過 DeepSeek 推理回答車主問題 | 圖片來源:視頻截圖
在這個(ge) 場景中,通過接入 DeepSeek,把車機內(nei) 儲(chu) 存的端側(ce) 信息(行程記錄、地圖)作為(wei) 推理語料提供給了模型,由此可以得到更個(ge) 人向的推理問答。
場景 3:直接對車機表達「我累了,一會(hui) 叫我」的模糊指令,車機識別後分別調整了車窗、座椅、空調、氛圍燈、鬧鍾的硬件或功能,生成了一個(ge) 休閑場景。
通過 DeepSeek 實現模糊語義(yi) 識別及相關(guan) 車控操作 | 圖片來源:視頻截圖
和手機裏的 DeepSeek 應用不同,接入車機後,最顯著的不同在於(yu) 模型可以調用車端信息作為(wei) 推理語料,為(wei) 車主提供更個(ge) 性化的服務。
不過,這些推理要消耗多少運算資源、需要怎樣的硬件支撐、以及是否需要聯網服務,目前主機廠還沒有釋出太明確的信息。
02更聰明的智能語音,未必是真 PMF
DeepSeek 有希望讓車內(nei) 的智能語音變得更聰明,更能理解用戶的各種模糊指令。不過,這真的此刻主機廠和用戶最緊迫的真實需求嗎?
從(cong) 企業(ye) 端來說,目前積極接入 DeepSeek 主要分為(wei) 三類,分別是:芯片、雲(yun) 服務和終端硬件廠商(手機+智能汽車)。
對於(yu) 芯片廠商而言,由於(yu) DeepSeek 是基於(yu) 英偉(wei) 達芯片進行推理的,而不同芯片間架構不同,所以其他廠商必須進行軟件和算法層麵的適配,才能兼容 DeepSeek 的模型訓練和推理。
換句話說,芯片商參與(yu) 到這輪 DeepSeek 熱裏,是出於(yu) 用戶最真實且緊迫的需求,這是保住和擴大市場必須要做的一個(ge) 關(guan) 鍵動作。
雲(yun) 服務商的積極接入,也有類似的邏輯。對於(yu) C 端用戶而言,在頻繁遭遇「服務器繁忙,請稍後再試」的提示時,雲(yun) 服務商的出現提供了新的入口,接住了這次潑天的流量,讓人多普通消費者認識了自己;
對於(yu) B 端用戶如開發者和企業(ye) 用戶而言,在雲(yun) 上部署 DeepSeek,可以降低企業(ye) 使用模型的門檻,提供更好的開發體(ti) 驗。
因此,在這輪 DeepSeek 熱潮裏,包括華為(wei) 雲(yun) 、騰訊雲(yun) 、阿裏雲(yun) 、百度雲(yun) 、火山引擎等主力玩家,都先後對 DeepSeek 進行了雲(yun) 端部署——哪怕這些雲(yun) 廠商背後的科技公司都有自己獨立研發的模型,但用戶要用 DeepSeek,他們(men) 就要接入這個(ge) 開源模型。
「不堪重負」的 DeepSeek 服務器 | 來源:網絡截圖
但到了硬件領域,對終端廠商和用戶來說,此刻在產(chan) 品完成對端側(ce) DeepSeek 的部署,既有難度,也不是優(you) 先級最高的需求。
首先,目前的端側(ce) 計算資源並不支持「滿血版」DeepSeek 的本地化部署。
不同於(yu) 雲(yun) 端服務器,如果要在個(ge) 人設備上部署 671B 參數模型的 R1 模型,需要將近 1300G 的顯存,遠超 PC、手機、汽車的端側(ce) 計算資源。
如果退而求其次,用 7B 或 10B 的蒸餾模型,其推理能力又和滿血版有顯著差別。
所以,如果把 DeepSeek 模型接入車機,但實質隻是多了一個(ge) 語音入口,對用戶來說,為(wei) 什麽(me) 非要在車上使用 DeepSeek 而不是打開手機或電腦上的應用呢?
對於(yu) 智能汽車用戶而言,相比車機是否可以解答一道數學題或者寫(xie) 出一篇好作文,顯然更在意它是否能發揮好「助理」的角色。這才是真正的需求。
例如,手機微信裏接收到的地圖甚至大眾(zhong) 點評的餐廳位置信息,是否可以一鍵流轉到車機導航,並顯示在 HUD 導航裏。這是減少車機端操作,提升體(ti) 驗的一個(ge) 具體(ti) 場景。
而要執行這類任務,需要的核心能力並不在於(yu) DeepSeek 所擅長的「推理」,而是打通不同設備間接口的工程能力。
目前,包括鴻蒙智行、小米、蔚來等擁有多端設備的企業(ye) 實際已經具備了類似功能。
這大概也是為(wei) 什麽(me) 華為(wei) 雲(yun) 宣布和 DeepSeek 融合,但鴻蒙智行旗下車企卻暫時沒有相關(guan) 發聲的原因。
其實,無論是手機還是汽車用戶,大家真正期待的是將 AI 的「大腦」和硬件的「身體(ti) 」結合起來後的智能化體(ti) 驗,也就是 OpenAI 定義(yi) 的人工智能階段裏,從(cong) L2(推理者)到 L3(Agent)的提升。
但在產(chan) 品層麵,這並不單單取決(jue) 於(yu) 某個(ge) 模型的能力,還和硬件層麵的產(chan) 品定義(yi) 、接口、功能開發都息息相關(guan) 。
03除了座艙,DeepSeek 還能為(wei) 車企做點啥?
在產(chan) 品層麵之外,在近年角逐越來越激烈的智能駕駛層麵,DeepSeek 能為(wei) 車圈提供什麽(me) 幫助嗎?
要回答這個(ge) 問題,首先我們(men) 得知道目前智能駕駛開發層麵最大的問題是什麽(me) ?
一句話概括,就是:目前智駕係統還搞不定複雜的城區路況,接管次數頻繁,使用體(ti) 驗不佳。
接管次數多的原因除了一些難以預測的安全情況,如行人橫穿、車輛加塞、電瓶車逆行等,還包括係統對一些特殊交通規則的識別和判斷,
比較典型的場景包括:一線城市的潮汐車道、公交車道;不同城市左轉、掉頭車道設計思路不同(有些在最左側(ce) ,有些在最右側(ce) );以及臨(lin) 時施工或管製時的各種電子屏幕信息。
這些燒腦的交通變化,別說是智駕係統了,就算是人類司機,當第一次遇上這些情況,也得打起 100% 的專(zhuan) 注度才不會(hui) 走錯道。
理想汽車的 CEO 李想去年年中有個(ge) 著名的演講,把人類駕駛者的大腦分為(wei) 係統 1 和係統 2,係統 1 負責以低能耗的方式處理直覺類工作,而係統 2 則負責在複雜情況中進行推理,處理各種 Corner Case。
而以推理見長的語言模型 DeepSeek-R1,從(cong) 原理來說是有望提升「係統 2」的能力的。
例如,更精準識別和理解不同交通標識(公交車道、潮汐車道),從(cong) 而做出更好的駕駛判斷。
並且,DeepSeek-R1 提高了模型的訓練效率和推理能力,也有望優(you) 化車端的推理速度,在算力有限的端側(ce) 也達到更好的智駕能力。
智駕開發的另一個(ge) 難度,體(ti) 現在數據采集側(ce) 。
不同於(yu) 語言大模型可以直接利用海量的數字文本資源進行訓練,智駕往往需要先在真實物理世界中采集數據,才能進行訓練。
由於(yu) 引入了 MoE(混合專(zhuan) 家架構)、MLA(多頭潛在注意力機製)等技術,DeepSeek 本身降低了對數據標注的需求,因此可以幫助智駕企業(ye) 進行數據挖掘和生成,降低數采和標注的成本。
而在另一個(ge) 層麵,DeepSeek 的多模態模型(非 R1)可以模擬生成一些難以采集的場景數據,如極端路線、罕見交通標識等。
而通過仿真數據進行智能駕駛的訓練或驗證,也是包括華為(wei) 、蔚來等多家車企進行智駕模型訓練的重要工作之一。
以上這些工作,雖然不像雲(yun) 服務商接入 DeepSeek,可以直接解決(jue) 用戶訪問主站時轉圈圈的燃眉之急,但對車企而言同樣重要。
畢竟比亞(ya) 迪已經喊出了「全民智駕」的口號,智駕毫無疑問將成為(wei) 2025 年競爭(zheng) 的重點。
在同價(jia) 位段車型裏提供更好的智能化功能,將成為(wei) 消費者選擇決(jue) 策中新的重要考量因素。
當然,正如前文所言,一輛智能汽車各項功能的發揮,不僅(jin) 隻仰仗於(yu) 某些單一技術的突破,車端其他硬件層麵的優(you) 化(如更大算力的智駕芯片)以及模型側(ce) 其他能力的優(you) 化,將共同決(jue) 定我們(men) 何時達到 L3 級別的智駕智艙能力。
DeepSeek 在智能化浪潮裏,給了所有創新者一個(ge) 小成本高性能的樣本,但不是一套可以照抄的答案,未來的汽車產(chan) 品應該走向何方,還需要真正懂產(chan) 品懂 AI 的人來「深度求索」。
責任編輯:落木