国产精品免费区二区三区观看_久久99精品久久久久久三级_九九视频在线播放_99精品欧美一区二区三区_亚洲国产成人高清精品_成人三级视频在线观看一区二区_色婷婷av金发美女在线播放

分享
國家互聯(lián)網(wǎng)信息辦公室準許從事互聯(lián)網(wǎng)新聞信息服務業(yè)務的網(wǎng)站
互聯(lián)網(wǎng)新聞信息服務許可證編號:10120220005
中新經(jīng)緯>>財人>>正文

對話周鴻祎、李大海:DeepSeek能否改寫AI戰(zhàn)局?

2025-02-06 10:55:45 澎湃新聞

  對話周鴻祎、李大海:DeepSeek能否改寫AI戰(zhàn)局?

  記者 范佳來 吳遇利

  “DeepSeek在基座大模型上做出的突破,是天才級別的。”

  最近,國產(chǎn)大模型公司深度求索(DeepSeek)引發(fā)的輿論震動,讓今年春節(jié)成為“最有AI味的年”。談到DeepSeek旗下標志性大模型DeepSeek-R1,多位業(yè)內(nèi)人士向澎湃新聞記者表達了高度贊賞。

  1月28日,大洋彼岸的人工智能巨頭Open AI CEO山姆·奧特曼(Sam Altman)發(fā)文回應DeepSeek帶來的挑戰(zhàn):“DeepSeek推出的R1令人影響深刻,我們當然會推出更好的模型,有新的競爭對手也令人振奮。”

  國內(nèi)某Top2 AI初創(chuàng)企業(yè)也對記者坦言,他們感受到了同行帶來的壓力:“后續(xù)我們會加快產(chǎn)品研發(fā)的角度。”

  與之對比的是在產(chǎn)品上的快速迭代:除夕當天,DeepSeek悄無聲息地發(fā)布開源多模態(tài)模型Janus-Pro。此前1月27日早間,DeepSeek應用曾登頂蘋果中國地區(qū)和美國地區(qū)應用商店免費APP下載排行榜,在美區(qū)下載榜上超越ChatGPT。

  “多模態(tài)考驗的是對人類世界和環(huán)境的認知,相信DeepSeek在此刻發(fā)布多模態(tài)大模型,一定有自己的信心和底氣。”1月28日,360創(chuàng)始人周鴻祎告訴澎湃新聞記者,“中國大模型技術(shù)復仇者聯(lián)盟戰(zhàn)隊里一定有DeepSeek的一份,因為這家公司和它的創(chuàng)始人非常低調(diào),他們技術(shù)能力和未來前景被市場嚴重低估了。”

  “現(xiàn)在硅谷都把DeepSeek叫做來自東方的神秘力量,中國AI公司的創(chuàng)造力已經(jīng)剎不住車了。”周鴻祎表示。

  AI軍備競賽已進入深水期,曾有觀點認為,在字節(jié)、阿里、騰訊等大廠包圍下,AI創(chuàng)業(yè)公司將面臨洗牌,難逃被并購的命運,而殺出重圍的卻是似乎“名不見經(jīng)傳”的DeepSeek。DeepSeek走紅的秘密是什么,為國內(nèi)大模型行業(yè)帶來哪些啟示?

  DeepSeek優(yōu)秀在哪?

  “DeepSeek公司高層明確對商業(yè)化不感興趣,只想做技術(shù)研究,這樣的高度一般人達不到。”

  有了解DeepSeek人士向記者透露,自己曾經(jīng)面試過一些AI領(lǐng)域的人才,最后拒絕了自己的公司,去了DeepSeek,理由是他們科研氛圍好,是一個真正做事的團隊。

  “從薪資來看,其實他們只是業(yè)內(nèi)中流水平,高,但并不是最高的。”他向記者坦言,“如果說人才密度,可能還比不上頭部大廠。并不是大廠的人不聰明,而是大廠的聰明人花了太多精力在技術(shù)之外。大廠雖然薪資高,但是內(nèi)部斗爭也多,想要真正專心做事,反而不如這樣的技術(shù)公司純粹。”

  盡管在外界眼中,DeepSeek仿佛是一夜爆紅,但此前早有多項成就引發(fā)行業(yè)關(guān)注。2024年,在大模型行業(yè)率先發(fā)起價格戰(zhàn)的正是DeepSeek,但并未引起外界關(guān)注,此后智譜、字節(jié)跳動等跟進,才引發(fā)整個行業(yè)的降價潮流。

  當時的DeepSeek,還未真正讓他人看到它的實力。2024年,智譜AI COO張帆在接受采訪時曾開玩笑說:“我們是主流廠商中第一個降價的。”當時有人提醒,首個降價的廠商其實是DeepSeek,張帆表示:“我說的是主流廠商”。

  DeepSeek最引人矚目的,是其顯著降低了大模型開發(fā)成本。1月20日,DeepSeek正式發(fā)布推理模型R1,其API(編程接口)服務定價為每百萬輸入tokens(詞元)僅需1元(緩存命中)/4 元(緩存未命中),每百萬輸出tokens為16元。DeepSeek的定價約等于Meta旗下Llama 3-70B的七分之一,GPT-4 Turbo的七十分之一。

  因此,DeepSeek也被戲稱為AI界的“拼多多”,實現(xiàn)高效低價背后的原因是什么?國內(nèi)某知名AI公司董事長向記者解釋稱,這主要得益于DS-V3的多項技術(shù)創(chuàng)新。首先,DeepSeek采用MoE架構(gòu)(Mixture of Experts,混合專家模型),通過將大模型變成多個稀疏的專家小模型,并通過多個模型聚合來達到和傳統(tǒng)大模型相當?shù)哪芰Γ行Ы档土擞嬎愠杀尽?/p>

  其次,DS-V3在訓練方法上進行了重要創(chuàng)新。采用FP8混合精度訓練,效率是常規(guī)BF16精度的約1.6倍;同時優(yōu)化了并行流水線,提升了訓練和推理效率。這些優(yōu)化加上訓練的一次成功,使得V3的訓練成本降至約550萬美元。

  而在最新發(fā)布的DS-R1中,DeepSeek采用了創(chuàng)新性的GRPO(組相關(guān)策略優(yōu)化)強化學習方法,無需龐大的人類標注數(shù)據(jù)庫。通過讓模型自主生成并驗證結(jié)果的方式,R1展現(xiàn)出了強大的推理能力。隨著訓練步數(shù)增加,其思維鏈(Chain-of-Thought,CoT)的長度不斷增長,模型甚至開始在推理過程中進行自我反思。

  “DeepSeek R1的成功意味著,如果基礎(chǔ)模型能力夠強,在強化學習過程中它就能自己學會推理。這也是為什么國外AI圈的人看到DS-R1后驚呼AGI竟然離我們?nèi)绱酥脑颍阂驗镽1證明了能力足夠強的模型是可以不依靠人類自己進化的,盡管現(xiàn)階段的reward還是需要標簽。”上述人士表示。

  《麻省理工科技評論》分析稱,DeepSeek R1 采用類似ChatGPT o1使用的“思維鏈”方法,它可以通過逐步處理查詢來解決問題。這可能是美國對華高端AI芯片出口管制帶來的意外結(jié)果,迫使中國的初創(chuàng)企業(yè)“優(yōu)先考慮效率”。

  有意思的是,如果問DeepSeek自己R1模型相比OpenAI有哪些特點,DeepSeek的回答是,創(chuàng)新點可能在“注意力機制”和“參數(shù)效率”,R1在處理長文本時更聚焦關(guān)鍵部分(比如法律合同中的條款),減少計算量,類似“讀書時用熒光筆劃重點,只反復看關(guān)鍵段落”。在參數(shù)效率方面,用類似MoE(混合專家系統(tǒng))的結(jié)構(gòu),把模型分成多個“子專家”,不同任務激活不同部分,既節(jié)省算力又提升效果(類似“看病時分科室掛號,心臟問題找心內(nèi)科專家,不用讓全科醫(yī)生從頭學到尾”)

  DeepSeek自我評價道,“DeepSeek像一家精品店,在特定領(lǐng)域更專精;OpenAI像大型超市,啥都有但價格高。”

  為什么是DeepSeek?

  談到DeepSeek,離不開創(chuàng)始人梁文鋒。這位在外人眼中樸素、低調(diào)的“85后”企業(yè)家,最近也站在了媒體的聚光燈下。

  根據(jù)公開報道,梁文鋒從小就表露在數(shù)學領(lǐng)域的天賦和興趣,曾是高考狀元,在浙大求學期間就與同學一起積累市場行情數(shù)據(jù)和探索全自動量化交易。

  2008年金融危機期間,他帶領(lǐng)團隊使用機器學習等技術(shù)探索全自動量化交易。2015年創(chuàng)立對沖基金“幻方量化”,2021年資產(chǎn)管理規(guī)模突破千億大關(guān)。2023年創(chuàng)辦深度求索DeepSeek,專注于通用人工智能(AGI)的突破。

  “一件激動人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因為有一群急于在上面彈奏樂曲的人。”在公開采訪中,梁文鋒本人曾經(jīng)如此談論他心中的AGI(通用人工智能)。

  在另一段采訪中,他提到,中國AI不可能永遠處在跟隨的位置,“我們經(jīng)常說中國 AI 和美國有一兩年差距,但真實的Gap(差距)是原創(chuàng)和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。”

  他認為,英偉達的領(lǐng)先,不只是一個公司的努力,而是整個西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果,“中國AI的發(fā)展,同樣需要這樣的生態(tài)。很多國產(chǎn)芯片發(fā)展不起來,也是因為缺乏配套的技術(shù)社區(qū),只有第二手消息,所以中國必然需要有人站到技術(shù)的前沿。”

  梁文鋒不打無準備之仗。幻方量化官網(wǎng)顯示,其在2018年就確立以AI為公司的主要發(fā)展方向。

  2020年開始,幻方累計投資超億元、占地面積相當于一個籃球場的AI超級計算機“螢火一號”正式投入運作,2021年,幻方投入十億建設“螢火二號”,以“任務級分時共享”為核心理念,調(diào)度系統(tǒng)秒級響應,平臺配備強大的軟件層支持:高性能算子庫(hfai.nn)、分布式訓練通訊框架(hfreduce)、專為AI開發(fā)而生的大容量高帶寬文件系統(tǒng)(3FS),讓AI模型能自如拓展到多節(jié)點之上,進行大規(guī)模并行訓練,算力擴容翻倍,集群連續(xù)滿載運行,平均占用率達到96%以上。

  梁文鋒曾在采訪中表示,最早的一張卡到1萬張卡,這個過程是逐步發(fā)生的,而這里面主要是好奇心驅(qū)動,“對AI能力邊界的好奇”。

  “DeepSeek最令美國科技圈震驚的是,在開源大模型上做到了突破性的領(lǐng)先。”昆侖萬維CEO方漢向澎湃新聞記者評論稱,“以往美國在基座大模型上處于絕對優(yōu)勢,例如ChatGPT,后續(xù)的大模型都是基于ChatGPT進行改進和優(yōu)化。此前,在開源大模型領(lǐng)域最領(lǐng)先的是Meta的Llama系列,但如今DeepSeek徹底超越了Llama,這意味著,后續(xù)的行業(yè)大模型可能將基于DeepSeek進行深度開發(fā)。”

  “中國可能取代美國在基座大模型的統(tǒng)治地位,這是美國十分擔憂的。”方漢坦言。

  美國AI初創(chuàng)公司Perplexity首席執(zhí)行官在接受采訪時認為,DeepSeek的模型堪稱“瘋狂”。“這些中國團隊推出了一個瘋狂的模型,API價格比GPT-4便宜10倍,甚至比Claude便宜15倍,速度極快,并且在某些基準測試中與GPT-4相當,甚至更好。他們總共只花了500萬美元的計算機預算,就做出了如此驚人的模型,并且免費公開了技術(shù)論文。”

  據(jù)美國全國廣播公司(NBC)報道,美國總統(tǒng)特朗普當?shù)貢r間1月27日在佛羅里達州邁阿密舉行的共和黨會議上表示,中國人工智能初創(chuàng)公司DeepSeek的AI技術(shù)給美國科技企業(yè)敲響“警鐘”,美國公司“需要專注于競爭以贏得勝利”。

  “DeepSeek效應”如何發(fā)酵

  DeepSeek的成功,暴擊AI硬件龍頭英偉達。

  當?shù)貢r間1月27日,英偉達(Nasdaq:NVDA)股價暴跌16.86%收于每股118.58美元,跌至過去10月以來的最低點;總市值2.90萬億美元,一日蒸發(fā)5900億美元(約合人民幣4.28萬億元),創(chuàng)史上最大單日個股市值蒸發(fā)紀錄。

  英偉達的暴跌也使得創(chuàng)始人黃仁勛的身家大幅縮水210億美元。

  DeepSeek在國際范圍內(nèi)的成功,也為中國AI初創(chuàng)企業(yè)帶來“DeepSeek效應”。

  “我對AGI的判斷,是一場馬拉松。目前技術(shù)仍然還沒有收斂,算力是一個重要的影響因素。”國內(nèi)AI頭部初創(chuàng)企業(yè)、面壁智能CEO李大海告訴記者。

  他介紹,就像DeepSeek一樣,面壁也在旗下開發(fā)的MiniCPM-S系列引入自研稀疏化方案,通過將激活函數(shù)替換為ReLU及通過帶漸進約束的稀疏感知訓練來提升大模型的稀疏性,能將Llama、MiniCPM 稀疏度提升至接近 90%,并且也能夠在保持模型原有水平的基礎(chǔ)上,有效降低模型推理的開銷。

  “DeepSeek的成功,說明中國人工智能企業(yè)已進入世界第一梯隊。盡管我們要承認中美在人工智能上確實有原創(chuàng)性的差距,但是R1的發(fā)布將會很大程度影響這個行業(yè)的發(fā)展,2025年中國在AI領(lǐng)域的創(chuàng)新相當值得期待。”資深AI從業(yè)者、獵豹移動董事長兼CEO傅盛表示。

  而方漢認為,要談中國在AI上的能力完全趕超美國,還為時尚早,但是DeepSeek的表現(xiàn),說明中國AI在發(fā)展空間上確實為人矚目。中國擁有最龐大的AI工程師隊伍和最多的AI論文數(shù)量,“在AI領(lǐng)域,中國和美國的優(yōu)勢相比其他國家是巨大的。”

  “如果要雙方真正平起平坐地競爭,還是需要解決算力卡脖子問題。”方漢坦言,“但是我預計將在2-3年內(nèi)徹底解決這個問題。相信在不久之后,能看到兩個國家真正實現(xiàn)你追我趕、公平競爭。”

中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。
關(guān)注中新經(jīng)緯微信公眾號(微信搜索“中新經(jīng)緯”或“jwview”),看更多精彩財經(jīng)資訊。
關(guān)于我們  |   About us  |   聯(lián)系我們  |   廣告服務  |   法律聲明  |   招聘信息  |   網(wǎng)站地圖

本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點。 刊用本網(wǎng)站稿件,務經(jīng)書面授權(quán)。

未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復制及建立鏡像,違者將依法追究法律責任。

[京B2-20230170]  [京ICP備17012796號-1]

[互聯(lián)網(wǎng)新聞信息服務許可證10120220005]  [互聯(lián)網(wǎng)宗教信息服務許可證:京(2022)0000107]

違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn

Copyright ©2017-2025 jwview.com. All Rights Reserved


北京中新經(jīng)聞信息科技有限公司

国产精品免费区二区三区观看_久久99精品久久久久久三级_九九视频在线播放_99精品欧美一区二区三区_亚洲国产成人高清精品_成人三级视频在线观看一区二区_色婷婷av金发美女在线播放
日本韩国一区二区三区视频| 亚洲女人的天堂| 日韩在线卡一卡二| 久久精品视频在线看| 欧美日韩激情一区二区三区| 丁香亚洲综合激情啪啪综合| 日韩精品一卡二卡三卡四卡无卡| 国产精品嫩草99a| 欧美一区二区精品| 在线看国产日韩| 97精品视频在线观看自产线路二| 国产精品一区二区三区网站| 三级久久三级久久久| 亚洲制服丝袜一区| 一区二区三区日韩欧美| 亚洲精品久久7777| 亚洲蜜桃精久久久久久久| 国产精品久久久久永久免费观看| 精品精品国产高清一毛片一天堂| 日韩你懂的在线播放| 欧美一级久久久| 日韩一级视频免费观看在线| 欧美精品乱人伦久久久久久| 欧美日韩视频在线第一区 | 久久九九久久九九| 精品久久久影院| 日韩一区二区三区精品视频| 欧美日韩一卡二卡三卡| 欧美人与性动xxxx| 欧美日韩一本到| 51精品国自产在线| 日韩视频免费观看高清完整版在线观看 | 成人久久久精品乱码一区二区三区| 国产一区二区导航在线播放| 极品销魂美女一区二区三区| 麻豆精品一二三| 九九九久久久精品| 国产·精品毛片| 色婷婷精品大在线视频| 欧洲亚洲精品在线| 91精品国产综合久久久久久| 日韩一级在线观看| 国产亚洲婷婷免费| 亚洲欧洲日韩在线| 午夜av一区二区三区| 麻豆精品视频在线| 成人高清免费在线播放| 欧美亚洲一区二区三区四区| 欧美久久一二区| 久久婷婷成人综合色| 亚洲特黄一级片| 日韩一区精品视频| 成人午夜电影小说| 欧美日韩亚洲综合在线 | 韩国三级在线一区| voyeur盗摄精品| 欧美日韩免费视频| 2020日本不卡一区二区视频| 成人免费在线视频| 蜜桃久久久久久久| 91浏览器打开| 精品区一区二区| 亚洲人成网站影音先锋播放| 日本美女一区二区| 99久久伊人久久99| 精品少妇一区二区三区日产乱码 | 国产盗摄一区二区| 欧美午夜在线一二页| 日本一区免费视频| 蜜臀久久久久久久| 色噜噜夜夜夜综合网| 久久综合狠狠综合久久综合88| 一区二区三区精品视频在线| 韩国女主播成人在线| 欧美午夜一区二区| 中文字幕一区二区三区蜜月| 免费成人在线影院| 在线观看国产精品网站| 久久免费国产精品| 日韩av电影免费观看高清完整版 | 欧美视频一区二区| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | 日韩中文字幕区一区有砖一区| 99视频国产精品| 精品国精品国产| 日本美女一区二区| 欧美美女一区二区在线观看| 中文字幕中文字幕在线一区 | 欧美日韩国产精品成人| 亚洲欧美日韩国产一区二区三区 | av一区二区三区四区| 久久亚洲综合色一区二区三区| 亚洲一区二区三区四区五区黄| 97精品久久久午夜一区二区三区| 欧美国产精品v| 国产一区三区三区| 日韩午夜av一区| 久久国产综合精品| 日韩欧美精品在线| 蜜臀av一级做a爰片久久| 欧美人牲a欧美精品| 香蕉成人啪国产精品视频综合网 | 青青草伊人久久| 日韩限制级电影在线观看| 日本中文字幕一区二区视频| 欧美精三区欧美精三区| 日本在线不卡视频| 精品少妇一区二区三区免费观看| 免费av网站大全久久| 精品卡一卡二卡三卡四在线| 激情五月婷婷综合| 国产午夜精品美女毛片视频| 国产福利一区二区三区视频 | 午夜亚洲福利老司机| 欧美伦理电影网| 久久不见久久见中文字幕免费| 日韩欧美一二三| 国产在线精品不卡| 中文字幕亚洲区| 欧美日韩精品一区二区天天拍小说| 午夜激情一区二区三区| 欧美一级国产精品| 国产99精品国产| 亚洲欧美另类久久久精品2019| 欧美丝袜自拍制服另类| 老司机精品视频导航| 国产色一区二区| 99re66热这里只有精品3直播| 午夜影院久久久| 久久在线观看免费| 91蜜桃传媒精品久久久一区二区| 夜夜亚洲天天久久| 日韩欧美成人激情| 99久久精品国产网站| 天天综合天天综合色| 国产精品美女久久福利网站| 欧美日韩国产小视频在线观看| 奇米一区二区三区| 国产精品成人免费精品自在线观看| 欧美日韩三级在线| 成人手机电影网| 蜜臀a∨国产成人精品| 国产精品福利电影一区二区三区四区| 91久久精品一区二区三区| 另类人妖一区二区av| 国产精品免费久久久久| 51精品视频一区二区三区| 不卡电影一区二区三区| 视频一区欧美精品| 综合欧美一区二区三区| 日韩一区二区在线观看视频播放| 91免费观看视频在线| 黄网站免费久久| 天天色天天操综合| 自拍偷拍欧美激情| 久久久www成人免费无遮挡大片| 欧美日韩一区二区三区高清| 99久久亚洲一区二区三区青草| 国内精品在线播放| 日日夜夜精品免费视频| 亚洲欧洲99久久| 国产亚洲视频系列| 精品入口麻豆88视频| 日韩一区二区影院| 91精品国产综合久久精品app | 日韩毛片视频在线看| 久久蜜桃香蕉精品一区二区三区| 欧美人动与zoxxxx乱| 91成人网在线| 91免费版在线| a级精品国产片在线观看| 国产一区二区免费在线| 久久狠狠亚洲综合| 久久99精品国产| 久久精品国产澳门| 免费av成人在线| 热久久久久久久| 日韩精彩视频在线观看| 亚洲主播在线播放| 一区二区三区精品视频在线| 亚洲三级久久久| 亚洲精品欧美专区| 亚洲国产毛片aaaaa无费看 | 一本色道a无线码一区v| 99国产欧美久久久精品| 成年人国产精品| 91香蕉视频污| 在线观看成人小视频| 欧美综合亚洲图片综合区| 在线视频你懂得一区| 欧美网站一区二区| 欧美美女直播网站| 日韩欧美中文字幕公布| 日韩色在线观看| 欧美成人a在线| 中文字幕乱码一区二区免费| 国产精品久久久久三级| 亚洲黄网站在线观看| 日日噜噜夜夜狠狠视频欧美人| 麻豆国产一区二区|