突然火爆全網(wǎng)!Deepseek被“擠”到宕機!創(chuàng )始人17歲考入浙大,36歲管理千億私募!
原標題:突然火爆全網(wǎng)!Deepseek被“擠”到宕機!創(chuàng )始人17歲考入浙大,36歲管理千億私募!公司多崗位招新,實(shí)習生日薪最高上千元
幾乎是一夜之間,“來(lái)自東方的神秘力量”又一次震撼海外人士心臟。
1月27日,由國產(chǎn)大模型公司杭州深度求索開(kāi)發(fā)的Deepseek應用登頂蘋(píng)果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。
蘋(píng)果美國區應用商店
蘋(píng)果APP Store中國區免費榜
據界面新聞,1月27日,DeepSeek官網(wǎng)顯示,DeepSeek網(wǎng)頁(yè)/API不可用。昨日(26日),DeepSeek曾出現短時(shí)閃崩現象。對此,DeepSeek回應稱(chēng),當天下午確實(shí)出現了局部服務(wù)波動(dòng),但問(wèn)題在數分鐘內就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶(hù)訪(fǎng)問(wèn)量激增,服務(wù)器一時(shí)無(wú)法滿(mǎn)足大量用戶(hù)的并發(fā)需求。
Deepseek來(lái)自國產(chǎn)大模型公司深度求索,系量化巨頭幻方量化旗下大模型公司。1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。一經(jīng)推出,DeepSeek-R1便憑借其“物美價(jià)廉”的特性在海外開(kāi)發(fā)者社區中引發(fā)了轟動(dòng)。
今年1月20日,據新聞聯(lián)播,國務(wù)院總理李強主持召開(kāi)專(zhuān)家、企業(yè)家和教科文衛體等領(lǐng)域代表座談會(huì ),聽(tīng)取對《政府工作報告(征求意見(jiàn)稿)》的意見(jiàn)建議。
DeepSeek創(chuàng )始人梁文鋒參加此次座談會(huì ),梁文鋒既是深度求索(DeepSeek)創(chuàng )始人,也是頭部量化私募幻方的創(chuàng )始人,創(chuàng )業(yè)范疇橫跨金融和人工智能領(lǐng)域。
?。ㄑ胍曅侣劷貓D,左一梁文鋒)
據潮新聞客戶(hù)端,梁文鋒,1985年出生于廣東省湛江市。2002年,這位對數學(xué)建模充滿(mǎn)熱情的年輕人考入浙江大學(xué)電子信息工程專(zhuān)業(yè),并在隨后的幾年里繼續深造,最終于2010年獲得信息與通信工程碩士學(xué)位。
在校期間,他對金融市場(chǎng)產(chǎn)生了濃厚的興趣。特別在2008年全球金融危機之際,他帶領(lǐng)團隊探索了機器學(xué)習技術(shù)在全自動(dòng)量化交易中的應用潛力,這一經(jīng)歷為他日后的職業(yè)生涯奠定了堅實(shí)的基礎。
畢業(yè)后,梁文鋒將目光轉向更廣闊的金融市場(chǎng)。
2013年,他與浙大同學(xué)徐進(jìn)共同創(chuàng )立了杭州雅克比投資管理有限公司,兩年后又成立了杭州幻方科技有限公司,致力于通過(guò)數學(xué)和人工智能進(jìn)行量化投資。2015年的市場(chǎng)波動(dòng)中,幻方依靠先進(jìn)的高頻量化策略取得了令人矚目的成績(jì)。
2016年是幻方的重要轉折點(diǎn)。這一年,公司推出了首個(gè)基于深度學(xué)習的交易模型,并實(shí)現了所有量化策略的AI化轉型。2018年,幻方正式確立了以AI為核心的發(fā)展戰略。然而,隨著(zhù)業(yè)務(wù)的快速擴展,算力瓶頸逐漸顯現。
為解決計算資源不足的問(wèn)題,2019年,梁文鋒帶領(lǐng)團隊自主研發(fā)了“螢火一號”訓練平臺,總投資近2億元,搭載了1100塊GPU。兩年后,“螢火二號”的投入增加到10億元,搭載了約1萬(wàn)張英偉達A100顯卡。
2021年,幻方的資產(chǎn)管理規模突破千億大關(guān),躋身國內量化私募領(lǐng)域的“四大天王”之列。2023年,他宣布將正式進(jìn)軍通用人工智能領(lǐng)域,并創(chuàng )辦了深度求索DeepSeek,專(zhuān)注于做真正人類(lèi)級別的人工智能。
2024年5月,DeepSeek發(fā)布混合專(zhuān)家語(yǔ)言模型DeepSeek-V2。同年12月,DeepSeek-V3問(wèn)世,這款性能優(yōu)越且性?xún)r(jià)比極高的大語(yǔ)言模型,被硅谷同行譽(yù)為“來(lái)自東方的神秘力量”。
DeepSeek之所以被科技圈關(guān)注,在于DeepSeek-V3的出現極大地降低了大模型訓練和應用的成本,DeepSeek-V3訓練成本僅557.6萬(wàn)美元,而OpenAI訓練ChatGPT-4o所花費的成本高達7800萬(wàn)美元甚至是1億美元,雙方的成本至少是10倍的差距。
在性能上,DeepSeek-V3在數學(xué)、代碼能力和中文知識問(wèn)答方面還超過(guò)了ChatGPT-4o,行業(yè)震驚于這一性?xún)r(jià)比,DeepSeek-V3開(kāi)源給全世界的技術(shù)開(kāi)發(fā)團隊。
在團隊配置上,DeepSeek團隊只有139名研發(fā)人員,對比ChatGPT的OpenAI團隊則有1200名研究人員,團隊規模是DeepSeek的近乎9倍之多。近期熱門(mén)話(huà)題“雷軍千萬(wàn)年薪挖95后天才AI少女”,這位AI少女就是DeepSeek團隊的研發(fā)人員,但小米和當事人并未就此回應。
通過(guò)招聘網(wǎng)站注意到,深度求索公司的北京子公司正在招人,現共放出了52個(gè)崗位,包括深度學(xué)習研究員、核心系統研發(fā)工程師以及資深ui設計師等,均為14薪。
其中,薪資最高的為核心系統研發(fā)工程師(校招),薪資范圍為6萬(wàn)元-9萬(wàn)元;除此之外,大部分崗位的起薪在2萬(wàn)元及以上。
值得一提的是,該公司正在招聘實(shí)習生,AGI大模型實(shí)習生的工資為500元/天-1000元/天,數據百曉生實(shí)習生為500元/天-510元/天。
1月27日,DeepSeek概念股表現強勢,截至發(fā)稿,每日互動(dòng)、華金資本、浙江東方漲停,并行科技、卓創(chuàng )資訊、拓爾思等漲幅居前。
消息面上,此前AMD宣布,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型旨在與SGLang一起實(shí)現最佳性能。
華經(jīng)產(chǎn)業(yè)研究院報告顯示,2023年國內智能體市場(chǎng)規模達59.81億元,預計2024年突破百億元。中國工程院院士鄔賀銓在2025年ICT行業(yè)趨勢年會(huì )上表示,2025年不僅是智能體的元年,也將是AI終端的元年。
聲明:文章內容和數據僅供參考,不構成投資建議。投資者據此操作,風(fēng)險自擔。
編輯|孫志成 蓋源源
校對|何小桃
轉載原創(chuàng )文章請注明,轉載自東莞厚街佰勝機械設備廠(chǎng),原文地址:http://www.fauchierpartners.com/post/36523.html