騰訊云2月2日宣布,DeepSeek-R1大模型一鍵安排至騰訊云HAI(騰訊云高性能應(yīng)用服務(wù))上,研發(fā)者僅需3分鐘就能接入調(diào)用。
騰訊云叫作,簡單來講,經(jīng)過HAI,研發(fā)者能夠省去買卡、裝驅(qū)動、配網(wǎng)絡(luò)、配存儲、裝環(huán)境、裝框架、下載模型等繁瑣過程,只需兩步就可調(diào)用DeepSeek-R1模型。
此前,據(jù)華為云官方微X公眾號2月1日信息,DeepSeek-R1開源后誘發(fā)全世界用戶和研發(fā)者關(guān)注。經(jīng)過硅基流動和華為云團(tuán)隊(duì)連日攻堅(jiān),此刻,雙方聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。
該服務(wù)具備以下特點(diǎn):
1、得益于自研推理加速引擎加持,硅基流動和華為云昇騰云服務(wù)支持安排的DeepSeek模型可得到持平全世界高端GPU安排模型的效果。
2、供給穩(wěn)定的、生產(chǎn)級服務(wù)能力,讓模型能夠在?規(guī)模生產(chǎn)環(huán)境中穩(wěn)定運(yùn)行,并滿足業(yè)務(wù)商?安排需要。華為云昇騰云服務(wù)能夠供給澎湃、彈性、充足的算力。
據(jù)證券時報,值得關(guān)注的是,近期幾天,DeepSeek的熱度居高不下。日前,英偉達(dá)、微軟、亞馬遜等AI巨頭紛紛宣布,已接入DeepSeek。另外,或許是迫于DeepSeek帶來的壓力,OpenAI緊急上線新一代推理模型o3-mini,并首次向ChatGPT免花費(fèi)戶開放推理模型。
DeepSeek,全叫作杭州深度求索人工智能基本技術(shù)科研有限機(jī)構(gòu),成立于2023年7月17日,是一家創(chuàng)新型科技機(jī)構(gòu),專注于研發(fā)先進(jìn)的大語言模型(LLM)和關(guān)聯(lián)技術(shù)。
DeepSeek在2024年12月26日推出V3(對標(biāo)GPT4o),因其明顯的性能,用戶快速起始增長,同期在1月20日發(fā)布R1(對標(biāo)GPT-o1)后,進(jìn)一步出圈。按照點(diǎn)點(diǎn)數(shù)據(jù),從DeepSeek在美國下載排名從1月22日的201名,快速在1月27日登頂第1名;按照七麥數(shù)據(jù),截至1月30日,DeepSeek在168個國家位居下載榜第1名。
1月24日,著名投資機(jī)構(gòu)A16z的創(chuàng)始人馬克·安德森發(fā)帖叫作,Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一,況且還是開源的,它是給世界的一份禮物。最具煽動性的評估來自ScaleAI創(chuàng)始人亞歷山大·王。他說:過去十年來,美國可能始終在AI競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會“改變一切”。
DeepSeek日前發(fā)布其最新開源模型DeepSeek-R1,用較低的成本達(dá)到了接近于OpenAI研發(fā)的GPT-o1的性能。這一發(fā)展破解了全世界人工智能產(chǎn)業(yè)長時間敗興“堆算力”的路徑依賴,其影響還波及了資本市場。
國際投行摩根士丹利暗示,“更大(的模型)再也不等于更聰明”,DeepSeek經(jīng)過明顯加強(qiáng)數(shù)據(jù)質(zhì)量和改進(jìn)模型架構(gòu),展示了一條與之前大模型區(qū)別的有效訓(xùn)練途徑。摩根士丹利說,DeepSeek的模型此刻低成本優(yōu)良明顯,與國際知名大模型相比,其成本大約低了一個數(shù)量級。
國泰君安指出,DeepSeek-R1以MIT License完全開源模型權(quán)重,并準(zhǔn)許商用模型蒸餾,為研發(fā)者供給了二次創(chuàng)新的自由空間。這一策略推動中國首次在通用大模型開源行業(yè)占據(jù)技術(shù)制高點(diǎn),加強(qiáng)全世界AI話語權(quán)。同期,開源生態(tài)可能加速行業(yè)技術(shù)路線趨同,通用大模型因同質(zhì)化加劇競爭,僅有持有真正領(lǐng)先技術(shù)的企業(yè)才可在這種趨勢中留存。因此呢,此次國產(chǎn)開源模型的突破有望重塑全世界AIGC技術(shù)路線及產(chǎn)業(yè)格局。
國泰君安還指出,DeepSeek-R1以開源、高性能及低成本API對標(biāo)OpenAI o1。其蒸餾模型的優(yōu)異表現(xiàn)將支持消費(fèi)電子、智能駕駛等終端AI的安排,開源策略將重整通用模型競爭格局,大模型的商場化落地將在DeepSeek的低價API支持下加速,將來垂類應(yīng)用亦有望加速創(chuàng)新迭代。該券商暗示,R1在后訓(xùn)練周期經(jīng)過大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù),在極少標(biāo)注數(shù)據(jù)下提高推理能力,驗(yàn)證了算法優(yōu)化的有效性。這一技術(shù)突破打破了海外企業(yè)在繁雜任務(wù)上的技術(shù)壟斷,為中國大模型技術(shù)參與全世界競爭供給了實(shí)證支撐。返回外鏈論壇: http://www.fok120.com,查看更加多