機(jī)器之心報(bào)道
機(jī)器之心編輯部
在 AI 領(lǐng)域,亞馬遜云科技有著自己的打法,模型選擇權(quán)交給用戶。
「云計(jì)算一哥」亞馬遜云科技又「收」新模型了。
就在剛剛過去的 8 月,亞馬遜云科技宣布,其 Amazon Bedrock 和 Amazon SageMaker 兩大 AI 平臺(tái)開始支持 OpenAI 新開源模型。
緊接著今天又傳出新消息,兩大重量級(jí)國產(chǎn)大模型Qwen3 和 DeepSeek-V3.1也被亞馬遜云科技收入 Amazon Bedrock。
目前這兩款模型均已在 Amazon Bedrock 全球上線,可用區(qū)域包括美國西部(俄勒岡)、亞太地區(qū)(孟買、東京)、歐洲(倫敦、斯德哥爾摩)等。
這一連串快速上新的動(dòng)作,展現(xiàn)了亞馬遜云科技在全球 AI 競(jìng)賽中的敏銳嗅覺和執(zhí)行力。無論是來自 Meta、Mistral AI 和 OpenAI 等國際頂尖的開放模型,還是國產(chǎn)開源模型,亞馬遜云科技都在第一時(shí)間將其納入生態(tài)版圖,為開發(fā)者與企業(yè)用戶提供了前所未有的多樣化選擇。
這也恰恰是亞馬遜云科技長期堅(jiān)持的 「Choice Matters(選擇大于一切)」戰(zhàn)略的最佳注解:沒有一個(gè)大模型可以解決所有問題,唯有通過多模型的互補(bǔ)與協(xié)同,才能讓 AI 真正匹配現(xiàn)實(shí)世界的復(fù)雜需求。
此外,大家關(guān)心的模型安全問題,在亞馬遜云科技這里也得到了保障:客戶對(duì)他們自己的數(shù)據(jù)擁有完全的控制權(quán),亞馬遜云科技不會(huì)將模型的輸入和輸出數(shù)據(jù)與模型提供商共享,也不會(huì)用于改進(jìn)基礎(chǔ)模型。
兩大頂尖國產(chǎn)模型登陸 Amazon Bedrock
隨著 Qwen3 和 DeepSeek-V3.1 兩大國產(chǎn) AI 模型的正式發(fā)布,Amazon Bedrock 進(jìn)一步擴(kuò)展了其平臺(tái)上管理完善、行業(yè)領(lǐng)先的模型陣容。
這兩款模型的加入,不僅豐富了現(xiàn)有的開放權(quán)重模型選擇,為全球客戶提供更多創(chuàng)新的可能和靈活的應(yīng)用場(chǎng)景,也進(jìn)一步加強(qiáng)了亞馬遜云科技在生成式 AI 領(lǐng)域的競(jìng)爭(zhēng)力和影響力。
Qwen3 模型首次上線 Amazon Bedrock
作為國產(chǎn) AI 模型的扛把子,Qwen3 模型首次亮相 Amazon Bedrock,成為該平臺(tái)第 14 個(gè)模型提供商。此舉不僅標(biāo)志著中國 AI 開源生態(tài)與國際云計(jì)算的深度融合,也進(jìn)一步推動(dòng)了全球 AI 技術(shù)的合作與發(fā)展。
Qwen3 模型是阿里巴巴開源的新一代通義千問模型,在推理、指令遵循、多語言支持和工具調(diào)用等方面均大幅提升,創(chuàng)下了國產(chǎn)和全球開源模型的新性能紀(jì)錄。與同類模型相比,Qwen3 模型的部署成本大幅下降,僅需 4 張 H20 便能實(shí)現(xiàn)其滿血版部署,顯存占用也只有性能相近模型的三分之一,極大地降低了硬件需求。
此次上線的 Qwen3 模型包括四個(gè)版本:Qwen3-Coder-480B-A35B-Instruct、Qwen3-Coder-30B-A3B-Instruct、Qwen3-235B-A22B-Instruct-2507 和 Qwen3-32B-Dense,并分別針對(duì)不同應(yīng)用場(chǎng)景進(jìn)行優(yōu)化。
Qwen3-Coder-480B-A35B-Instruct專為復(fù)雜的軟件工程任務(wù)設(shè)計(jì),擅長高級(jí)代碼生成、代碼庫分析和集成外部工具;Qwen3-Coder-30B-A3B-Instruct特別優(yōu)化了代碼補(bǔ)全、重構(gòu)及編程相關(guān)問題解答,適用于多種編程語言;Qwen3-235B-A22B-Instruct-2507則提供了強(qiáng)大的通用推理和指令跟隨能力,適用于需要平衡性能與效率的任務(wù);Qwen3-32B-Dense則適用于要求穩(wěn)定性能、低延遲和成本優(yōu)化的場(chǎng)景,如移動(dòng)設(shè)備和邊緣計(jì)算。
在模型架構(gòu)方面,Qwen3 模型采用了 MoE 和密集型架構(gòu)。其中,MoE 模型如 Qwen3-Coder-480B-A35B-Instruct 和 Qwen3-Coder-30B-A3B-Instruct,通過動(dòng)態(tài)激活部分參數(shù),實(shí)現(xiàn)高效推理,適用于復(fù)雜編程和智能體任務(wù)。而密集型 Qwen3-32B 則在所有參數(shù)上提供穩(wěn)定一致的性能,適合低延遲和資源受限的環(huán)境。
同時(shí),Qwen3 模型還具備強(qiáng)大的智能體能力,能夠執(zhí)行多步推理和結(jié)構(gòu)化規(guī)劃,可以在一次模型調(diào)用中生成輸出并調(diào)用外部工具或 API,支持與外部環(huán)境的標(biāo)準(zhǔn)化通信,且能夠在長時(shí)間會(huì)話中維持?jǐn)U展上下文。
此外,Qwen3 還引入了混合思維模式,支持思維模式和非思維模式兩種推理方式,思維模式適用于需要逐步推理的復(fù)雜任務(wù),而非思維模式則提供快速響應(yīng),適合對(duì)速度要求更高的場(chǎng)景。這一創(chuàng)新幫助開發(fā)者在復(fù)雜任務(wù)和對(duì)響應(yīng)速度要求高的任務(wù)之間找到平衡。Qwen3-Coder 模型原生支持 256K 個(gè) token 的上下文窗口,使用外推方法可擴(kuò)展到 100 萬個(gè) token,使其能夠處理大規(guī)模的代碼庫、技術(shù)文檔或長時(shí)間對(duì)話歷史,進(jìn)一步提升了長上下文處理的能力。
DeepSeek-V3.1 上線 Amazon Bedrock
除了 Qwen3,在提到國產(chǎn)開源模型時(shí),DeepSeek 無疑是繞不開的名字。憑借高效的推理性能、極具競(jìng)爭(zhēng)力的性價(jià)比以及活躍的社區(qū)生態(tài),DeepSeek 已經(jīng)成為企業(yè)在大規(guī)模應(yīng)用 AI 時(shí)的重要選擇。
亞馬遜云科技也是首家提供全托管式 DeepSeek 模型的海外云廠商。
早在今年三月,亞馬遜云科技率先在云服務(wù)商中以無服務(wù)器(serverless)的方式提供 DeepSeek-R1,并在 Amazon Bedrock 上將其作為完全托管、全面可用的模型正式上線。
延續(xù)這一先行一步的策略,亞馬遜云科技在對(duì)合作伙伴最新大模型的支持上始終保持著及時(shí)快速響應(yīng)。也正因如此,當(dāng) DeepSeek 發(fā)布新一代模型 DeepSeek-V3.1 時(shí),他們便在第一時(shí)間官宣全面支持,將其迅速納入Amazon Bedrock 的模型版圖。
DeepSeek-V3.1 是一個(gè)混合推理模型,同時(shí)支持思考模式與非思考模式。在思考效率上,相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時(shí)間內(nèi)給出答案。這種可調(diào)節(jié)的推理機(jī)制,不僅提升了模型在不同應(yīng)用中的適配性,也讓 AI 的使用更加可控和高效。
與此同時(shí),DeepSeek-V3.1 在代碼生成、Agentic AI 工具調(diào)用等方面展現(xiàn)出強(qiáng)勁的性能。在模型上線 Amazon Bedrock 后,用戶可借助其強(qiáng)大的代碼生成、補(bǔ)全、調(diào)試能力,顯著提升開發(fā)效率。此外,其優(yōu)秀的工具調(diào)用能力,使開發(fā)者能夠構(gòu)建更智能、更自主的 AI Agent ,處理更復(fù)雜任務(wù)。
幸運(yùn)的是,DeepSeek-V3.1 這些功能,現(xiàn)在全部都能在 Amazon Bedrock 上體驗(yàn)。
Qwen3 和 DeepSeek 最新模型的加入,Amazon Bedrock 上完全托管的大模型家族又進(jìn)一步壯大。到目前為止,AmazonBedrock 已提供了 249 款大模型,覆蓋從通用對(duì)話、生成,到多語言理解與代碼助手等多個(gè)應(yīng)用類型,用戶都能在此找到最適合自身業(yè)務(wù)的模型。
隨著不斷引入更多大模型廠商并擴(kuò)充托管模型陣列,Amazon Bedrock 已匯聚包括 Anthropic 、DeepSeek、亞馬遜云科技自研 Nova 模型在內(nèi)的十四家主流廠商,構(gòu)建起多模型并存、多場(chǎng)景適配的開放格局。這不僅極大豐富了技術(shù)多樣性與選擇空間,也為亞馬遜云科技在未來 AI 生態(tài)中的話語權(quán)奠定了堅(jiān)實(shí)基礎(chǔ)。
大模型選型實(shí)戰(zhàn):性能穩(wěn)定高速
機(jī)器之心迫不及待地上手體驗(yàn)了一波。
在 Amazon Bedrock 上用于測(cè)評(píng)對(duì)比和挑選最合適業(yè)務(wù)的大模型的「大模型選型實(shí)戰(zhàn)」Playground,我們測(cè)試了最新上線的 Qwen3 和 DeepSeek 模型。
先讓 DeepSeek-V3.1 寫一篇科幻微小說來簡(jiǎn)單測(cè)試一下可行性。
從生成的故事來看,Amazon Bedrock 版 DeepSeek-V3.1 的表現(xiàn)可圈可點(diǎn),故事懸念和文筆都相當(dāng)不錯(cuò)。
「大模型選型實(shí)戰(zhàn)」Playground 還提供了「比較模式」,讓我們可以直接讓兩個(gè)模型同臺(tái)競(jìng)技,看它們?cè)谕瑯犹崾驹~下會(huì)有怎樣的表現(xiàn)。
接下來我們就讓 DeepSeek-V3.1 和 Qwen3-235B-A22B-Instruct-2507 同時(shí)登臺(tái),演示一下它們的混合推理能力,看看它們究竟能否根據(jù)任務(wù)難度自行決定是否推理和深度思考。先來個(gè)簡(jiǎn)單任務(wù):
小明有 3 個(gè)蘋果,吃掉了 1 個(gè),還剩幾個(gè)?請(qǐng)直接回答。
對(duì)于這個(gè)簡(jiǎn)單問題,兩個(gè)模型幾乎都是瞬時(shí)完成了任務(wù) —— 都在半秒左右(模型名右側(cè)第三個(gè)數(shù)據(jù),前兩個(gè)數(shù)據(jù)分別是輸入和輸出的 token 數(shù)量)給出了正確答案。很顯然,對(duì)于這個(gè)簡(jiǎn)單任務(wù),這兩個(gè)模型都沒有(也無需)進(jìn)行深度思考。
接下來上一個(gè)難度更大一點(diǎn)、涉及到多步計(jì)算的任務(wù):
小明有 24 個(gè)蘋果。他先吃掉 1/3,剩下的平均分給 3 個(gè)朋友。后來,每個(gè)朋友又把自己的一半蘋果還給小明。最后,小明手里一共有多少個(gè)蘋果?請(qǐng)逐步推理。
可以看到,這兩個(gè)模型同樣正確地完成了任務(wù)并給出了整個(gè)推理過程。而仔細(xì)觀察,我們又能發(fā)現(xiàn)這兩個(gè)混合推理模型的回答各有風(fēng)格。比如 Qwen3-235B-A22B-Instruct-2507 的計(jì)算過程分成了 5 步,而 DeepSeek-V3.1 用了 4 步;另外前者的推理過程中的 LaTeX 并沒有渲染,而后者的完成了渲染。用戶可以根據(jù)自身的業(yè)務(wù)流程需求及偏好選擇合適的模型。
最后我們?cè)僮?Qwen3-Coder-480B-A35B-Instruct 上場(chǎng),為我們編寫一個(gè)「俄羅斯方塊 + 貪吃蛇」游戲:
用 Python(使用 pygame)編寫一個(gè)融合俄羅斯方塊和貪吃蛇的小游戲:畫面分為上下兩部分,上半部分有一條會(huì)自動(dòng)移動(dòng)的蛇,玩家需控制下落方塊左右移動(dòng)以躲避蛇;當(dāng)方塊進(jìn)入下半部分后,按照俄羅斯方塊規(guī)則繼續(xù)下落,玩家需要把它放入合適位置以消除整行。若方塊與蛇相撞則游戲結(jié)束;支持方向鍵移動(dòng)、空格鍵加速下落;蛇可隨機(jī)改變方向。程序需包含初始化、事件處理、邏輯更新和渲染繪制等模塊,并寫清注釋。
該模型僅用半分鐘就完成了任務(wù)!下面將代碼復(fù)制出去運(yùn)行一下。
這個(gè) Qwen3-Coder 首次完成的代碼就基本正確地完成了提示詞所述的所有游戲邏輯,即使不修改也基本可玩。對(duì)于其中顯示不出的字符,我們也只需對(duì)代碼中的字體設(shè)置做簡(jiǎn)單微調(diào),即可解決。
整個(gè)過程中,Amazon Bedrock 提供的服務(wù)都非常穩(wěn)定高速,提供的全量模型的性能也能得到充分保證。
亞馬遜云科技:我們也很看重開放權(quán)重模型
我們不難發(fā)現(xiàn),Qwen3 以及 DeepSeek-V3.1 都是國產(chǎn)開源陣列中的佼佼者,加上之前的 gpt-oss(120b 和 20b),亞馬遜云科技都將它們納入 Amazon Bedrock 平臺(tái),彰顯了其對(duì)開源生態(tài)的重視與支持
在亞馬遜云科技看來,向客戶提供多樣化的專有模型和開源模型是解鎖全球客戶在生成式 AI 領(lǐng)域創(chuàng)新自由的關(guān)鍵。
一方面用戶無需在不同供應(yīng)商、不同環(huán)境之間輾轉(zhuǎn),即可在同一個(gè)平臺(tái)上實(shí)驗(yàn)、比較、部署和優(yōu)化來自多方的頂級(jí)模型能力。
另一方面,相比閉源模型,開源模型有著獨(dú)特的優(yōu)勢(shì),特別是在定制化開發(fā)和透明性方面,給用戶帶來了更大的靈活性和控制權(quán)。
舉例來說,在 Amazon Bedrock 上,用戶可以通過開源模型直接調(diào)用經(jīng)過優(yōu)化的托管推理服務(wù),實(shí)現(xiàn)快速應(yīng)用部署,而無需從頭開始搭建基礎(chǔ)設(shè)施。這種便捷的方式,可以幫助用戶迅速將生成式 AI 集成到自己現(xiàn)有的工作流程和業(yè)務(wù)場(chǎng)景中。
此外,開源模型的真正價(jià)值不僅僅在于其即用性,更在于其開放權(quán)重的特性。用戶可以在原始模型的基礎(chǔ)上,利用自己的行業(yè)數(shù)據(jù)和特定需求,進(jìn)行二次開發(fā)和定制訓(xùn)練。例如,某些行業(yè)可能需要更精確的語義理解,通過開源模型,用戶可以根據(jù)自身的實(shí)際情況調(diào)整訓(xùn)練集、優(yōu)化模型架構(gòu),甚至引入新的技術(shù)與算法。這種能力使得企業(yè)能夠打造高度個(gè)性化、符合行業(yè)特色的智能解決方案,進(jìn)而在市場(chǎng)中獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。
更重要的是,開源模型擁有很高的透明性。企業(yè)和用戶可以清晰了解模型的結(jié)構(gòu)、訓(xùn)練數(shù)據(jù)和算法流程,這不僅增強(qiáng)了對(duì)模型行為的預(yù)測(cè)能力,也提高了在合規(guī)性和道德方面的可控性,真正體現(xiàn)了亞馬遜云科技以用戶為中心的服務(wù)理念。
正如 Amazon Bedrock 總監(jiān) Luis Wang 所言:「開放權(quán)重模型代表著 AI 創(chuàng)新的重要前沿,因此我們投入大量精力,致力于將亞馬遜云科技打造為安全、大規(guī)模且經(jīng)濟(jì)高效地運(yùn)行這些模型的最佳平臺(tái)。我們認(rèn)為,不存在一個(gè)適合所有用例的最佳模型…… 許多客戶喜歡使用開放模型,而開放模型的優(yōu)勢(shì)之一就是您可以擁有更大的靈活性來使用它?!?/p>
Choice Matters
沒有一個(gè)模型可以一統(tǒng)天下,選擇更重要
在最近一次采訪中,亞馬遜云科技 CEO Matt Garman 將 AI 描述為「幾十年來見過的可能發(fā)展最快的技術(shù)」。他認(rèn)為,AI 不僅會(huì)像互聯(lián)網(wǎng)和云計(jì)算一樣引發(fā)深刻變革,未來幾十年也將是持續(xù)創(chuàng)新的黃金期。
為了幫助各類公司在 AI 浪潮中不斷創(chuàng)新和落地,亞馬遜云科技一直秉持「Choice Matters」(選擇大于一切)理念。
「Choice Matters」并非空洞的口號(hào),而是根植于亞馬遜云科技對(duì)技術(shù)演進(jìn)和客戶需求的深刻洞察。AI 應(yīng)用場(chǎng)景復(fù)雜多樣,沒有任何一個(gè) AI 模型能夠成為所有問題和場(chǎng)景的「萬能鑰匙」,企業(yè)客戶受性能、成本、具體任務(wù)、數(shù)據(jù)隱私與合規(guī)等多重因素影響,需求更是千差萬別。因此,將客戶鎖定在單一技術(shù)路徑,無異于限制其創(chuàng)新潛力。
正是在此背景下,亞馬遜云科技推出了能夠承載多樣化模型的 Amazon Bedrock 和 Amazon SageMaker 兩大平臺(tái),并于 2024 年 re:Invent 大會(huì)上正式將「Choice Matters」確立為其生成式 AI 的核心戰(zhàn)略,旨在將選擇權(quán)和技術(shù)自由度徹底交還給客戶。
截至目前,亞馬遜云科技在 Amazon Bedrock 和 SageMaker 上構(gòu)建了一個(gè)擁有超過 400 款模型的模型庫,讓客戶能夠像在超市挑選商品一樣,根據(jù)自身獨(dú)特的業(yè)務(wù)需求,靈活比較、測(cè)試并組合最適合的模型,從而構(gòu)建出端到端的 AI 應(yīng)用。
于企業(yè)客戶而言,這一策略意味著最大化業(yè)務(wù)價(jià)值與加速實(shí)現(xiàn)落地。企業(yè)無需削足適履地去適應(yīng)某個(gè)固定模型,而是可以像搭積木一樣,以多模型協(xié)作的方式,將不同模型精準(zhǔn)應(yīng)用于營銷、客服、編程等不同環(huán)節(jié),推動(dòng) AI 驅(qū)動(dòng)的業(yè)務(wù)轉(zhuǎn)型,形成 Matt 所言的「飛輪效應(yīng)」。
對(duì)亞馬遜云科技自身乃至整個(gè)行業(yè)來說,「Choice Matters」構(gòu)成了其最核心的差異化競(jìng)爭(zhēng)優(yōu)勢(shì)。它避免了亞馬遜云科技與模型提供商陷入正面競(jìng)爭(zhēng),轉(zhuǎn)而專注于其最擅長的領(lǐng)域,即成為中立、豐富且可靠的 AI 基礎(chǔ)設(shè)施層
這種開放共贏的策略,吸引了包括初創(chuàng)公司、大型企業(yè)在內(nèi)的多樣化客戶生態(tài),使各類企業(yè)都能找到適合自身的創(chuàng)新路徑,從而鞏固了亞馬遜云科技作為 AI 時(shí)代創(chuàng)新基座的地位,為其長期增長奠定了堅(jiān)實(shí)基礎(chǔ)。
最后,想在Amazon Bedrock上嘗試這兩款模型的小伙伴,指路:https://dev.amazoncloud.cn/experience/cloudlab?id=67bc1b7c8ea6eb2ae682bde3&visitfrom=1P_social_0919&sc_medium=owned&sc_campaign=cloudlab&sc_channel=1P_social_0919