發(fā)布時(shí)間:2025-09-17 來(lái)源:風(fēng)雨飄零網(wǎng)作者:毛毛的頭發(fā)亂了
IT之家 9 月 11 日消息,微軟為其 Copilot 工具新增了一個(gè)“Copilot 音頻表達(dá)式”功能,該功能基于微軟自研的 MAI-Voice-1 模型,目前用戶(hù)可從三種不同的語(yǔ)音模式中進(jìn)行選擇。
IT之家注意到,第一種是“有感染力模式(Emotional Mode)”,支持富有表現(xiàn)力的自由式表達(dá),適用于需要傳遞情感的場(chǎng)景;第二種是“故事模式(Story Mode)”,用戶(hù)可借助該模式講述包含多個(gè)人物角色的故事,帶來(lái)沉浸式聽(tīng)覺(jué)體驗(yàn);第三種是“腳本模式(Script Mode)”,能夠?qū)崿F(xiàn)逐字精準(zhǔn)播放,非常適合需要準(zhǔn)確傳遞信息的場(chǎng)景。
微軟還為每種模式提供了多種語(yǔ)音類(lèi)型與風(fēng)格,涵蓋經(jīng)典的莎士比亞作品朗讀風(fēng)格以及富有激情的體育解說(shuō)風(fēng)格等。
目前,這項(xiàng)新功能已在 Copilot Labs(Copilot 實(shí)驗(yàn)室)上線,用戶(hù)可在其中直接體驗(yàn)。值得關(guān)注的是,微軟近期推出的 MAI-1 是其首款大型語(yǔ)言模型,同時(shí)該公司還與 Anthropic 達(dá)成協(xié)議,計(jì)劃將 Anthropic 的模型集成至 Office 應(yīng)用中。這些舉措表明,微軟正致力于在人工智能領(lǐng)域減少對(duì) OpenAI 的依賴(lài)。