近日,可觀測(cè)與應(yīng)用安全廠商基調(diào),利用基調(diào)聽(tīng)云撥測(cè)工具,模擬真實(shí)用戶(hù)的主動(dòng)監(jiān)控,從網(wǎng)絡(luò)性能、接口響應(yīng)時(shí)間、推理速度、內(nèi)容生成速度等多個(gè)關(guān)鍵指標(biāo),對(duì)多家廠商提供的DeepSeek-R1 API 服務(wù)進(jìn)行了深入測(cè)試。
根據(jù)測(cè)試后發(fā)布的《大模型服務(wù)性能評(píng)測(cè) DeepSeek-R1 API版》第一期顯示,本次共對(duì)北京、上海、廣州、深圳、重慶、蘇州、成都等多個(gè)城市的DeepSeek-R1 API 服務(wù)進(jìn)行了測(cè)試,采集指標(biāo)方面,通過(guò)API返回的數(shù)據(jù)計(jì)算出來(lái)的指標(biāo)包含:平均速度(tokens/s)、首 Token 時(shí)間(s)、推理速度(tokens/s)、生成速度(tokens/s),而通過(guò)聽(tīng)云撥測(cè)客戶(hù)端計(jì)算的指標(biāo)包含:DNS 時(shí)間(s)、建連時(shí)間(s)、握手時(shí)間(s)、發(fā)出請(qǐng)求時(shí)間(s)、首包時(shí)間(s)、剩余包時(shí)間(s)、性能(s) 和可用性(%)。
參加測(cè)試的廠商包括火山引擎、DeepSeek官方、硅基流動(dòng)、騰訊云、阿里云百煉。
在深圳本地的測(cè)試中,可用性方面,盡管火山引擎和硅基流動(dòng)都達(dá)到了100%,但兩者在生成速度方面相差較大,火山引擎生成速度可以達(dá)到65.673 tokens/s,而硅基流動(dòng)該項(xiàng)指標(biāo)則為16.966 tokens/s。阿里云百煉可用性也達(dá)到了91.94%,但生成速度僅為11.813 tokens/s。
DeepSeek R1評(píng)測(cè)結(jié)果(圖片來(lái)自基調(diào)聽(tīng)云公眾號(hào))
至于DeepSeek官方,雖然生成速度可以達(dá)到37.117 tokens/s,但可用性?xún)H為41.94%,在參與測(cè)試的五家廠商中是最低的,這也意味著,很大一部分用戶(hù)的請(qǐng)求都不能得到響應(yīng)。
值得一提的是,在深圳本地的測(cè)試中,火山引擎在推理速度方面也獨(dú)占鰲頭,達(dá)到了30.083 tokens/s,排名緊隨其后的DeepSeek官方為25.378 tokens/s。
綜合評(píng)測(cè)結(jié)果顯示,火山引擎在 API 響應(yīng)性能上全面領(lǐng)先,各項(xiàng)指標(biāo)均顯著優(yōu)于其他服務(wù)商。
基調(diào)聽(tīng)云表示,本次測(cè)評(píng)旨在為開(kāi)發(fā)者提供深度數(shù)據(jù)支撐,助力其精準(zhǔn)洞察各服務(wù)商 API 接口的性能表現(xiàn),從而有針對(duì)性地優(yōu)化產(chǎn)品體驗(yàn)。
對(duì)于開(kāi)發(fā)者和企業(yè)用戶(hù)而言,這些數(shù)據(jù)可以作為服務(wù)商選擇的決策依據(jù),從而更科學(xué)地甄別適配自身需求的技術(shù)方案。(作者:林松)
關(guān)鍵詞: