——原生ANN引擎,QPS飆升數十倍,成本新低,開發體驗「真香」!
開通入口>> http://www.aliyun.com/product/es/es-serverless
隨著生成式AI與實時數據分析需求激增,開發者亟需兼顧高性能、低成本且免運維的檢索服務。阿裏雲 Elasticsearch Serverless 基於官方8.17版本,深度融合無服務器架構與分層擴展能力,麵向信息檢索、向量搜索、語義分析等通用場景,提供全托管服務。
一、Serverless服務簡介
阿裏雲 Elasticsearch Serverless 采用讀寫分離架構與智能資源調度策略,自動監控 CPU、內存、網絡等關鍵指標,動態調整計算資源,消除手動擴縮容與集群配置負擔,是企業輕量化搭建搜索應用的高性價比選擇。
與2024年7月發布的檢索通用型7.10版本相比,本次推出的檢索增強型8.17版本在最新特性擴展、自動擴縮性能、資源成本優化三大維度實現全麵躍升。本文將深度解析該版本通過工程優化帶來的核心能力升級。
升級一:向量檢索性能飛躍
基於 Elasticsearch 8.17 版,發布最新向量能力,實現檢索性能、開發體驗的跨越式升級
· 高效 KNN 檢索:相較於7.10版依賴 script_score 自定義腳本進行暴力檢索,8.17版原生支持高效的 KNN 檢索,查詢速度實現了質的飛躍。
· 資源優化:在高召回的同時,默認int8量化能力將內存占用降低75%,bbq 量化進一步降低資源消耗。同等資源下,百萬級向量檢索 QPS 提升數十倍。
· 靈活組合查詢:8.17版原生支持 knn 向量查詢與傳統 query 子句的靈活組合,並結合 RRF(Reciprocal Rank Fusion)實現多元召回結果的智能融合與統一排名,顯著提升複雜場景下的搜索相關性與用戶體驗。
升級二:智能化彈性調度架構
全麵升級智能化彈性調度架構,保障服務穩定的同時1秒內資源拓展到位,擴縮更絲滑
ES Serverless 服務底層采用彈性架構,基於應用 CU 等水位觀測,高效調度底層機器資源,實現低成本承接高用量的業務效果。相比檢索通用型(7.10版)應用,檢索增強型(8.17版)不但大幅縮短了彈性響應時效,同時放開了低峰期突增流量限流的限製。
· A場景-流量逐漸穩定增長:8.17版能夠瞬時響應並正常承接增加的用戶請求量,幾乎沒有觸發限流;整體 RT 平穩度和耗時更有優勢,擴容期間服務穩定、性能有保障。
· B場景-流量瞬時突增:8.17版能夠穩定承接流量突增,而7.10版需要一定時間緩衝,初期成功率較低。8.17版在整體RT平穩度、穩定性與無感擴容體驗上更優。
如下圖,某真實電商網站在下午 18:00-21:00時間段開展品類大促活動,搜索流量能達到平時的3倍,並且會有突增 6 倍的秒殺活動,本文將模擬【A場景-流量逐漸穩定增長】與【B場景-流量瞬時突增】兩種不同趨勢,對比分析檢索通用型(7.10版)應用與檢索增強型(8.17版)應用的體驗差異(下文簡稱為7.10應用、8.17應用)。
A-場景流量逐漸穩定增長:三小時流量分別是一小時穩定增流,一小時穩定高峰,一小時穩定減流。其中高峰為低峰的 3 倍流量。
· 7.10 應用受限於彈性機製的限製。在啟動增壓時,若增壓過程較快(如上),會出現因彈性反應時間過長導致的限流;
· 8.17 應用完成了瞬時響應,正常承接了增加的用戶請求量,沒有觸發限流。具體可見:失敗請求數統計圖表。
· 8.17 應用較 7.10 應用在整體 RT 平穩度、RT 耗時上都更有優勢,可見流量增長過程中 8.17 的 RT/took 都很穩定。具體可見:平均 RT 統計圖表。
· 8.17 應用與 7.10 應用均表現出優秀的穩定性體驗,8.17應用擴容更加無感、幾乎未出現重試操作。具體可見:成功率、重試率統計圖表。
· 在 CU 統計上,8.17 應用更線性更穩定;7.10 應用在初期彈性和高峰期會有波動。具體可見:消耗CU、應用請求 QPS、總請求數統計圖表。
· 8.17 應用能夠穩定承接流量突增;較「A-流量逐漸穩定增長」, 該 case 更可見 7.10 應用受限於彈性機製的限製需要一定的時間緩衝。在剛突增時,成功率維持在 42%左右,7 分鍾後恢複至 95%以上;下一區間的七分鍾後整體恢複。具體可見:消耗 CU、應用請求 QPS、總請求數統計圖表。
Tips:使用8.17應用時,需保證突增後的流量在 CU 上限以下,CU上限默認取值為固定CU額度的3倍,可根據流量情況選擇合適的固定CU額度配置。7.10應用在突增初期 QPS 更高是因為客戶端重試機製在限流時觸發了重試,在彈性完成後恢複正常。
· 8.17 應用較 7.10 應用在整體 RT 平穩度、RT 耗時上都更有優勢,可見流量增長過程中 8.17 的 RT/took 都很穩定。具體可見:平均 RT 統計圖表。
· 8.17 應用較 7.10 應用在穩定性與無感擴容體驗更優,始終保持更優的成功率與重試率。具體可見:成功率、重試率統計圖表。
· 在 CU 統計上,8.17 應用由於完成了秒級響應,貼合實際應用請求 QPS 調度資源;7.10 應用也根據實際調度情況統計出計量 CU,但在初期彈性和高峰期會有波動,8.17 應用更線性更穩定。具體可見:消耗 CU、應用請求 QPS、總請求數統計圖表。
Tips:如果您已經使用了7.10應用,因版本或排期限製暫無計劃使用8.17應用,針對周期性流量場景,您可通過工單形式提交分時彈性需求,為您的應用開啟分時彈性功能後,將追平8.17應用的彈性響應效果。
最終對比結論:綜上所述,8.17 應用彈性擴容性能提升明顯,可做到無感升配,能有效承接突增、平穩趨勢下的流量增長,提供流暢、穩定的服務體驗。
升級三:資源成本優化
通過預留+彈性 CU 模式靈活調度資源,CU 單價再調低,資源成本再優化
為進一步優化資源成本,提升資源擴縮體驗。檢索通用型8.17版采用了預留固定 CU 配額+按需使用的彈性 CU 用量收費的模式,預留固定 CU 的單價調整至更低。
綜上所述,阿裏雲 Elasticsearch Serverless 8.17 版在向量檢索性能、智能化彈性調度架構及資源成本優化方麵實現了全麵升級,為開發者提供了高性能、低成本且免運維的檢索服務解決方案。
二、使用指南
公測說明
檢索增強型應用(8.17版)_檢索分析服務 Elasticsearch版(ES)-阿裏雲幫助中心
檢索增強型應用(8.17版)於2025年4月25日起已陸續在華東2(上海)、華北2(北京)、華南1(深圳)、華東1(杭州)地域開啟公測,在此期間,您無需申請即可免費試用。預計公測將於2025年6月16日結束,屆時,使用服務將按照相關計費項收取相應費用。
三、開通檢索增強型應用(8.17版)
步驟一、開通服務
第一次使用ES Serverless服務時,需要進行服務開通。
1. 登錄Elasticsearch Serverless服務控製台。
步驟二、創建應用
1. 進入創建Serverless應用的頁麵,選擇創建實例的區域。
(示例)本示例選擇應用選型為檢索增強型(8.17版),其他參數保持默認或自定義。
a. (示例)本示例選擇網絡訪問方式為公網訪問,在公網訪問白名單中添加本地設備的IP地址,以便使用本地設備訪問Serverless應用的Kibana。
配置應用公網訪問或私網訪問,請參見配置Serverless應用公網或私網訪問。
您可以在應用管理頁麵查看已創建的應用列表。請等待應用狀態變為運行中,這表示應用已成功創建。隨後,您可以根據個人需求,嚐試體驗更多功能。
星空人工智能美女福利导航網 倡導尊重與保護知識產權。如發現本站文章存在版權等問題,煩請30天內提供版權疑問、身份證明、版權證明、聯係方式等發郵件至1851688011@qq.com美女直播全婐APP免费下载將及時溝通與處理。!:首頁 > 星空人工智能產業 > VR|虛擬現實 » ES Serverless 8.17王牌發布:向量檢索「火力全開」,智能擴縮「秒級響應」!










