首 頁 社會聚焦 社情民意 民意時(shí)評 創(chuàng)客說 樂觀社會 畫里有話 滾動資訊

首頁>社會>滾動資訊

百度智能云VectorDB首批完成中國信通院向量數(shù)據(jù)庫性能測試

2025年05月08日 15:08  |  作者:滾動資訊  |  來源:信陽日報(bào) 分享到: 

百度全自研的分布式向量數(shù)據(jù)庫產(chǎn)品VectorDB亮相Create 2025百度AI開發(fā)者大會展區(qū)。作為一款純自研可支持百億向量的數(shù)據(jù)庫服務(wù),VectorDB基于自研的向量數(shù)據(jù)庫內(nèi)核系統(tǒng)構(gòu)建,為各行各業(yè)的AI應(yīng)用開發(fā)提供了強(qiáng)有力的基礎(chǔ)設(shè)施支持。

1

百度智能云數(shù)據(jù)庫亮相Create 2025展區(qū)

"我們專門為向量重新設(shè)計(jì)的存儲和索引結(jié)構(gòu),能夠?qū)崿F(xiàn)更高的性價(jià)比和彈性。輕松擴(kuò)展以支持海量高維向量數(shù)據(jù)存儲和檢索,支持百億級向量規(guī)模和十萬級分片數(shù)量,同時(shí)提供高性能的訪問能力;簡潔的訪問接口、全面的檢索能力架構(gòu)和數(shù)據(jù)引擎多方面工程優(yōu)化,讓各場景性能均高于開源產(chǎn)品7倍;同時(shí)兼容豐富的上下游生態(tài),滿足客戶在企業(yè)級知識庫,圖片搜索,音樂推薦,文本分類等領(lǐng)域落地的需求。"Create展區(qū)現(xiàn)場講解老師表示。

日前在中國信通院“可信數(shù)據(jù)庫”首批向量數(shù)據(jù)庫性能測試中,百度智能云VectorDB順利完成了向量數(shù)據(jù)庫產(chǎn)品性能測試,成為國內(nèi)首批完成測試的向量數(shù)據(jù)庫產(chǎn)品。測試為了能夠更貼切地評估和模擬各產(chǎn)品在信創(chuàng)環(huán)境下的實(shí)際性能,全程在符合信創(chuàng)標(biāo)準(zhǔn)的環(huán)境下進(jìn)行。測試中,百度智能云VectorDB完成了所有向量檢索場景(例如稠密向量檢索、多向量檢索、標(biāo)量向量融合檢索)的性能測試。從測試結(jié)果來看,在百萬和億級稠密向量檢索性能測試中,產(chǎn)品性能表現(xiàn)優(yōu)異,滿足企業(yè)生產(chǎn)要求。

作為專為人工智能應(yīng)用設(shè)計(jì)的數(shù)據(jù)庫產(chǎn)品,百度智能云VectorDB采用分布式架構(gòu),自研的引擎具備強(qiáng)大的數(shù)據(jù)處理能力,被譽(yù)為產(chǎn)品核心;同時(shí)提供多種檢索功能,滿足不同應(yīng)用場景的需求,為用戶提供了在不同場景下的選擇空間,可以根據(jù)成本、性能和召回率需求進(jìn)行權(quán)衡選擇。VectorDB作為企業(yè)級產(chǎn)品,在易用性、安全性以及彈性可用等方面也表現(xiàn)出色,并全面支持私有化部署需求,私有化產(chǎn)品能力完全對標(biāo)公有云版本,例如基于DBStack的私有化架構(gòu),全棧支持跨AZ高可用、支持國產(chǎn)化信創(chuàng)環(huán)境。

值得一提的是該產(chǎn)品還提供了強(qiáng)大的生態(tài)組件,進(jìn)?步擴(kuò)展其應(yīng)用場景,例如AI Search。AI Search是一套完整的RAG解決方案,主要應(yīng)用于知識庫的向量化檢索與管理場景,通過集成文檔管理、解析、嵌?服務(wù)和檢索等模塊,用戶可以快速構(gòu)建專屬的知識檢索和生成系統(tǒng)。例如憑借該向量數(shù)據(jù)庫平臺的部署,某大型國有銀行內(nèi)部原有知識孤島問題得到有效解決,知識檢索效率提升超過80%,大幅降低了一線員工獲取復(fù)雜業(yè)務(wù)知識的時(shí)間成本。目前該系統(tǒng)已支持多條業(yè)務(wù)線,日均調(diào)用量達(dá)數(shù)十萬次,顯著增強(qiáng)了銀行數(shù)字化運(yùn)營能力與智能化服務(wù)水平。

如今VectorDB已實(shí)現(xiàn)與多個(gè)平臺和框架的集成,支持從Milvus離線遷移數(shù)據(jù);支持千帆AppBuilder、LangChain、LlamaIndex、Dify等主流框架;提供AI Search SDK,支持高層次RAG框架封裝,集成文心Embedding模型,基于百度中文語料并加入知識圖譜進(jìn)行訓(xùn)練,中文實(shí)體和短語性能更好。

此外VectorDB同時(shí)適用于多種AI應(yīng)用場景,例如信息相似度檢索。支持百億級向量數(shù)據(jù)檢索,提供多模語義檢索能力,適用于文檔和圖片的智能檢索,從容面對多模態(tài)多維度向量的實(shí)時(shí)存儲與檢索、高性能全庫更新、云端/客戶端協(xié)同檢索等挑戰(zhàn)。在大模型對話場景中,產(chǎn)品可以實(shí)時(shí)存儲和檢索會話數(shù)據(jù),有效降低幻覺情況,提升問答準(zhǔn)確性。通過百億級高維向量實(shí)時(shí)存儲和高并發(fā)毫秒級混合檢索能力,應(yīng)對ANN索引優(yōu)化、彈性擴(kuò)展集群、索引監(jiān)控與切換等技術(shù)挑戰(zhàn)。

另外VectorDB還為私有云環(huán)境下的私域知識庫構(gòu)建提供了強(qiáng)大支持,例如統(tǒng)一的向量數(shù)據(jù)全生命周期管理、多模私域數(shù)據(jù)存儲和檢索管理、數(shù)據(jù)Embedding管理以及混合檢索能力等,解決了向量模型版本管理、復(fù)雜查詢條件支持和私有化部署等技術(shù)挑戰(zhàn)。某大型證券公司,基于向量數(shù)據(jù)庫成功構(gòu)建智能投研與合規(guī)知識問答平臺。系統(tǒng)將研究報(bào)告、公司公告、法規(guī)文件、投資策略文檔等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行向量化處理,打通多個(gè)業(yè)務(wù)部門之間的信息壁壘,提升內(nèi)部知識復(fù)用效率。通過該平臺,證券公司的投研人員能夠?qū)崿F(xiàn)快速檢索與語義匹配,大幅提高了投研報(bào)告的撰寫效率和合規(guī)審核準(zhǔn)確性;合規(guī)部門亦可借助智能問答助手,快速定位相關(guān)法規(guī)條款和過往案例,審核時(shí)長縮短40%,整體投研與合規(guī)協(xié)作效率提升超過50%。項(xiàng)目落地后,有效強(qiáng)化了風(fēng)控合規(guī)體系,支撐了其智慧證券業(yè)務(wù)的戰(zhàn)略轉(zhuǎn)型。

《向量數(shù)據(jù)庫性能測試方法》是中國信通院云計(jì)算與大數(shù)據(jù)研究所依托中國通信標(biāo)準(zhǔn)化協(xié)會大數(shù)據(jù)與區(qū)塊鏈工作組(CCSA TC1 WG6)以及大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(CCSA TC601),聯(lián)合超過20家企業(yè)專家參與編制的技術(shù)標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)覆蓋稠密向量檢索、多向量檢索、標(biāo)量向量融合檢索3種常見向量檢索場景,評估指標(biāo)涵蓋索引構(gòu)建時(shí)間、QPS、平均時(shí)延、最大時(shí)延、P99時(shí)延、CPU占用、內(nèi)存占用等多個(gè)維度。向量數(shù)據(jù)庫產(chǎn)品性能測試融合了國內(nèi)行業(yè)專家豐富的實(shí)踐經(jīng)驗(yàn)與智慧,是對向量數(shù)據(jù)庫性能的綜合評判,旨在為供給側(cè)研發(fā)和應(yīng)用側(cè)選型向量數(shù)據(jù)庫提供參考。

【廣告】

(免責(zé)聲明:此文內(nèi)容為本網(wǎng)站刊發(fā)或轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),與本網(wǎng)無關(guān)。僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。)