瑞芯微亮相深圳安博會,端側(cè)AI方案開啟智能視覺新紀元
2025-11-11
10月28-31日,深圳會展中心,瑞芯微電子股份有限公司(簡稱“瑞芯微”,展位1號館1A23)亮相第二十屆中國國際社會公共安全博覽會暨全球數(shù)字城市產(chǎn)業(yè)博覽會(以下簡稱“安博會”),以“低功耗+AI”為核心技術(shù)亮點,全方位展示了其覆蓋從入門到高端、從傳統(tǒng)智能到前沿大模型的端側(cè)全場景AI視覺方案,重新定義智能視覺。

端側(cè)AI協(xié)處理器RK182X:
賦能大模型在視覺應(yīng)用端側(cè)落地
端側(cè)大模型展區(qū),展出RK182X端側(cè)AI算力協(xié)處理器及系列相關(guān)應(yīng)用。RK182X具備大算力、高帶寬特性,支持3B/7B大模型突破百token/s輸出,可根據(jù)算力需求疊加一個或多個RK182X協(xié)處理器,為終端設(shè)備提供前所未有的算力靈活性,針對端側(cè)AI復雜計算需求,特別是在多路視覺分析領(lǐng)域如智能安防、智能社區(qū)、智能校園等提供安全、可靠、低成本的AI部署選擇。

基于RK3588+RK182X的離線端側(cè)大模型部署,支持最高7B大模型部署,在端側(cè)設(shè)備上可實現(xiàn)包括視頻分析摘要、數(shù)字人、識圖助手、多模態(tài)感知等熱門功能:
1、基于RK182X的視頻摘要和事件預(yù)警
• 主要功能:使用RK3588 + RK1820在端側(cè)實現(xiàn)多模態(tài)的視頻理解
RK3588負責視頻場景切片,RK182X負責加速多模態(tài)模型推理,實現(xiàn)接近實時的處理性能。該方案可應(yīng)用于多種場景,例如針對多路攝像頭長時間監(jiān)控的場景,可自動監(jiān)看現(xiàn)場視頻,生成簡潔的視頻文字摘要。同時支持任意定制的萬能異常事件布控。
• 方案優(yōu)勢:
1)充分利用RK182X的20T算力和高帶寬特性,實現(xiàn)接近實時且具備普適泛化能力的視頻摘要
2)依托多模態(tài)模型的強泛化能力,支持靈活定義的萬能異常事件布控,無需重新訓練即可適配新場景。


2、基于RK182X的視頻檢索
• 主要功能:通過Vision Embedding模型對視頻進行預(yù)處理,提取視頻片段的語義特征向量;用戶提問時,將文本同樣轉(zhuǎn)換為特征向量,通過計算文本與視頻向量間的余弦相似度,匹配并返回最相關(guān)的若干視頻片段。
• 方案優(yōu)勢:
1)相比傳統(tǒng)的CLIP類文搜圖模型,本方案引入時序建模,充分考慮圖像序列間的動態(tài)關(guān)系,采用高層語義表征替代傳統(tǒng)結(jié)構(gòu)化標簽
2)充分釋放RK182X的端側(cè)算力,實現(xiàn)原本僅高端服務(wù)器具備的視頻語義檢索能力

此外,還展示了運行Qwen 2.5-7B大模型性能表現(xiàn),首幀延遲控制在160毫秒左右,每秒可生成50+個Token(TPS),性能處于行業(yè)領(lǐng)先水平。
新一代機器視覺芯片RV1126B:
定義高端AI安防新標準
作為本次的重磅新品,瑞芯微新一代4K機器視覺芯片RV1126B備受關(guān)注。RV1126B具備3T強勁算力,可運行2B以內(nèi)規(guī)模的大語言模型及多模態(tài)模型,針對算力、AI-ISP、AOV3.0、超級編碼、防抖等性能均有明顯升級?,F(xiàn)場演示了多項引領(lǐng)行業(yè)的技術(shù)應(yīng)用,賦能各類視覺設(shè)備實現(xiàn)從“看得見”到“看得懂”的質(zhì)的飛躍:

• 星光夜視AI-ISP:RV1126B集成專用 AI-ISP 硬件,運行 AI-ISP時無需占用通用的3T NPU 資源,較傳統(tǒng) NPU 方案更節(jié)省帶寬與功耗。結(jié)合 AI Remosaic 技術(shù)實現(xiàn) "日夜雙模自適應(yīng)"—— 白天呈現(xiàn)超高清畫質(zhì),夜晚在超低照度下仍保持清晰成像。

• 超低功耗AOV3.0:AOV3.0 技術(shù)融入低功耗音頻事件喚醒功能,可實時檢測狗吠、玻璃破碎、槍聲等異常聲源,設(shè)備待機功耗低至1mW左右,支持 7×24 小時全天候音視頻監(jiān)測。

• AI防抖:硬件級 6-DOF 數(shù)字防抖,精準識別并消除高頻抖動,讓運動圖像更加流暢輸出穩(wěn)定流暢的視頻流。

• 超感知紅外熱傳感:最大支持 16bit 數(shù)據(jù)輸入,支持包括OCC(探測器像素偏置校正)、自動NUC(非均勻性校正)、去橫豎條紋、3D及2D降噪、動態(tài)范圍壓縮等在內(nèi)的多個功能拓展了安防的感知維度,實現(xiàn)了無光環(huán)境下的精準監(jiān)測與更寬廣、無死角的監(jiān)控視野。

• 多目AI動態(tài)拼接:支持2x6M雙目拼接及4x2M全錄拼接,基于自研AVS多目拼接算法將多路輸入圖像拼接為一路,支持動態(tài)拼接,拼縫處流暢自然無割裂感,滿足更大視野的需求,在安防、會議辦公、體育賽事等場景廣泛適用。

• 超級編碼:針對視頻監(jiān)控等數(shù)據(jù)密集型場景,RV1126B 集成智能編碼引擎,支持 800萬像素 45FPS 超高清編碼,通過動態(tài)碼率優(yōu)化技術(shù),較傳統(tǒng) CBR 模式節(jié)省 50% 碼流,相同存儲空間可提升一倍錄制時長。在確保畫面細節(jié)完整的同時,大幅降低存儲成本與傳輸帶寬壓力。

基于這些前沿視覺技術(shù)的深度融合, RV1126B目前廣泛應(yīng)用于高端AI網(wǎng)絡(luò)攝像機、智能門禁、機器人、智能車載視覺等復雜場景,極大提升了終端產(chǎn)品的智能化水平和用戶體驗。
RV1106B:以低功耗革新多目IPC應(yīng)用
針對電池供電或?qū)挠袊揽烈蟮膱鼍?,瑞芯微推出基于RV1106B的低功耗AOV 多目IPC解決方案。RV1106B內(nèi)置0.5T NPU及AI-ISP,并搭載了豐富的視覺算法工具,為消費級安防攝像頭、智能門鈴、寵物看護等應(yīng)用擴展AI功能及多目動態(tài)拼接能力。

RV1106B 核心優(yōu)勢在于極致的低功耗設(shè)計,采用第二代AOV(Always-On Vision)技術(shù),在4MP@1FPS的待機偵測模式下,功耗低至28mW,達到行業(yè)領(lǐng)先水平,極大地延長了電池供電類設(shè)備的續(xù)航時間。
多樣化消費類視覺應(yīng)用落地,彰顯技術(shù)普惠價值
在消費類視覺展區(qū),瑞芯微芯片方案展現(xiàn)了強大的行業(yè)滲透力,涵蓋工業(yè)、智慧校園、智慧家居、智慧辦公等,從工業(yè)相機、寵物IPC、會議攝像頭,嬰兒看護到各類創(chuàng)新形態(tài)的智能IPC,內(nèi)置豐富的AI功能,如人形跟蹤、哭聲檢測、手勢識別等。多樣化的視覺終端成果印證了瑞芯微的技術(shù)正廣泛應(yīng)用于各行各業(yè),實現(xiàn)了AI視覺技術(shù)的普惠與賦能。


隨著邊緣計算、多模態(tài)融合與低功耗AI技術(shù)的快速發(fā)展,智能視覺正從“感知智能”向“認知智能”加速演進。瑞芯微展示的新一代AI機器視覺解決方案,不僅精準契合了行業(yè)技術(shù)融合、場景細化的發(fā)展趨勢,更通過端側(cè)大模型等創(chuàng)新應(yīng)用,為產(chǎn)業(yè)展現(xiàn)了“感知-分析-決策”一體化的發(fā)展路徑。
我們期待與合作伙伴共同推進智能視覺技術(shù)在千行百業(yè)中的深度融合與規(guī)?;涞兀孉I視覺真正成為數(shù)字經(jīng)濟時代的基礎(chǔ)感知能力。
上一篇:瑞芯微榮登“2025高工具身智能年度力量榜”,以全棧式AI芯實力引領(lǐng)產(chǎn)業(yè)升級 下一篇: 洞見AIoT 2.0時代密碼,瑞芯微端側(cè)AI大模型與具身智能方案亮相2025云棲大會

閩公網(wǎng)安備 35010202001061號