慧安小課堂 | 靈境-圖像管理與數(shù)據(jù)質(zhì)檢



靈境慧安蜂巢算法中臺是慧安蜂巢智能支撐產(chǎn)品之一,全面支持?jǐn)?shù)據(jù)集管理、算法開發(fā)、模型訓(xùn)練、在線部署等算法全生命周期工作。本期為大家介紹靈境的圖像管理功能和數(shù)據(jù)質(zhì)檢這兩個重要能力。
圖像管理
除了醫(yī)療圖像領(lǐng)域,數(shù)字成像通信(Digital Imaging and Communications in Medicine,DCM)標(biāo)準(zhǔn)在工業(yè)上也有應(yīng)用。非破壞性檢測(Non-Destructive Testing,NDT):DCM標(biāo)準(zhǔn)可以應(yīng)用于非破壞性檢測領(lǐng)域,如金屬檢測、焊接缺陷檢測、材料缺陷檢測等。工業(yè)上的數(shù)字成像設(shè)備可以生成圖像數(shù)據(jù),并使用DCM格式進行存儲和傳輸,以便進行后續(xù)的分析和處理。
為了滿足工業(yè)需求慧安蜂巢靈境人工智能算法中臺提供圖像管理能力,包括數(shù)據(jù)集上傳和標(biāo)注。
DCM焊縫圖像
數(shù)據(jù)質(zhì)檢
數(shù)據(jù)質(zhì)檢(Data Quality Assurance)是指對數(shù)據(jù)集質(zhì)量進行評估和驗證的過程,旨在確保數(shù)據(jù)的準(zhǔn)確性、完整性、一致性和可靠性。數(shù)據(jù)質(zhì)檢是數(shù)據(jù)管理和數(shù)據(jù)分析中非常重要的一環(huán),因為低質(zhì)量的數(shù)據(jù)會導(dǎo)致錯誤的決策和不可靠的分析結(jié)果。
在慧安靈境算法中臺的數(shù)據(jù)集管理中加入了數(shù)據(jù)質(zhì)檢的功能,利用統(tǒng)計分析和圖像處理算法對用戶上傳的數(shù)據(jù)集進行分析,生成數(shù)據(jù)質(zhì)檢報告,直觀地展示數(shù)據(jù)質(zhì)量情況。數(shù)據(jù)質(zhì)檢報告主要包括兩方面內(nèi)容。一方面是原始數(shù)據(jù)集本身的信息:數(shù)據(jù)集大小、圖片數(shù)量、圖片存儲大小分布、高寬比分布、分辨率分布、清晰度分布、色偏分布、色彩空間分布、相似度分布。另一方面是數(shù)據(jù)標(biāo)注相關(guān)信息(目標(biāo)檢測標(biāo)注為例):標(biāo)注框高寬比分布、標(biāo)準(zhǔn)框面積分布、堆疊度分布、標(biāo)簽分布、標(biāo)簽總數(shù)、總平均標(biāo)注數(shù)(標(biāo)注框總數(shù)/已標(biāo)注圖片數(shù))、已標(biāo)圖像占比(已標(biāo)圖片數(shù))。如下圖所示,以圖表的形式直觀展示數(shù)據(jù)集的質(zhì)量情況。
操作過程
數(shù)據(jù)質(zhì)檢報告
總結(jié)
數(shù)據(jù)質(zhì)檢和圖像管理功能旨在為用戶提供更完善的數(shù)據(jù)集管理工具和服務(wù)。我們將對用戶需求進行持續(xù)關(guān)注和的不斷追求技術(shù)創(chuàng)新。我們相信,通過提供數(shù)據(jù)質(zhì)檢和圖像管理功能,慧安蜂巢人工智能算法中臺將助力用戶和企業(yè)智能升級。
來源 | 研發(fā)中心
審核 | 市場部