不久前,由中華醫(yī)學(xué)會(huì)細(xì)胞學(xué)組、北京大學(xué)工學(xué)院、廣州安必平醫(yī)藥科技有限公司共同編寫的《宮頸液基細(xì)胞學(xué)人工智能輔助診斷數(shù)據(jù)集標(biāo)注規(guī)范與質(zhì)量控制專家共識(shí)(2022版)》(以下簡(jiǎn)稱“《共識(shí)》”)于《中華病理學(xué)雜志》正式發(fā)布后,引起行業(yè)高度重視與關(guān)注。

圖:來自中華病理學(xué)雜志官網(wǎng)

據(jù)調(diào)研獲知,截止目前,《共識(shí)》是宮頸液基細(xì)胞學(xué)人工智能輔助診斷數(shù)據(jù)集較為權(quán)威的指南共識(shí),也是唯一含有一線開發(fā)經(jīng)驗(yàn)和質(zhì)量控制的共識(shí);

是由醫(yī)院、學(xué)院、企業(yè)三方對(duì)病理行業(yè)熱點(diǎn)問題的重點(diǎn)思考,既充分認(rèn)可人工智能技術(shù)在病理診斷領(lǐng)域發(fā)展的趨勢(shì),也對(duì)宮頸癌人工智能輔助篩查產(chǎn)品缺乏數(shù)據(jù)標(biāo)準(zhǔn)化的現(xiàn)狀作出方向引導(dǎo);

參編企業(yè)安必平自成立起多年深耕液基細(xì)胞病理,也是國內(nèi)病理診斷領(lǐng)域首家上市公司,擁有完整的宮頸癌篩查整體解決方案,最近旗下宮頸液基細(xì)胞學(xué)圖像輔助診斷軟件(LBP-PIAS)獲得美國ASCCP科技創(chuàng)新獎(jiǎng),啟動(dòng)了多中心臨床試驗(yàn)學(xué)者研討會(huì),正邁入III類產(chǎn)品注冊(cè)證申報(bào)工作。

因此,編輯邀請(qǐng)了參編團(tuán)隊(duì)之一——安必平細(xì)胞學(xué)學(xué)科帶頭人彭振武老師進(jìn)行專業(yè)解讀:

一、從建議標(biāo)準(zhǔn)數(shù)據(jù)集的意義與價(jià)值

文中提到“解決當(dāng)前宮頸癌人工智能輔助篩查產(chǎn)品缺乏標(biāo)準(zhǔn)化標(biāo)注數(shù)據(jù)集且難以開展規(guī)范化質(zhì)量可控的算法訓(xùn)練和評(píng)估問題”。

是指宮頸細(xì)胞學(xué)人工智能產(chǎn)品,在研發(fā)階段缺少標(biāo)準(zhǔn)數(shù)據(jù)集,就容易造成數(shù)據(jù)缺少代表性,無效重復(fù)導(dǎo)致數(shù)據(jù)浪費(fèi)。

眾多產(chǎn)品研發(fā)出來在市場(chǎng)上激烈競(jìng)爭(zhēng),廠家各自引用自家實(shí)驗(yàn)室的數(shù)據(jù)測(cè)試結(jié)果展示產(chǎn)品性能,一項(xiàng)項(xiàng)漂亮數(shù)據(jù)帶來的反而是病理診斷從業(yè)人員的困惑與質(zhì)疑。

建立標(biāo)準(zhǔn)數(shù)據(jù)集,企業(yè)可以更好的去定義產(chǎn)品進(jìn)行算法訓(xùn)練,醫(yī)生可以更好的選擇產(chǎn)品用于輔助診斷,行業(yè)協(xié)會(huì)可以更好的組織質(zhì)量評(píng)估進(jìn)行質(zhì)控。

二、標(biāo)準(zhǔn)數(shù)據(jù)集選用液基制片技術(shù)

專家共識(shí)強(qiáng)調(diào)這點(diǎn),是因?yàn)橐夯?xì)胞學(xué)與傳統(tǒng)涂片對(duì)比:通過保存液保存樣本,細(xì)胞及時(shí)固定,形態(tài)更加完好;液基制片通過前期處理,去除樣本中的雜質(zhì)成分,制片背景干凈清晰;液基制片細(xì)胞薄層均勻平鋪,利于醫(yī)生提高診斷效率及診斷準(zhǔn)確率。

目前,各級(jí)醫(yī)院都已經(jīng)開展宮頸液基細(xì)胞學(xué),但是兩癌篩查以及第三方檢驗(yàn)還有著大量的傳統(tǒng)涂片,而這恰恰是人工智能最有價(jià)值的應(yīng)用領(lǐng)域。

專家共識(shí)強(qiáng)調(diào)數(shù)據(jù)集來源于液基制片,就是希望在各方努力下,液基細(xì)胞學(xué)能真正廣泛應(yīng)用到大規(guī)模體檢及兩癌篩查中去,使得科學(xué)技術(shù)為人民健康賦能。

三、標(biāo)準(zhǔn)數(shù)據(jù)集細(xì)胞病理圖像的要求

只有質(zhì)量合格的數(shù)據(jù)才能入組數(shù)據(jù)集,這就說明人工智能得以實(shí)現(xiàn)的前提條件一定是數(shù)據(jù)來源的規(guī)范化與標(biāo)準(zhǔn)化。

任何圖像數(shù)據(jù)理論上都可以用于算法分析,而大量不符合標(biāo)準(zhǔn)的低質(zhì)量數(shù)據(jù),即是對(duì)算法資源的浪費(fèi),也無法訓(xùn)練出性能良好的AI模型。

液基制片效果不好,圖像數(shù)據(jù)就不好,醫(yī)生鏡下閱片還可以容忍,靈活的出報(bào)告,而算法是不會(huì)容忍這種情況的,最終導(dǎo)致的結(jié)果就是假陽性判斷,篩陰率顯著下降。

企業(yè)在開發(fā)人工智能產(chǎn)品過程中,如果一味追求產(chǎn)品適用的廣度,就會(huì)入組更多不符合專家共識(shí)中要求的圖像數(shù)據(jù)來進(jìn)行算法訓(xùn)練,這就好比飲鴆止渴,不去面對(duì)問題的本質(zhì)情況,只求解決目前困難。

宮頸細(xì)胞學(xué)人工智能這個(gè)行業(yè)的發(fā)展,需要從數(shù)據(jù)的源頭加以規(guī)范,杜絕那些通過訓(xùn)練一些不合規(guī)的數(shù)據(jù)短時(shí)間擴(kuò)大產(chǎn)品的適應(yīng)范圍,那將步入一種惡性循環(huán)。

四、數(shù)據(jù)來源多樣性設(shè)定要求

很多企業(yè)的人工智能產(chǎn)品都是在很短時(shí)間內(nèi)研發(fā)出來,必然存在一種情況就是數(shù)據(jù)來源的多樣性不符合要求。

人工智能產(chǎn)品在真實(shí)世界的應(yīng)用,這是一定會(huì)遇到的問題,在更為嚴(yán)格的三類證臨床試驗(yàn)設(shè)計(jì)中,也強(qiáng)調(diào)了數(shù)據(jù)樣本的多樣性,對(duì)于試驗(yàn)樣本例數(shù)要求較少。

專家共識(shí)強(qiáng)調(diào)了數(shù)據(jù)來源以及數(shù)據(jù)類型,其目的正如文中所言“不同病變類型的分布比例應(yīng)足夠用于評(píng)價(jià)和推論人工智能算法的安全性和有效性,滿足統(tǒng)計(jì)學(xué)以及相關(guān)法規(guī)要求?!?/p>

五、數(shù)據(jù)集標(biāo)注規(guī)范要求

頸細(xì)胞學(xué)人工智能的實(shí)現(xiàn),與由數(shù)字切片掃描儀,算法分析模塊及標(biāo)注準(zhǔn)確的數(shù)據(jù)密切相關(guān),尤其是標(biāo)注規(guī)范且準(zhǔn)確的數(shù)據(jù)。

專家共識(shí)從標(biāo)注醫(yī)生,標(biāo)注內(nèi)容與流程,標(biāo)注一致性,標(biāo)注方式與規(guī)則,標(biāo)注分類這五個(gè)方面給出了建議。

嚴(yán)格的標(biāo)注流程設(shè)計(jì)與標(biāo)注一致性的評(píng)定,是為了保證標(biāo)注數(shù)據(jù)的準(zhǔn)確性。

標(biāo)注分類是給人工智能產(chǎn)品形態(tài)的設(shè)定提出參考意見,基于全片的分析采用陰性與陽性的分類,與國家食品藥品監(jiān)督管理局規(guī)定的產(chǎn)品適用范圍是一致的,核心思想就是人工智能產(chǎn)品不能直接出陰性報(bào)告,也不能直接進(jìn)行形態(tài)學(xué)的判讀。

陰性與陽性的分類就是一個(gè)風(fēng)險(xiǎn)評(píng)估,所有人工智能結(jié)果的片子都需要細(xì)胞病理醫(yī)生進(jìn)行復(fù)核,通過對(duì)更符合醫(yī)生閱片習(xí)慣的系統(tǒng)操作界面的開發(fā)設(shè)計(jì),也帶來更大的閱片效率與診斷準(zhǔn)確性的提升。

總結(jié):宮頸液基細(xì)胞學(xué)人工智能輔助診斷數(shù)據(jù)集標(biāo)注規(guī)范質(zhì)量控制專家共識(shí)(2022版)具有極大啟示和指導(dǎo)意義,作為企業(yè)或者廠家,從研發(fā)階段就應(yīng)強(qiáng)調(diào)標(biāo)準(zhǔn)規(guī)范的數(shù)據(jù),這是人工智能產(chǎn)品應(yīng)用的前提條件,不盲目擴(kuò)大人工智能產(chǎn)品的價(jià)值,要滿足數(shù)據(jù)質(zhì)量,要滿足數(shù)據(jù)多樣性,要滿足標(biāo)注規(guī)范保證數(shù)據(jù)的精準(zhǔn),并把通過這些數(shù)據(jù)訓(xùn)練出來的人工智能產(chǎn)品定義在輔助醫(yī)生閱片這個(gè)角色。

未來,隨著宮頸細(xì)胞學(xué)人工智能產(chǎn)品的廣泛應(yīng)用,隨著數(shù)據(jù)得到更好的挖掘,可能會(huì)有不同的規(guī)范標(biāo)準(zhǔn)來適應(yīng)時(shí)代的進(jìn)步。同時(shí)現(xiàn)在也是未來,我們應(yīng)該充分利用這篇專家共識(shí)的指導(dǎo)思想,做好目前的工作,一步一個(gè)腳印的發(fā)展前進(jìn)!

彭振武 病理醫(yī)生,培訓(xùn)講師

廣東省病理診斷工程技術(shù)研究中心細(xì)胞病理室主任

廣州安必平醫(yī)學(xué)檢驗(yàn)所細(xì)胞室主任

廣州安必平公司液基細(xì)胞學(xué)產(chǎn)品事業(yè)部總監(jiān)

廣東醫(yī)科大學(xué)外聘講師

安徽省,江西省,云南省病理質(zhì)控中心宮頸細(xì)胞學(xué)特聘講師

廣西臨床病理質(zhì)量控制中心細(xì)胞病理學(xué)質(zhì)控組特聘專家

從事細(xì)胞學(xué)專業(yè)培訓(xùn)十余年,到過600多家醫(yī)院進(jìn)行講學(xué),舉辦省級(jí)培訓(xùn)80余場(chǎng),網(wǎng)絡(luò)講座400多次,參與CSCCP培訓(xùn)20余次;

2017年,成立“彭振武工作室”,分享個(gè)人細(xì)胞學(xué)閱片經(jīng)驗(yàn),粉絲超8000余人;

2018年,出版?zhèn)€人著作《實(shí)用宮頸液基細(xì)胞學(xué)病理診斷》;

2018年,開辦“愛病理宮頸細(xì)胞學(xué)網(wǎng)絡(luò)學(xué)院”,每年培養(yǎng)細(xì)胞病理醫(yī)生300余人;

2020年,開辦“愛病理非婦科細(xì)胞學(xué)網(wǎng)絡(luò)學(xué)院”,每年培養(yǎng)非婦科細(xì)胞學(xué)閱片醫(yī)生200余人;

2022年,參與編寫《宮頸液基細(xì)胞學(xué)人工智能輔助診斷數(shù)據(jù)集標(biāo)注規(guī)范與質(zhì)量控制專家共識(shí)》;