医疗器械创新网

logo

多远科技创新自主创业选拔赛报考截止
48
16
37

会员登录

用户账户微信登陆 评审登录账号
一周内自动登录 建议在公共电脑上取消此选项
一周内自动登录 建议在公共电脑上取消此选项
一周内自动登录 建议在公共电脑上取消此选项
的手机效验码扫码登录 还未账号?立即注册

会员注册

已有账号?
医疗器械创新网
医疗器械创新网

器审中心发布人工智能辅助检测软件临床评价注审原则

日期时间:2023-11-08


  为进的一步实验室治理标准人工控制处理自动化捕助检则整形医院仪器(pc工具)类产品的治理,国度国家药品监督管理局局器审中心局进行设定了《人工控制处理自动化捕助检则整形医院仪器(pc工具)临床试验评估申请注册核查的指导方式》,现予上架。

  特此通知。

  附属品:人造智力辅助电脑软件检查测量医辽器戒(电脑软件)临床研究评议登陆预审具体指导底线

国度医疗耗材监督安全管理安全管理局官方网站

医疗机构器材技能审评中央

2025年112月7日

附件

人工控制智力帮助论文检测医疗卫生用具(系统)药学判断

祖册预审教育指导基本准则

本指导原则旨在指导注册申请人开展人员自动化(artificial intelligence,AI)辅助检测类医疗器械临床评价的资料准备,同时为技术审评部门审评人工智能辅助检测类产品临床评价资料提供参考。

本指导原则进一步明确人工智能辅助检测类医疗器械临床评价的要求和适用情形。申请人可依据产品的具体特征确定其中内容是否适用,若不适用,需阐述理由并提供相应的科学依据,并依据产品的具体特征对临床评价资料的内容进行充实和细化。

本指导原则是供注册申请人和技术审评人员使用的指导性文件,但不包括审评审批所涉及的行政事项,亦不作为法规强制执行,应在遵循相关法规的前提下使用本指导原则。如果有能够满足相关法规要求的其他方法,也可以采用,但是需要提供详细的合理性论述和验证确认资料。

本指导原则是在现行法规和标准体系以及当前认知水平下制定,随着法规和标准的不断完善,以及科学技术的不断发展,相关内容也将适时进行调整。

一、常用空间

人工智能医疗器械从与预期用途角度可分为辅助决策类和非辅助决策类。其中,辅助决策是指通过提供诊疗活动建议辅助医务人员进行临床决策,如通过异常识别、自动制定手术计划进行辅助分诊、辅助检测、辅助诊断、辅助治疗等。

人造智慧辅助器检测工具好产品,指是依托于测算机人造智慧算法为基础,可包含了传统模式甄别和数据源分析一下等能力,利用甄别、图标、严重等原则提示信息医士关注公众号将会的出现异常/疾病领域,以此辅佐监床医士弄出相关联临床投资决策的成品,其有自立手机app或融入式手机app;的分类商品编号为21-04-02,管理制度类属为第III类;好产品还可一同包含了非协助投资决策模块,如格局化报表导出、先后图相差距、没问题分析组织机构的合拼(如肺叶、肋骨等)、长宽检测方法、CT值检测方法等临床实验实践能力和的数据存储、传送数据等非临床实验实践能力。工人自动化铺助检验软件长见的有真对肺结节、乳房增生结节、扭伤、血栓短浅、乙状结肠息肉等相关问题/异常的检出产品,本具体指导原则英文给出此类产品的通用要求,并以肺结节辅助检测和结肠息肉辅助检测产品为例(详见附件),阐述对人工智能辅助检测产品的临床试验中具体要素的考虑建议,同类型产品可参考相关适用部分。

本指导原则不适用于如下情形(但下述产品可参照本指导原则中适用部分的要求):1.可鉴别病变的性质(如良恶性)或疾病分期分型的人工智能辅助诊断类产品;2.预测疾病发生概率的产品;3.可同时辅助检测、鉴别诊断多种病变的多分类人工智能辅助检测产品(例如同时辅助检测并分类肺结节、条索、胸膜增厚、胸腔积液、肋骨骨折等的产品);4.人工智能辅助分诊、转诊产品,此类产品通过初步评估患者是否疑似患有目标疾病,从而对患者的分诊转诊提供辅助决策建议,该类产品不给出具体病变情况,且无论辅助分诊结果为阴性、阳性,均需专业医师再一次对患者影像进行评阅,常见的有糖尿病视网膜病变辅助分诊、肺炎辅助分诊、脑出血辅助分诊等;5. 配合体外诊断试剂产品使用的人工智能辅助分析软件。

二、临床试验设计

(一)临床试验目的

临床试验目的一般是评价申报产品在预期适用范围下使用时辅助检测的诊断学性能,亦可一并观察产品的可用性与安全性。

(二)临床医学试验台根本设计内型

人工工资智慧辅助性探测类新成品的诊所上积极意义平常重在大幅提升专家的坏死探测确切度,为有效考核新成品的诊所上利益概率可配受性,相应新成品普遍需遵循实施對照做实验的时候,按照其新成品的特征及诊所上诊所实践,能否为自由平行对照、穿插自身业务较或多阅片者大部分据模本(multiple reader multiple case,MRMC)试验设计。

实验设计组基本上为医士在app软件的帮助下完全异常处理/病变的检测,对照组一般为临床药学主治医师独特的发现异常/病变的检测,比较二者的检测准确度。

(三)研究对象

1.适用人群的影像学样本

预期人群的影像学样本是人工智能辅助检测产品临床试验的典型研究对象,影像学样本需基于定义明确的入选和排除标准收集,可为临床已有数据(如临床诊疗中产生的真实世界数据)。选择到AI与医师观察、操作的协同交互等因素,基于实时影像的辅助检测产品临床试验,推荐考虑前瞻性采集影像检查,作为临床试验研究对象。

为了保证临床试验质量以及结果的可靠性,选取研究对象时,申请人需考虑如下措施:一是纳入数据样本独立于申报产品或前代产品开发所用数据集,如申报产品或前代产品的训练集、测试集。二是采用临床已有数据进行研究时,需基于明确且严格的入排标准和临床试验计划,连续收集过往某段时间内、特定医疗机构内患者影像学数据,避免主观挑选病例。三是考虑阳性样本中,目标疾病的疾病谱分布(如分型、分期)合理性,某些对辅助检测具有挑战性的分期、分型,必要时在临床试验中富集相关具有代表性的亚组。四是通常情况下,需避免在一项临床试验中同时入组同一患者同一目标部位的多组样本数据。五是临床已有数据收集时,需尽可能全面的收集与疾病相关的信息(适用的),具体包括但不限于:

(1)人口数据统计学学新信息(如年龄、性别);

(2)与辅助软件检侧要求发病有关的的个人信息,如病例报告、发病的状态、贷款分期、分几型、炎症各个、炎症选址、五官共同点(如乳腺腺体分型)、伴随疾病等。

(3)选择为弱阳/阴性病例的依据,如既往诊断结论,以及确定疾病状态、部位和程度的方法。

2.阅片者

由阅片者表演的基因遗传变异度还有与用户模板基因遗传变异度和检测工艺(即AI辅助器械)之间的交互效应,一般情况下宜将阅片者列入研究对象。基于非实时影像的辅助检测产品(如肺结节/骨折/乳腺结节辅助检测等),采用MRMC设计可比较的调控阅片者偏倚,等级现状下的需求的样本量量通常情况较少,报名人可首选充分考虑用。用MRMC设计时,根据预期的使用者情况,选取不同年资的多位医师作为阅片者,申请人需论述阅片者数量的合理性。

(四)评价指标

主要评价指标应结合产品设计特征进行综合选择,一般认为灵敏度、特异度、ROC或其衍生曲线等诊断准确性指标受样本患病率差异的影响较小,因此,宜优先考虑此类指标作为主要评价指标。

大多数选用哪类指数充当核心评议指数,纯虚函数食品监床实验时应考虑一下整体化的优效性来设计,列举ROC或其衍生曲线下面积(Area Under Curve,AUC)的优效设计,或者目标疾病辅助检测特异度非劣效前提下的灵敏度优效性,或者息肉/腺瘤初检检出率的优效性等。

(五)临床参考标准构建

申请人应详述临床参考标准的选择、构建方法及理由。可供选择的临床参考标准构建方法包括:一是以临床已确认结果为临床参考标准,即临床上结合患者影像学检查、病史、实验室检查(如病理检查)、长期随访结果等方法综合判定的临床诊断结果;二是通过专家组对研究对象(影像样本)的阅片判定作为临床参考标准。

对于人工智能辅助检测产品,若根据产品设计判定可采用专家组意见作为临床参考标准,通常可选择高年资医师组成的阅片专家组综合意见为临床参考标准,阅片专业组的会员需单独于“试验和对照组的阅片研究者”,并需要明确:1.专家数量;2.专家经验及专业水平;3.决策机制(如遵循多数意见、背靠背第三人仲裁等);4.专家决策时所依据的信息(如图像上是否有标记,是否还提供了病史或其他检查结果等);5.判定所依据的临床准则(如临床指南、诊疗规范、专家共识等)。

对于试验中对病灶的检出是否与临床参考标准专家组意见一致,一般可考虑1.试验组/对照组勾画病灶的中心在专家组勾画的病灶轮廓边界范围内;2.试验组/对照组勾画病灶与专家组勾画病灶的像素重合度高于一定比例(需提供比例设定的支持依据);若采用其他判定方法,则需论述合理性。

若采用临床已确认结果作为临床参考标准,则需明确1.已确认结果所依据的临床信息,包括检查类型及结果;2.各类影像学检查的设备信息,包括影像检查的扫描条件等;3. 已确认结果的临床诊断依据;4.得出已确认结果的医师情况,包括专家会诊,需明确医师资质;5.若还依据了临床随访数据,则还需明确随访的时间以及随访所做的检查类型及结果。

(六)样本量估算与统计分析

样本量估算需综合考虑临床试验设计、主要评价指标和统计学要求。申请人需明确计算公式、相应参数及确定理由,以及所用的统计软件。

临床试验资料中可以提供样本患病率以及目标疾病的流行病学研究的患病率情况进行合理性论述,并确保临床研究设计中样本数据随机分配给阅片者进行评阅。

平行对照试验样本量计算可参考《医疗器械临床试验设计指导原则》中的相关内容。

若用于MRMC的试验设计,样本量计算需首先明确具体的分析方法,如Obuchowski-Rockette Analysis(OR分析方法)、Dorfman-Berbaum-Metz-Hillis Analysis(DBMH分析法),并进一步明确受试医师数量,检验水准α、检验效能1-β、预计效应值,优效/非劣效界值,在其中估计相互作用值可可以通过预冲击试验或调研报告并归纳了解总体目标病灶验出的检测学论述参考文献得到,优效/非劣效界值应通过同品种产品临床试验结果或权威文献研究等确定。不同疾病的检测效应不同,在试验设计中应明确优效/非劣效界值的设定依据。以DBMH分析法为例,样本量估算与交互随机效应值,检验的检验效能、检验水准,受试医师数量,优效界值,非劣效界值(知悉)等基本原则相关联。适用于样本量量计算的因素值(effect size)选择时,可通过预试验得到的误差和混合效应方差来估计,并考虑预试验样本量等情况,在预试验结果的基础上采用适度保守的估计。

拥有应该用了疲劳试验护肤品的受试中医师和患病者都将被列为浅析,对待具体依据,除拿到具体口碑依据(快速度、特异度、AUC)的点估计外,还将分别对其对应的95%置信区间进行估计,通过试验组与对照组的优效/非劣效比较判断本试验产品是否满足临床应用的需要。

(七)其他临床试验设计需关注的问题

1.临床试验培训

在试验前对阅片者开展必要的培训,可以有效降低试验的偏倚。除基本情况培训(试验流程、术语定义、数据样本阅片的评价标准等)以外,还需考虑案例培训和典型数据样本讲解等,且所用案例独立于试验研究数据样本;培训中宜设置阅片者培训结果测试及合格接受标准;建议临床试验中,对阅片者的培训与临床应用时的培训,在方法、时间、接受标准上尽量保持一致性;并考虑对临床试验阅片者资质、能力等要求与临床应用时使用者情况的匹配性。对专家组的培训时间和接受标准宜显著高于试验组/对照组的阅片者的培训时间和接受标准。

2.影像样本评阅质量控制

一是由阅片者在独立盲法条件下对患者关于试验的影像检测结果进行解释。二是在选取试验阅片者时基于其专业能力和参与研究的可能性,充分保证阅片者对预期使用者的代表性。可考虑不同医疗培训机构来历、其他年资/专业水平的医师。三是将数据样本的临床诊断结果、临床参考标准判定结果、其他诊断信息(如生化检测结果、后续治疗等)或基本信息(如年龄、病史等)对试验的阅片者设盲。四是比对现场实验可采取分为交叉式式阅片开发,交叉式式开发中可可根据有关各个领域记忆英文拟合曲线的分析安装科学的过柱期。若分为多阅片者,是最好的每个人阅片者,并按照的不同的统计资料样版顺寻做出评阅,有期刊论文报道怎么写典范的过柱期一般来说为4~6周。是否采用交叉设计可根据申报产品的临床应用方法、场景及适用范围等综合判定。

三、车辆中非氧化硅战略临床实践功用的好评

人工处理智力辅佐测试医疗管理运动器械物料还也许主要包括结构设计化评估报告转为、上下画像相比较、合适生理学组织开展的切割(如肺叶、肋骨等)、程序流程简化、尽寸量测(属于的大小、体积大小等)、CT值测量方法等非辅助PC软件行政决策类PC软件职能,可在临床护理试验装置中放置每项如何品价指标值中用如何品价这部分职能的卫生很好的性,还可通过《医学健身器械医学评定技术设备的指导要求》撤回相对医学评定数据表格。若撤回医学评定,出现特点表的安全验证核验还可以综合了解測試集測試、压为測試、对战測試、高质量稳定的数据表格库測試结论中的一些或这些成为医学评定的适用证据的合法性;若在医学试验报告中安装其次是技术评论指标,技术评论指标一样 主要包括医学上对特点表最准性评定的医学符合要求或科研上较为常用的方式方法,如拆分的最准性综合了解,与主任医师的拆分结论的拆分保持关联性Dice相似系数(Dice similarity coefficient)等;配准系统可遵循因素点配准出现偏差的原因(Fiducial Registration Error)、工作目标配准出现偏差的原因(target registration error)、标志点定位误差(Fiducial Localization Error)等。

四、与临床评价相关的说明书内容

表明书中普遍需配合监床或非监床的资料拿到中所适于的图片信息:1)临床试验总结;2)适用范围;3)数据采集设备和数据采集过程相关要求等。临床试验汇报一般是思考临床药理数据库大致数据信息、评分指标英文与数据(不必要时含亚组数据)。人工客服智能化帮助测量类服务的采用范围之内需明确的帮助测量适合症(如肺结节、粉碎性骨折),所根据的影像系统内型(如胸前CT或结肠镜检查影像),产品其他主要功能(如影像的显示、处理、测量和分析),以及产品临床定位(不能单独用作临床诊疗决策依据)等。

建议申请人根据产品实际情况在说明书中体现如下方面的警告注意事项。1)软件仅辅助医师进行病灶检测,存在假阴/阳性可能,应由专业医师结合患者的病史、症状、体征、其他检查结果情况综合给出最终的病灶检出结论,核实是否需要进一步诊疗的决策,并对临床诊断结果负责。2) 成品合理性YYYY年版指导书(假如《胸口CT肺结节数据标注与质量控制专家共识(2018)》)设计,如诊疗指南有所更新,使用者应充分评估指南差异可能带来的风险。3)明确产品临床试验中未对病灶边界分割的准确性进行评价,如依据软件的检测结果决定手术干预或穿刺活检,医师应当充分评估其风险。

五、分类医学文献

[1]中华医学会呼吸病学分会肺癌学组, 中国肺癌防治联盟专家组,肺结节诊治中国专家共识(2018版)[J]. 中华结核和呼吸杂志, 2018,41(10): 763-771.

[2]原国内美食非处方药监察服务管理质监总局.医疗器械临床试验设计指导原则:食品药品监管总局通告2018年第6号[Z].

[3]地区消毒产品进行监督菅理局治疗设备水平审评重点.深度学习辅助决策医疗器械软件审评要点:发达国家肉食品医药监察标准化监管局医辽用具工艺审评公司通知2019年第7号[Z].

[4]Guidance for Industry and Food and Drug Administration Staff Computer-Assisted Detection Devices Applied to Radiology Images and Radiology Device Data - Premarket Notification [510(k)] Submissions(FDA,2012.07.03)

[5]Lung Cancer Screening CT ProtocolsVersion5.1(AAPM,2019.9.13)

[6]FDA. Clinical Performance Assessment: Considerations for Computer-Assisted Detection Devices Applied to Radiology Images and Radiology Device Data - Premarket Approval (PMA) and Premarket Notification [510(k)] Submissions - Guidance for Industry and FDA Staff,(2012.11)[2021-4-15]. //www.fda.gov/regulatory-information/search-fda-guidance-documents/clinical-performance-assessment-considerations-computer-assisted-detection-devices-applied-radiology

[6]Sica, G.T., 2006. Bias in research studies. Radiology, 238(3), pp.780-789.

[7]Xiao-Hua Zhou, Nacy A. Obuchowski, Donna K. McClish. Statistical Methods in Diagnostic Medicine [M]. Hoboken: JohnWiley&Sons, 2011.

[8]国家卫生健康委员会. 人工智能辅助诊断技术临床应用质量控制指标(2017年版):国家卫生计生委通知2017第7号[Z].

[9]Brandon D. Gallas.et al. Evaluating Imaging and Computer-aided Detection and Diagnosis Devices at the FDA [J]. Acad Radiol. 2012 Apr; 19(4): 463–477. //www.ncbi.nlm.nih.gov/pmc/articles/PMC5557046/

[10]萧毅, 刘士远. 肺结节影像人工智能技术现状与思考[J]. 肿瘤影像学, 2018, 27: 249-252.

[11]Rees, Colin J., et al. “UK key performance indicators and quality assurance standards for colonoscopy.” Gut 65.12 (2016): 1923-1929.

[12]Misawa, Masashi, et al. "Development of a computer-aided detection system for colonoscopy and a publicly accessible large colonoscopy video database (with video)." Gastrointestinal endoscopy 93.4 (2021): 960-967.

[13]国家消化系统疾病临床医学研究中心(上海), 中华医学会消化内镜学分会,中华医学会健康管理学分会等. 中国早期结直肠癌筛查流程专家共识意见(2019)[J]. 中华医学会杂志,2019,99(38):2961-2970.

[14]Rompianesi, Gianluca, et al. "Artificial intelligence in the diagnosis and management of colorectal cancer liver metastases." World Journal of Gastroenterology 28.1 (2022): 108.

 [15]国家地区进口药品监控功能管理工作局.医疗器械临床评价技术指导原则:国家药品监督管理局通告2021年第73号[Z].

附件1  

肺结节CT图像辅助检测产品

临床评价考虑要素举例

一、试验设计基本类型

肺结节CT影像辅助检测产品采用MRMC设计、交叉自身对照设计或平行对照设计。平行对照设计的具体过程及方法参考《医疗器械临床试验设计指导原则》相关内容。

若进行MRMC的设计,试验过程具体为,将参与试验的临床医师随机划分为A、B两组。A组:医师第一阶段在使用AI辅助的条件下完成所有数据样本CT影像的肺结节检测;经一定的洗脱期后,第二阶段在不使用AI辅助的条件下完成所有数据样本CT影像的肺结节检测。B组:医师第一阶段在不使用AI辅助的条件下完成所有数据样本CT影像的肺结节检测;经一定的洗脱期后,第二阶段在使用AI辅助的条件下完成所有数据样本CT影像的肺结节检测。该试验中医师使用AI辅助的作为试验组,不使用AI辅助的作为对照组,对比试验组与对照组肺结节检测的诊断准确度指标,阅片过程中每名医师需分别在使用AI和不使用AI的条件下都完成所有入组影像数据样本的阅片。

 

二、评价指标

此类产品临床试验通常选择检出的灵敏度(以病灶为单位)和特异度(以患者为单位)等组成的黏结统计指标,以成再此框架上使用受试者事业显著特点(receiver operating Characteristic, ROC)曲线或其衍生曲线组成复合指标,如因变量自由的受试者工作特征(free-response receiver operating Characteristic, FROC)曲线、定位受试者工作特征(location-specific receiver operating characteristic, LROC)曲线等。使用ROC曲线或其衍生曲线时,可考虑在试验组专业执业医师阅片时期,由阅片专业执业医师标记符号对个人目标重大疾病辨认的检则作用(可要考虑到百高考分数得分),得以建立ROC曲线,并需考虑在培训阶段明确医师百分数评分的标准和方法。

次责指数公式可收录AI氧化硅职业医师检测总体目标慢性病的抗体阳性推测值/阴推测值,似然比,Kappa系数,app单独排除学习目标值传染性传染性疾病的灵巧度(以病灶为企业),app单独排除学习目标值传染性传染性疾病的灵巧度和特异度(以自身为企业),阅片时间,麻醉医生检验耐心评介,app技能性易用性和平衡性(可主要采用直观感触评介,如李克特评定量表等)。若与此同时观看批量分析一下等非辅助软件管理临床治疗技能性的耐腐蚀性表达,同时可以设有合适主次评介指标值。

三、样版量估计及统计定性分析学定性分析

以MRMC设计为例,说明样本量估算考虑要素,若主要评价指标为AUC、结节水平灵敏度、患者水平特异度。试验中,检验的检验效能取80%。对于主要评价指标,优效性与非劣效统计分析将在单侧0.025的检验水准下进行。下述内容仅为示意举例,可根据产品具体情况合理调整相关参数:

1.基于AUC的样本量计算,预试验或文献资料确认效应值取0.05,研究医生场景人物风格的设定在为12名,AUC优效界值取0,则总样本量不得低于87例,阴性、阳性患者比为1:1。

2.基于结节水平灵敏度,效应值取0.069,研究专业医师设制为12名,优效界值取0,需阳性样本至少116个结节,假定平均每个阳性患者存在2个结节,则至少需要58例阳性数据样本。

3.基于患者水平的特异度,效应值取-0.055,非劣效值取0.1(参考Riverain ClearRead CT 的特异度95%区间下限),在当受试医师为12名时,非劣效验证(非劣效界值取0.1)需要阴性样本达到至少157例。

综合评估以内各目标样例量推算值,本检测样例量平均为215例,阳性数据样本58例,阴性数据样本157例。考虑到样本存在剔除和脱落的可能,当预期脱落率为5%,剔除率为5%时,阳性样本需要达到至少62例,阴性样本需要达到至少166例,共计228例。

有附件2

结肠息肉电子内窥镜图像辅助检测产品

临床评价考虑要素举例

一、试验设计基本类型

结肠息肉电子内窥镜图像辅助检测产品可考虑平行对照设计,此处以序贯的平行对照为例进行说明,申请人亦可采用其他科学的平行对照设计开展研究,序贯的直线對照基本的设计及校正环节如下:

入组的受试者随意安排到A组和B组,A组:平时结直胃镜檢查领先行组:先受到无 AI 辅助的常规结直肠镜检查,对检查过程中发现的所有息肉都冻结影像留存图片。第一次退镜后在AI 辅助下再做一次结直肠镜检查,对检查过程中发现的所有息肉都冻结影像留存图片。B 组:AI 辅助检查先进行组:先接受 AI 辅助的结直肠镜检查,对检查过程中发现的所有息肉都冻结影像留存图片。第一次退镜后再进行一次常规结直肠镜检查,对检查过程中发现的所有息肉都冻结影像留存图片。分别以各组两次检出的肠息肉作为基准,比较第一次检查时,有AI辅助检测和无AI辅助检测的病变检出能力。原则上,结肠息肉人工智能辅助检测产品临床试验需将前瞻性肠镜检查样本作为临床试验研究对象。

 

二、评价指标

这些类产品临床上实践试验检测因不高品质临床上实践参阅规范等问题,可综合考虑选出息肉/腺瘤的初检检出率/漏诊率或息肉检出的灵敏度与特情人等成为基本测评评价质量指标。关联评价质量指标需以息肉/腺瘤水平而非受试者水平进行计算,例如初检息肉检出率=初检发现的息肉数量÷两次检测到的息肉总数,腺瘤漏诊率=第二次检测到的腺瘤数÷两次检测到的腺瘤总数。

主次评判公式可要考虑息肉/腺瘤检出率(受试者水平),平均息肉/腺瘤检出数,软件独立评估性能(即软件独立的息肉/腺瘤检出率、息肉检测准确性等):结直肠镜操作时间(包括各次进镜时间、退镜时间)、软件易用性评价、稳定性评价、不良事件情况等。若同时观察图像传输、储存等非辅助决策临床功能的性能表现,亦可设立相应次要评价指标。

三、样本量估算

1.以序贯的平行面比较可靠性试验举例,若选用腺瘤漏诊率当做测评指标值,模本量的算对于腺瘤漏检率的最主要的成果(一个病灶),假定详细:AI 好行变比的腺瘤漏诊率有 10%,标淮检验好行变比的腺瘤漏诊率有 30%,优效界值选用为0,在 80%总计药用价值的状况下, 对侧α值设为 0.05。包括评述技术指标为初检息肉检测出率,其样本量量记算公式换算为:

 

猜测每一位病患的月均腺瘤数为 0.6,考虑10%的脱落率,需入组220名受试者,AI 先进行组110名,标准检查先进行组110名。

2.若进行初检息肉检测率做主要品价公式,A 组: 常规性结直胃镜查检高级行组; 组: AI 辅助软件检修现进行组。PC、 PT 分离为 组和 组预期的初检息肉检测率,进来 PC=70%、 PT=80%|D|为几组实际率差的可以说 值, |D| = |PC - PT|; Δ 为优效性界值,取 0。通常考核的指标为初检息肉检测出率,其样品量估量公式计算为:

 

有效市场理论每个人求美者的平均值息肉数为 2.5, 需约 234 例,破裂比率 20%,终结样例量为 296 例, A组和 组各 148 例。

医疗器械创新网网: 返回列表
医疗器械创新网网 医疗器械创新网网 医疗器械创新网网 医疗器械创新网网 医疗器械创新网网