wordpress .ht,seo网站优化教程,官方网站数据如何做脚注,免费申请微信Text2MDT #xff1a;从医学指南中#xff0c;构建医学决策树 提出背景Text2MDT 逻辑Text2MDT 实现框架管道化框架端到端框架 效果 提出背景
论文#xff1a;https://arxiv.org/pdf/2401.02034.pdf
代码#xff1a;https://github.com/michael-wzhu/text2dt 假设我们有一… Text2MDT 从医学指南中构建医学决策树 提出背景Text2MDT 逻辑Text2MDT 实现框架管道化框架端到端框架 效果 提出背景
论文https://arxiv.org/pdf/2401.02034.pdf
代码https://github.com/michael-wzhu/text2dt 假设我们有一本医学指南其中包含关于诊断和治疗某种疾病的指导。
首先通过标准化和结构化的方法我们定义出哪些文本片段表示条件判断例如病人年龄超过60岁哪些表示决策例如使用药物A治疗。
然后使用构建的Text2MDT基准数据集训练NLP模型使其能够从类似的医学文本中自动识别和提取这些条件判断和决策。
最终通过应用预训练模型和特定的算法流程从文本中抽取出的信息被转化成一个结构化的MDT明确显示了从条件判断到最终决策的完整路径。 这张图展示的是一个医学决策树MDT用于辅助医学决策过程。
是根据某个癫痫临床指南中的内容构建的。
决策树的每个节点代表一个临床决策点其中包含条件橙色菱形和决策节点蓝色矩形。
图决策树是这样的 最顶部的框包含了一个临床指南建议对于普通强直-阵挛发作的患者首选药物是丙戊酸Valproic acid。如果丙戊酸不适合可以使用拉莫三嗪Lamotrigine或苯巴比妥Phenobarbital。如果患者还有肌阵挛发作或疑似有儿童肌阵挛发作则不适合使用拉莫三嗪。 在决策树的左侧如果患者对丙戊酸适应“Yes”则继续向下走如果不适应“No”则考虑其他药物。 在左侧分支中如果患者对丙戊酸适应且有其他指定条件在图中以null表示则选择使用丙戊酸。 在右侧分支中首先判断患者是否有肌阵挛发作如果没有“No”则选择使用苯巴比妥如果有“Yes”则进一步判断是否是儿童肌阵挛发作是的话“Yes”避免使用拉莫三嗪否则“No”使用苯巴比妥或拉莫三嗪。
这种决策树是临床决策支持系统中的一个工具可以帮助医生根据患者具体情况作出更加精确的药物选择。英文翻译已在图中的括号中提供。 Text2MDT 逻辑
问题如何从非结构化的医学文本中提取结构化的知识并构建医学决策树MDTs。
解法Text2MDT 逻辑从文本到医学决策树的自动化提取 文本输入: 表示任务的起始点输入的是医学文本。
三元组提取: 从文本中提取出主体、关系、客体组成的三元组信息。
节点分组: 根据三元组和逻辑关系如AND、OR将提取的信息分组到不同的节点。
树组装: 将节点按照逻辑关系组装成一个完整的决策树。 特征1 (节点角色识别)识别决策树中的节点角色区分条件节点表示为菱形和决策节点表示为矩形。
首先我们识别出文本中描述病人状态的部分这将构成条件节点然后识别出治疗方案的部分这将构成决策节点。
为什么需要节点角色识别
因为医学决策树需要区分条件和决策这是逻辑流程中的关键部分。
特征2 (三元组提取)从医学文本中提取三元组每个三元组由主体sub、关系rel、客体obj组成用于描述医学内容。
从这些部分中提取三元组。例如如果文本说“如果患者对药物A过敏使用药物B”我们将提取三元组患者对…过敏药物A和使用药物药物B。
为什么需要三元组提取
因为决策树的每个节点都基于一组特定的医学事实这些事实最好以结构化的数据表示例如三元组。
特征3 (逻辑关系理解)确定节点内三元组之间的逻辑关系可能是AND、OR或NULL不存在明确关系。
确定三元组之间的逻辑关系。在这个例子中因为药物B的使用取决于对药物A的过敏反应我们可能会标记这个关系为条件关系IF-THEN。
为什么需要理解逻辑关系
因为医学决策是基于一系列逻辑关系正确理解这些关系对于构建准确的决策树至关重要。
特征4 (条件判断映射)将条件节点中的条件判断映射到决策树的分支逻辑即根据条件判断结果是Yes或No决定接下来的路径。
在决策树中如果条件判断为“Yes”我们会向左移动到决策树的下一个节点如果为“No”则向右。
为什么需要条件判断映射
因为决策树的路径取决于条件判断的结果映射这些结果对于树的结构和最终的决策路径至关重要。
特征5 (决策序列生成)生成节点的预定序列来唯一表示医学决策树。
确定节点的预定序列。
根据前面的条件和决策我们可以构建一个节点序列从而生成整个决策树。
为什么需要生成决策序列
因为最终的目标是生成一个可以代表医学决策过程的结构化决策树而这需要所有节点和路径按特定顺序排列。
Text2MDT 实现
Text2MDT 实现 特征1 特征2 特征3 特征4 特征5
特征1预训练语言模型的应用
描述利用像BERT这样的预训练语言模型PLMs来处理医学NLP任务。
特征2信息提取技术的发展
描述应用不同的模型架构如Seq2Seq生成模型来处理不同的细粒度信息提取任务。
特征3医学信息提取的特殊性
描述考虑医学领域中不连续或嵌套实体的复杂性以及条件三元组的概念。
特征4Text2Tree任务的历史和应用
描述从给定文本中提取树结构的NLP任务如句法分析和语义分析。
特征5模型架构的趋势
描述从专门的模型过渡到更统一的模型架构比如利用预训练的编码器模型来提高Text2Tree任务的性能。 例如在处理一篇关于糖尿病治疗的论文时模型首先识别出治疗方案、药物剂量和患者条件等实体。
然后它使用Seq2Seq模型来理解这些实体如何在不同条件下相互作用比如哪些药物是在餐前使用哪些是餐后使用。
再接着模型识别出特定的医学条件三元组例如某种药物可能只适用于2型糖尿病患者。
最后所有这些信息被整合成一个决策树其中每个节点根据患者的具体情况指导特定的医疗行为。
例如根节点可能是“患者是否有心脏疾病的病史”如果答案是肯定的那么下一个节点可能是“是否应该减少某种药物的剂量”。
而如果答案是否定的下一个节点可能是“是否可以使用标准剂量”。
这个统一的模型框架可以自动化地从医学文本中提取这些决策点并构建成一个有助于医生和病人理解和遵循的决策树。
通过这种方式Text2MDT任务可以帮助将大量的非结构化医学知识转化为结构化的、可操作的决策支持工具。 框架
Text2MDT任务的模型化方法被拆解为两个主要框架
管道化pipelined框架端到端end-to-end框架
由于没有现有的神经网络方法能直接处理这个新颖的任务作者提出了两种方法群体 (a) 管道化方法将Text2MDT任务分解为三个子任务并利用现有的方法来完成这些子任务。 (b) 端到端方法这是一个具有挑战性的方法不能由基于编码器的模型处理。研究中利用了最新的开源大型语言模型LLM和思路链提示方法chain-of-thought prompting来应对端到端方法。
管道化框架
管道化框架将Text2MDT任务分为三个主要步骤 三元组提取: 使用统一的三元组提取模型TEModel从医学文本中提取代表决策或条件的三元组。三元组由实体对和它们之间的关系组成关系类型由之前提到的表格定义。 节点分组: 将提取出的三元组根据逻辑关系分组成不同的节点这些节点将成为MDT的主要组成部分。使用节点分组双仿射模型NG-Biaffine来实现这一步骤。 树组装: 组装节点以构建医学决策树涉及为每个节点分配角色条件或决策以及确定节点间的连接。树组装也可以看作是实体类型分类和关系提取的联合任务。
端到端框架
端到端框架考虑使用生成性语言模型来一次性完成整个Text2MDT任务。这种方法的关键特点包括 直接生成: 询问语言模型LM直接根据文本输入生成整个MDT。 COT风格生成: 鉴于任务的复杂性考虑了不同的COT风格提示和响应例如 COT-Generation-1: 按照管道框架的步骤让LM首先生成三元组然后进行节点分组最后组装树。COT-Generation-2: 将任务分解为更细粒度的子任务如先生成实体然后三元组接着节点分配和角色最后整个树。COT-Generation-3: 要求LM首先提取三元组然后生成整个MDT。COT-Generation-4: 进一步分解三元组提取子任务让LM先提取实体然后生成三元组最后生成整个MDT。
管道化框架通过逐步处理每个任务的子部分逐渐建立起决策树的结构。
而端到端框架则利用生成性语言模型的能力一次性或通过COT风格的逐步推理生成完整的决策树。
这两种框架各有优势管道化框架的模块化设计使问题变得更容易管理和优化而端到端框架更直接和效率高但需要更复杂的数据处理和训练过程。 效果
Ground Truth实际情况、Prediction预测
临床指南提及患有鼻咽炎的患者通常会使用的药物包括治疗鼻塞、发烧时常用的药物如布洛芬、对乙酰氨基酚等。
Ground Truth中提及了正确的药物和情况包括使用药物治疗鼻塞的情况。Prediction部分出现错误它没有预测出应使用的药物比如未能预测布洛芬和对乙酰氨基酚。 临床指南提及对于低钠血症且年龄超过65岁的男性患者不建议使用去氨加压素。
Ground Truth正确识别了患者的基本情况以及不应该使用去氨加压素的指南。Prediction部分未能正确预测不应使用去氨加压素而是错误地将其作为治疗药物。
目前系统的局限性包括
节点的逻辑表达受限仅限于“和”和“或”逻辑关系而在更复杂的情况下可能需要多种逻辑关系的组合。树的表现力有限当前的决策树在达到一个决策点后就终止但实际场景应该是一个连续判断和决策的过程。文本长度有限当前方法仅旨在提取一个段落的医学文本而实际上医学知识可能需要基于多个部分或章节。
COT-Generation-3 尽管是一个有前途的方法但它在三元组提取阶段仍有提升空间特别是在处理复杂的医学知识时。
COT-Generation-3可能是一个特定版本的Chain of Thought生成模型而Text2MDT是它试图解决的任务。
该研究表明虽然Text2MDT模型在处理某些任务上取得了进展但还存在局限性和改进空间。
未来的工作将需要解决逻辑表达的多样性、决策树的连续性以及处理更长文本的能力以便更准确地从复杂医学文本中提取MDT。