HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

测量生命体征的方法集锦9篇

时间:2023-10-11 10:17:35

测量生命体征的方法

测量生命体征的方法范文1

操作步骤

新生儿及小婴儿(

婴幼儿高热的處理 ①首先使用物理降温,如冰枕、冰敷、温水擦浴等。②对0.5~2岁婴幼儿可给予口服对乙酰氨基酚或布洛芬等药物降温。

年长儿高热的處理 ①酒精擦浴,或温水淋浴,或冰枕,颈部、腋窝、腹股沟置冰袋,也可以用冰盐水150~200 ml灌肠等方法进行物理降温。②口服对乙酰氨基酚或布洛芬等,肌注复方对乙酰氨基酚等药物降温。③对高热持续不退者可慎用冬眠降温,且要注意观察患儿生命体征的变化。

态度要求 小儿高热时易引起惊厥,及时、正确處理高热,可降低并发症的发生,使患儿转危为安。

对于新生儿,不论何种原因引起的高热均可通过打开包被来降温,至体温正常再适当包裹,防止着凉。新生儿皮肤降温,不宜用酒精擦浴,因新生儿体表面积大,皮肤角质层薄,易吸收酒精造成中毒。新生儿不用解热药,因肝脏酶活力低,解毒能力差,易引起中毒。

对于婴幼儿高热,主张首先使用物理降温,对

在发热时,不应将肾上腺皮质激素作为常规退热剂使用,以免掩盖症状,给诊断造成困难。在进行物理降温时,动作要轻柔。温水浴的水温以33-35℃为宜。年长儿酒精擦浴时酒精的浓度为35%。药物退热比物理降温法起效慢,应向家长解释以取得其理解与合作。作好记录。

重要提示 ①退热:

吸氧以维持惊厥患儿生命

操作步骤 ①准备物品;②向患者及家属解释吸氧的必要性;③选择鼻腔,并清洁;④连接鼻导管;⑤调节氧流量;⑥固定鼻导管;⑦安置患者于舒适;⑧记录。

态度要求 告诉患者家属吸氧的重要性,迅速将准备好的氧气安装好,进行吸氧,向患者说明需要配合的方法和注意事项,随时观察情况,保持给氧通畅,当吸氧过程中出现不适时,要立刻采取措施给予解决。

在为患儿吸氧时,流量不能太大,对于新生儿特别是早产儿,应根据情况采取低流量间歇给氧,以防氧中毒的发生。

操作时,要动作熟练、轻柔,避免损伤鼻黏膜,要严密注意观察吸氧效果。因吸氧时鼻导管的刺激,低龄儿易将鼻导管拔出,医护人员应特别予以注意。对于新生儿和小婴儿,如需较长时间给氧,则要加热并湿化氧气。认真填写记录。

重要提示 ①严格按操作规程进行,确保惠儿安全。②急性肺水肿在湿化瓶中可改装20%~30%酒精,发挥消泡_作用。③小儿惊厥时,吸氧可增加血氧饱和度,改善全身组织器官特别是脑组织的缺血、缺氧状态,氧流量1-2 L/分,鼻导管吸入。④停止用氧时,先取下鼻导管,再关闭氧气开关。

监测小儿生命体征以及时发现问题

操作步骤 ①监测意识状态:判断意识属于清楚、烦躁、淡漠、昏迷状态。②测量体温:明确体温高低,观察热型。③测量脉搏:记录次数/分钟。在低龄儿可直接测量心率,并注意节律的变化。④观察呼吸:记录次数/分钟,并注意呼吸节律。⑤测量血压:记录收缩压,舒张压。⑥检查尿量:每小时尿量,24小时尿量。⑦记录监测结果。

态度要求 观察生命体征必须仔细认真。操作要熟练、准确,动作快速、轻柔,避免损伤。每一次检查都要严格按照规范进行。即使是简单的操作,也不能交给患儿家属去做。

要向患者及其家属解释监测的重要意义,并取得配合。对患儿家属的询问要给予耐心、准确的回答,不要敷衍,更不要态度粗暴。当患儿病情出现危急情况时,应当沉着镇静、有条不紊。要将检查和观查结果清楚、准确地记录在病历中。

在为患儿测量体温时,对于低龄儿及意识障碍的患儿应测量肛温,以防意外发生。测量血压时应根据年龄选择袖带的型号,不能过宽或过窄,以免影响结果的准确性。严重病例要有专人看护,严格观察生命体征,要注意出入液体量。一般入量小于出量,这样可以防止脑水肿。

重要提示 ①呼吸停止,必须立即抢救。②血压小于同年龄计算值>20mm Hg应警惕休克。③尿量:成人和学龄儿童

监测和治疗以防止脑水肿

操作步骤 ①了解病史:是否为惊厥持续状态或惊厥频繁发作。②监测意识状态:判断意识属于清楚、烦躁、淡漠、昏迷状态。伴有意识障碍及呕吐时,应考虑有脑水肿。③神经系统检查:瞳孔大小,对光反射,脑膜刺激征,病理征。④可静脉注射地塞米松2.5-5 mg/次,同时静脉推注20%甘露醇0.5-1g/(kg·次)脱水,降低颅内压,或呋塞米(速尿)0.5-1 mg/(kg·次),静脉注射。

态度要求 询问病史要详细、认真,态度和蔼。并向家属解释全面了解病史的重要性和必要性,取得其配合。检查要仔细,先要有针对性选择重点项目,病情允许方可进行其他系统全面检查。

短暂单次惊厥一般不会产生脑水肿,但反复发作的惊厥和持续发作的惊厥(惊厥持续状态)易致脑水肿。对于后者应积极處理,在最短的时间内控制好惊厥,并處理脑水肿。对于感染性脑水肿,可采取边补边脱的方法,保持患儿處于轻度脱水状态。注意做好各项记录,避免遗忘已用过的药物和治疗措施。

重要提示 ①20%甘露醇应快速给药(静脉推注),方能达到效果。同时给地塞米松能进一步减轻脑水肿,比单用甘露醇更好。但对于新生儿及早产儿要慎用甘露醇,可用地塞米松和(或)呋塞米降颅压。②由于患儿的生理特点不同,在判断脑膜刺激征和病理征时要注意。新生儿及出生后4个月的小婴儿因屈肌张力较高,克氏征可呈阳性。

帮助患儿转院以获得进一步處理

操作步骤 明确转院指征:①疑有颅内病变。②惊厥持续存在,或反复发作。③目前生命体征平稳。

向家属交代转院的必要性。联系转院车辆,并告知上级医院。准备好转院途中所需的抢救器械和药品。指定医护人员和家属陪同送达。带全患儿有关资料。

出发前检查:①检查患儿生命体征情况;②检查各种管道的安全,如静脉通道、输氧管道;③检查装备是否完好;④告知接收医院值班医生患儿目前情况和预期到达时间。

转运途中监护:①监测生命体征;②接好氧气管,有条件时接好呼吸机;③接好静脉通路,控制好输液速度;④處理转运途中出现的意外情况,如惊厥、高热等。

到达转运医院:迅速送入抢救室。

态度要求 应当在病情允许的情况下进行转院。不要怕承担责任而推卸患者。

转院前应向家属交代转院的必要性和拟转的医院,征得同意,要对途中可能发生的危险有充分的准备和应对措施。在转院途中如出现惊厥或惊厥控制不佳,在保持呼吸道通畅的情况下,可使用速效止惊剂以防意外。并密切注意生命体征的变化。护送人员应当是医生或护士,不要安排非专业技术人员或实习学生。要根据可及的交通工具,将患儿安置于合适的。要态度和蔼,语言文明,遇到病危情况,要当机立断,机智勇敢,全力抢救。同时积极联系,取得帮助。

测量生命体征的方法范文2

关键词:计算机应用;中文信息处理;中文命名实体识别;条件随机场;自然语言处理;机器学习

中图分类号:TP391.1

文献标识码:A

1 引言

命名实体识别是确定文档中的人名、地名和机构名等名词短语的过程。它是信息抽取、问答系统、机器翻译、文档摘要、跨语言检索等自然语言处理应用的关键技术之一。与其他语言相比,中文缺乏词间分隔与大小写等语法特征,其他语言中常用的表层局部环境信息往往不足以完成中文命名实体识别的任务。因而中文命名实体识别更为困难。

在早期基于规则的中文命名实体识别系统中,特征融合自由,各种方面的信息以规则的形式引入。众所周知,规则系统的缺点是工程量大,移植困难,因此当前基于大规模语料的机器学习已成为主流方法。在中文命名实体识别中,常见的学习模型有最大熵模型、隐马尔科夫模型以及条件随机场模型。

条件随机场(Conditional Random Fields,CRF)模型实质上是基于马尔科夫依赖假设的最大熵模型,可以引入多种灵活的允许交叠的特征,没有搜索空间过大或标注不一致的问题。对于NER这样的序列文本标注任务,诸多研究工作表明CRF模型综合了最大熵和HMM模型各自的优点,因而近年在词类标注、中文分词、浅层分析、命名实体识别中广为应用。

在这些工作中,大多采用了标准线性链(Lin-earchain)结构的CRF实现。其常规的解码与单轮训练算法时间复杂度与特征空间的规模成正比。特别地,在几十万到几百万字的语料上,基于多特征的CRF系统特征规模可达百万到千万,时收敛速度缓慢。当引入更多更丰富的特征会引起规模的剧烈上升,甚至不可运行。

因此,如何降低训练的代价,提高训练的速度,是基于标准线性链结构的CRF模型命名实体识别实现中的技术难点。

当前主要的解决思路是压缩模型的特征规模。有三个思路:单字多特征、词语简单特征与组合模型标注器。单字模型一般以字元组为模型特征,其局限是字特征过于细致,容易形成过拟合,泛化不足。而在基于词的模型中,一般采用较简单的提示词列表、名称列表等特征。由于稀疏问题,较少使用二元以上的词元组。当前两者结合,使用大量的字、词特征时,CRF模型的特征规模和训练代价迅速增长。第三种思路是设计多个较小特征规模的标注器,然后通过投票或错误编码的方式进行综合。这种思路的缺点是系统结构复杂,需要大量精细的工作。

本文以单字为基本模型符号,通过引入精心设计的小规模单字提示特征,特别是机构名和地名尾字特征,仅使用少量的字元组和词性特征,在不影响系统精度的情形下,有效地降低复杂特征所需的训练代价,缩短了训练时间。

然后,通过引入任务相关的人工知识,压缩CRF模型动态规划解码过程中的搜索空间,降低节点势函数计算量的格生成算法,提高估计和训练的速度。

全文布局如下:第二节介绍基于条件随机场模型的命名实体识别基本原理。第三节引入小规模单字提示特征和启发式规则控制搜索路径生成策略的CRF快速训练算法。第四节给出了实验数据,并进行结果对比和分析。最后为全文总结,指出将来的研究方向。

2 基于条件随机场的命名实体识别

下面我们具体分析条件随机场模型进行序列概率估计、解码和学习算法的时间复杂度。

阿拉伯数字和中英文字母,以及100个常见单字姓氏,100个地名尾字和40个机构名尾字。每种类型的字组成一个列表,所有列表中的字总量不到400。这些列表形成一个单字提示特征,详见表1。

与大规模的词提示列表和名称列表相比,小规模单字提示特征规模小,模型的计算资源需求不高,有利于提高系统的速度。同时单字列表查询简单,不存在跨越词边界匹配形成错误切分的问题。此外,小规模的列表收集容易。这些单字列表主要来自于对863语料上和少量名称列表的统计,并经过补充相关形式的数字和字母得到。

3.1.2 状态表示

命名实体识别的任务是对命名实体识别的边界确定和类型确定。在CRF模型下,这两个问题可以综合考虑。我们的系统中,模型节点的状态对应着符号的标签,由两部分组成,分别为符号所在命名实体的类型标签和符号在命名实体中的位置标签。863任务有6类命名实体,分别是人名(PER)、地名(LOC)、机构名(ORG)、日期表达式(DAT)、时间表达式(TIM)、数量表达式(NUM),各对应一种类型标签,加上非命名实体标签(OTH),共7种类型标签。SIGHAN MSRA任务只识别前三类命名实体(专名)。位置标签则有起始(B)、接续(I)和非命名实体(O)三种。外部位置标签0与OTH类对应,故863任务共有6×2+1=13种状态标签,MSRA任务共有7种状态标签。搜索格(图1)在符号序列头部和尾部附加的节点start和stop可理解为标签OTHER。

3.2 搜索格生成算法

标准线性链结构CRF中Baum-Welch和Vit-erbi呈格(Trellises)状展开,如图1所示。各状态变量为一列,列上各节点为相应的状态取值,前后相邻两列的节点间有边相连接。在完全的格中,任意相邻列问的节点均有边相连。

在命名实体识别中,格某些邻接边是没有意义的。NER的状态值包含两个方面的信息:实体类型和实体边界。其潜在的约束为:如果两状态对应的实体类型不相同,那么后一状态对应的边界类型必须为B(新实体的起始),而不能为I(原实体的接续)。例如,不能在B-LOC后接I-PER,或者I-PER后接I-LOC,或者OTHER后接I-ORG。但可以在I-PER后接B-LOC,或者在B-LOC后接I-LOC或OTHER。这里,标签OTHER可理解为B-OTH,即每个符号为非命名实体。我们将这一知识施加到格生成过程中,剪除不合理的边,见图3中的虚线,形成快速的搜索格。

间相比,小规模特征集减小的训练代价是相当可观的。并且,与POS+TXT+aLIST相比较,其性能不但没有下降,反而较POS+TXT+aLIST有所上升,增幅达2.5个百分点。

4.3 改进的搜索格生成对训练时间的影响

我们在SIGHAN命名实体识别语料集上也进行了搜索格生成控制策略前后的对比。前100轮L-BFGS迭代所需时间示于图6。可以看出,由于剪除了无效邻接状态组合,压缩了搜索路径的空间,格生成改进算法是有效的,可以平均节约训练时间15.12%的时间。未能接近50%的原因在于算法中解码没有引入复杂的邻接状态特征,计算量主要集中在状态一观察关联上,这部分的改进由上小节引入小规模单字提示特征来完成(我们没有在SIGHAN上再次进行对比实验)。

4.4 基于快速CRF算法的命名实体识别系统

最后,我们给出在特征集POS+TXT+sLIST上最终系统的评测结果以及当次评测系统中单项最佳的指标,见表2。需要注意的是,2004年度的863中文命名实体识别评测没有提供训练语料,我们直接将评测语料分割为训练语料和测试语料,两部分类型相似,因此评测指标偏高,难以与当次评测报告给出的最佳指标做出公正的对比,仅供参考。

5 结论与将来的工作

测量生命体征的方法范文3

中图分类号:F713.53

文献标志码:A

文章编号:1000-8772(2015)01-0045-03

1、短生命周期产品需求预测方法的研究背景

随着科技水平的日新月异以及产品更新换代的日益频繁,以及人们生活质量的提高,消费者的需求也发生了显著的变化,致使短生命周期的产品需求日益增大。短生命周期产品的需求预测,能比较准确地揭示出其发展趋势,为决策者提供战略规划。对于手机,电脑等电子产品和服装等时尚类产品,这种表现就更加明显,新产品从进入市场到退出市场只用了一年甚至短短几个月的时间。在本文中,笔者认为以下产品可视为短生命周期产品:一是季节性变化大的商品,例如时尚服装;二是时效性强的商品,例如杂志,报纸等知识型商品;三是更新换代频繁的电子产品,例如电脑,手机等。

2、研究的目的和意义

短生命周期产品具有的产品生命周期短,产品价格和市场需求不稳定,产品替代性强等特征。经营短生命周期产品对于企业来说是一把双刃剑,一方面给企业带来了风险,若是产品生产过多,就会带来库存问题,若是产品生产过少,就会导致企业错过产品的最佳销售时间,从而影响企业的利润;另一方面也给企业带来了巨大的机遇与挑战,如果企业能够对短生命周期产品做出较准确的预测,能够基本分析出短生命周期产品的进入期,成长期,成熟期和衰退期,就能够快速反应,响应市场需求赢得利润。

本文对短生命周期产品的需求预测,引入实际算例运用四种模型进行佐证,以期检验四种模型的预测准确度,诠释四种模型各自的应用条件,尽量提高预测的准确度,为管理人员的决策做好数据支持,减少预测误差而给企业带来的利润流失。

3、短生命周期产品的特征

目前,市场中短生命周期产品越来越多,特征也多种多样、不尽相同,主要特征如下:

(1)产品生命周期短

由于现代技术的进步,消费者需求也多样化,企业为了占有市场,不断利用最新技术开发产品,致使了产品的生命周期很短暂。这就形成了短生命周期产品的一个特征。

(2)产品价格和市场需求不稳定

某种新产品刚进入市场时,对于刚刚够买了上代产品没多久的消费者以及尚未接触过此类产品的消费者来说,大多都在观望,这样就造成了短生命周期产品市场的不稳定性,因此产品价格的波动也会很厉害。

(3)产品价值贬值快速

由于本代产品还没完全处于消退期,但企业为了进一步的占领市场,加大力度应用科技创新,下代产品会随之出现。但是由于需求市场的不稳定性,产品的价值不容易体现,随着竞争的加剧,短期生命周期产品的价值会越来越底,产品价值衰退的幅度也会非常大,有时候会给公司带来巨大的经济损失。

(4)产品替代性强

短生命周期产品最大特征是产品替代替代性强,因为这种产品含金量高,开发周期长,造就了产品革新更替的速度快,甚至可能一种产品A还没研发成功,而比这种产品更先进的下代产品B已经出现在市面上。

4、短生命周期产品四种需求预测方法的讨论

4.1指数平滑法预测

传统的方法,以产品为预测单位,这是基于统计的各种时间序列的分析法。但是结合短生命周期产品的特征时,可以看出,这些方法对短生命周期产品是不适合的。这是由于:传统的预测方法需要大量的历史数据为支持,或者需要已知产品生命周期形态,但这种形态只有产品走向市场之后才能获得。另外传统的预测方法是在平稳趋势的情况下进行的预测,而在趋势变化时,产品就表现出了滞后现象。

对一组简单的富有增长趋势的数据进行一次指数平滑预测,可以看出,当历史数据出现趋势后,指数平滑值往往要滞后于历史数据,造成了预测误差逐渐增大的结果。而对于生命周期长,需求波动不大的普通产品来说,用此预测方法就显得较为恰当。因此,这种常规的需求预测方法并不能让企业决策者感到满意。

4.2以报童模型分析需求预测

举例:以一家时尚服装店为例,作为时效性强的短生命周期产品,时装进价成本c为600元/件,零售价p为1000元/件,卖不出去退回厂家时回收价格g为200元/件,假设无缺货成本s,无打折促销,求每月最佳订货量Q*。

已知根据多年的统计表明,人们对于时装的需求服从均匀分布,最高需求量为m=96件,最低需求量n=26件。

解:根据概率论可知,均匀分布的概率密度函数为:

用报童模型预测短生命周期产品要求产品的需求基本服从均匀分布,已知最高需求量与最低需求量,并且用报童模型进行预测只能得出平均最优的进货量,而不能预测出每月最优的进货量,因而只能适用于不太要求精准预测的短生命周期产品。

4.3以EOQ模型分析需求预测

基本EOQ模型包含的假设条件之一要求:需求连续且稳定。时装作为时效性强的短生命周期产品,当季畅销,过季则很少人购买,甚至无人问津,需求不稳定,所以不可以应用EOQ模型进行需求预测。因此使用EOQ模型进行需求预测就要求短生命周期产品具有需求连续且稳定,需求速率已知;补货周期固定,不考虑补货提前期;不考虑数量折扣;货品的补货立即完成等条件。

4.4以BASS模型分析需求预测

BASS模型的优点在于使用简单明了的概念架构和参数设定,来获得清晰有理的解释能力。BASS模型是Frank Bass融合了Fourt和Mansfield的研究模式建立起来的,其模型表示为:

f(t)/[1-F(t)]=p+qF(t)(1)

即在不发生购买行为的情形下,进行第一次购买行为的可能性与之前的购买者数量成线性关系。其中f(t)为t时刻购买的可能性,F(t)为在第t期累计购买者占总购买者的比率,p为创新系数,q为模仿系数。f(t)与F(t)的关系为:

设m为购买者的潜在数量或潜在购买量,为t期累计购买者的数量,为t期购买者数量,即非累计购买者的数量,则有公式: n(t)=mf(t)(2)

N(t)=mF(t) (3)

由上述三个公式归纳得到BASS模型的基本形式:

(4)

公式(4)认为,潜在购买者可以分为两个部分:一部分是p[m-N(t)]代表的因外部影响而购买的新产品的人数,称为创新者;另一部分是代表的那些受到先前购买者的影响而购买新产品的人数,称为模仿者。当t=0时,n(0)=pm为原始接受人数,即新产品进入市场前的试用者人数,也可以理解为新产品进入市场前的样品试用数量。

由式(1)以及F(0)=0可得出:

(5)

从而得到累计购买者数量:

(6)

只要知道了N(t),带入式(4)就可以得出t时刻非累计的购买者数量及销售数量n(t)。

依据以上构建的BASS模型编写程序,用Matlab进行非线性拟合,得到拟合曲线方程的参数值,如下表2所示。

以时尚服装为例,一年销售记录如下表3,用BASS模型预测每月销售量。

对比表3中的数据可以发现,BASS模型的拟合预测销量和实际销量有4—28不等的差距。

Bass模型虽然可以预测出每月的需求量,但是预测值与实际值相比,有时偏大,有时偏小,趋势不稳定。对于需要较准确的预测每月的需求量且不要求高精确性的短生命周期产品较为适用。但是相比于上述三种预测方式,Bass模型还是占有优势的。

结论

由于短生命周期产品具有复杂性、多变性的特点,再加上其他众多随机性因素的影响,使得短生命周期产品的需求很难用一种简单直接的方法进行预测。本文通过分析短生命周期产品的研究背景及目的、特征以及预测其需求的条件,讨论了四种预测方法。在日益激烈的市场竞争环境下,由于短生命周期产品的需求预测的不确定性增强,短生命周期产品的需求预测不应局限于单一的预测方法或者一个部门,而应多重预测方法、多种技术相结合并且促进多个部门相互合作。科学技术的进步和人们生活观念的改变也使得对商品的需求越来越多样化,在未来,短生命周期产品会越来越多的出现在我们的生活中,我们应该更进一步地研究与探索,以期望能够用动态跟踪的方式来准确吸收新数据并高效分析数据来进一步提高预测的精确性,增强企业决策的有效性,提高企业利润。

参考文献:

[1] 徐贤浩,宋奇志,短生命周期产品的需求预测方法研究[J ].统计与决策,2006年24期,P161—P163.

[2] 魏雪.短生命周期电子产品需求预测研究[D]. 东北大学,2010.

[3] 刘铮,徐琪,基于服务一购买意愿的双渠道短生命周期产品需求预测模型——以快时尚服装行业为例[J]. 《东华大学学报(自然科学版)》,2013年5期,P668—P674,681.

[4] 王业宏,短生命周期电子产品备件预测方法及其在展望电子公司的应用[D]. 河北工业大学,2012.

[5] 徐贤浩,宋奇志,改进BASS模型应用于短生命周期产品需求预测[J]. 工业工程与管理,2007年5期,P27—P31.

[6] 杨敬辉武春友,采用Norton模型对产品更新换代扩散趋势的研究--以中国互联网用户上网方式的更新换代为例[J]. 科学学研究,2005年5期,P682—P687.

[7] 吴继锋.基于贝叶斯更新的短生命周期产品需求预测与库存控制研究[D],南京理工大学,2012.

作者简介:罗梦琪(1992—),女,山东东营人,管理学学士,从事物流管理研究。

测量生命体征的方法范文4

关键词:自适应考试;在线考试;在线组卷;选题策略

中图分类号:TP311

文献标志码:A

文章编号:1006-8228(2017)01-30-04

0.引言

在线考试系统凭借评阅准确及时、人为干扰少、公平性强等特点,已经逐步替代纸质考试。但大部分在线考试系统只是利用计算机对考试过程进行管理与控制,实现自动阅卷,无法突破经典测量理论(classic Test Theory,简称CCT)。

项目反应理论(Item Response Theory,简称IRT)出现后,以IRT为基础的计算机自适应测试系统(computerized Adaptive Testing,简称CAT)采用“因人施测”的基本思想,每个应试者都能接受一组符合自身能力水平的试题进行测试。

与传统考试相比,CAT具有对应试者的能力评估准确、测试效率高、评估方法公正科学等优点。CAT虽然优点多,但社会认同度较低,除了试题参数计算复杂,题库质量要求高之外,以能力值表示的考试结果认同度低也是重要原因。

本文以知识点关联为基础,实现一个具有自适应特征的在线考试系统AFOMS(Online ExaminationSystem with Adaptive Features,简称AFOMS),避免自适应考试系统的缺点的同时,达到测试应试者真实知识水平的目的。

在设计AFOMS之前,参照CAT通用考试过程模型,设计了自适应性在线考试模型SAFM(SelfAdaptive Features Model,简称SAFM)。

1.SAFM的设计

CAT的工作过程如下:系统在测试初始探查阶段获取应试者能力值之后,在考试过程中根据答题情况动态地评估应试者的能力值,选取最接近应试者能力值的试题进行施测,直至考试结束。

SAFM的设计思路:设有初始探查阶段,自适应选题施测阶段以及测试终止阶段。在选题策略方面,以知识点关联关系,根据答题情况选取试题进行施测,达到测试目的。

1.1初始探测选题

由教师用户选定考查的知识点后,设置各题型试题数量,整体难易度后,系统自动生成一组试题进行施测。在第一部分测试结束之后,系统自动对第一部分答题情况进行分析统计。

1.2自m应选题策略

基本思想是:分析第一部分考试结果后,根据之前某个知识点的试题答题情况,按照难度等级递增或者递减的原则来随机选取下一道关联这个知识点的试题施测,直至考查结束,实现考查知识点的全覆盖。在本阶段,关于某个知识点的试题至多只有两道。

自适应特征选题工作流程如图1所示。

由图1可知,第一道题与第二道题的选题策略是保证考试质量的核心。

假设第一部分考试中出现的知识点为T(a1,a2,a3......ax),某个知识点考查的试题为M(M1,M2,M3,Mx),试题对应的难易度为P(P1,p2)2,Px)。

对于某个知识点ai,关于知识点ai的试题集合M,自适应特征考试第一题选题策略如图2所示。

第一道试题选择策略简述如下。

(1)若全部答对,且试题M中存在某一试题Mi难度等级为难,则该知识点考查结束,考查下一个知识点。

(2)若全部答对,且试题M中不存在试题难度等级为难的试题,选取集合P中的等级最高值Pi,抽取一道关于知识点ai难度等级为(p1+1)的试题进行测试。

(3)若全部答错,则选取一道关于知识点ai的难度等级为容易的试题进行测试。

(4)若答错和答对都有,则记录答错题的最高难度等级Pi,选取一道难度等级为(Pi-1)的试题进行测试。

第二道试题选择策略简述如下。

(1)若答对N,且R为难,则知识点ai考查结束。

(2)若答对N,且R不为难,则选取一道难度等级为(R+1)的试题继续测试。

(3)若答错N,且R不为容易,则选取一道难度等级为(R―1)的试题继续测试。

(4)若答错N,且R为容易,则知识点巩考查结束。

1.3终止规则

过多的测试题目容易导致测试时间过长,测试效率不高。SAFM采用终止策略是:在自适应特征考试部分,关于某个知识点的试题达到一定数量即终止考查,考查下一个知识点。

2.AFOMS的设计

2.1 AFOMS的总体结构

AFOMS的系统模型结构如图4所示。

2.2数据库设计

采用Oracle 10g作为数据库管理系统,设计了―个考试数据库,共建了27个数据表。其中主要的数据库表为15个,分别是学生信息表(命名为“STUDENT”)、课程信息表(命名为“LESSON”)、知识点信息表(命名为“KNOWLEDGE”)、题目信息表(命名为“QUESTION”)、考试配置表(命名为“TESTCONFIG”)、试卷难易度表(命名为“NYDTEST”)、第一部分考试知识点表(命名为“PRE_KNOW”)、第一部分考试答题信息表(命名为“PRE_PAPER”)、第一部分考试成绩表(命名为“PRE_SCORE”)、第一部分考试分析表(命名为“PRE_RESULT”)、自适应特征考试知识点表(命名为“TEST_KNOW”)、自适应特征考试答题信息表(命名为“PAPER”)、自适应特征考试成绩表(命名为“SCORE”)、自适应特征考试分析表(命名为“F_RESULT”)、第一部分考试和自适应特征分析表(命名为“F_RESULT_ALL”)。

主要数据表之间的关系如图5所示,其中pk表示主键,fk表示外键。

3.系统测试与分析

系统初步搭建后,两位考生完成了考试。两位考生的考试情况如表1所示。对比数据来看,第一部分考试答对的试题越多,自适应特征考试的时间相应缩短,收敛速度较快。考虑到考生心理因素及其他因素,由两部分考试的答题情况来评定最终成绩比较合理。因此考试成绩能反映出应试者的知识水平,具有一定的实用性。

4.总结

测量生命体征的方法范文5

在临床上,多器官功能障碍综合征是较为严重的并发症,主要是由于人体受到强烈的创伤或者是由于外在环境的损害导致的突发性的疾病,其病死率非常高,严重的威胁到广大患者的身心健康。而在严重创伤后,患者发生多器官功能障碍综合征需要进行密切的观察和科学的护理,能够进一步确保患者的生命安全。因此,本文针对于笔者所在医院收治的42例严重创伤后发生多器官功能障碍综合征患者的临床护理进行了研究,现将具体的研究过程报道如下。

1 资料与方法

1.1 一般资料

选取2013年1-12月到笔者所在医院进行治疗的严重创伤并发多器官功能障碍综合征的患者42例,其中男23例,女19例,年龄21~53岁,平均(32.1±1.2)岁。23例男性患者年龄24~53岁,平均(31.2±1.1)岁;19例女性患者年龄21~52岁,平均(33.1±1.1)岁。42例患者主要发生的器官功能性障碍情况如下,有12例患者同时发生了呼吸功能障碍和中枢神经系统障碍,有9例患者同时发生肾功能障碍和中枢神经系统障碍,有13例患者同时发生肾功能障碍和呼吸功能障碍,有8例患者同时发生肾功能障碍、呼吸功能障碍和中枢神经系统障碍。

1.2 护理方法

1.2.1 原发性损伤处理 针对于严重创伤导致的多器官功能障碍患者首先需要对原发性损伤进行早期的处理,需要严密的观察患者的情况,并且给予及时的输液,对患者进行心电监护以及对失血过多的患者进行配血和输血[1]。

1.2.2 肾功能监护 对患者进行肾功能的监护,主要就是需要对每位患者每小时的尿量进行准确的记录,并且保证尿量>30 ml/h,若尿量1000 ml/d,尿比重

1.2.3 呼吸功能的监测 由于12例患者出现了呼吸功能障碍的情况,因此,需要对患者进行呼吸功能的监测。首先需要清理患者口腔及鼻中的分泌物,然后对患者的动脉血气动态变化进行监测,如果患者的血气分析为PaCO2>6.67 kPa,PaO2

1.2.4 脑功能监测 对患者还需要进行脑功能的监测,主要需要观察患者的瞳孔的变化情况,并且瞳孔对光反射迟钝,血压升高,警惕颅内高压,防止脑疝形成。

1.3 观察指标

对患者的肾功能、呼吸功能及脑功能进行监测,统计经过科学的护理之后,患者出现多器官衰竭及死亡的概率。在临床观察期间做好相关的记录。

2 结果

42例严重创伤导致的多器官功能障碍综合征的患者进行护理,生命体征恢复正常35例,占83.3%,器官功能衰竭持续发展5例,占11.9%,死亡2例,占4.8%,护理的总有效率为83.3%。

3 讨论

由于患者在严重创伤之后导致多器官功能出现障碍,如果不采取及时的措施,容易导致患者多器官出现衰竭,进而造成患者的死亡[4-7]。因此,针对于严重创伤后的多器官功能性障碍综合征患者的护理是非常关键的。在护理的过程中,除了对患者进行各项器官的监测之外,还需要避免患者出现其他类的感染。另外,在很多的护理工作中,常常忽视一点就是对患者的营养支持,由于患者在患病期间身体非常的虚弱,缺乏营养,因而需要采取输液的方式对患者进行营养的注射,以满足患者身体内正常的新陈代谢,确保患者在科学的护理下,各项器官能够恢复正常,促进患者早日康复。

测量生命体征的方法范文6

一、电气设备状态维修的技术要求

状态维修的前提与基础是对设备进行状态分析与评判,要评判设备目前处于什么样的状态,是否有潜在故障的发生。故障参量的变化率是多少,故障发展期有多长,如何预测故障的发展趋势等等。根据对设备状态的监测、诊断和分析,状态维修的技术包括状态监测技术、状态评估技术、状态预测技术等。

(一)状态监测

设备状态监测技术是根据设备诊断的目的,针对设备故障模式,选用适当方法和装置来检查测量设备的状态信息,并对这些信息进行处理,抑制各种干扰信息,提取能反映设备状态特征的信息的一项信息检测处理技术。电气设备状态监测的目的是通过测量在运设备的健康状况,识别其现有的和即将出现的缺陷,分析、预测检修的时间,以有效地减少设备损坏。由于在运行电压下测量的特征量比预防性试验所加电压下的离线试验同一特征参数正确度高,更能真实地反映设备运行的实时状态,状态监测在电力系统中有着广泛的应用。

(二)状态预测

预测中比较常用的主要有时间序列法、回归分析法、模糊预测法、灰色预测法、人工神经网络法等。

(三)状态评估

状态维修是一种以设备状态为基础,采用预测设备状态发展趋势的方法,以提高设备可靠性和可用度为目标的一种维修方式。显然这种维修是建立在设备现行状态的基础上,而设备的现行状态是通过一定的方式对设备进行状态评估之后予以确定。因此,可以说设备的状态评估是开展状态维修的基础。

二、状态检修技术发展概况

与状态检修密切相关、能直接提高状态检修工作质量的理论与技术主要包括3个方面的内容,即设备寿命管理与预测技术、设备可靠性分析技术、信息管理与决策技术。

(一)设备寿命管理与预测技术

大多数工业化国家的电力基础设施在20世纪60与70年代间得到极大扩充,因此,多数电力主设备的在役时间在25~30年左右,且进入老化阶段的设备所占份额愈来愈大。这种情况迫使各电力公司考虑如何延长机组寿命并保证效益。状态检修中寿命预测与评估技术的应用,有利于科学合理地安排检修和提高设备的可用率。但电力公司可能获得的效益大部分来自于电厂主设备,因此,各国都把寿命预测和评估研究的重点放在对锅炉、汽机、发电机、变压器及高压开关等重要设备上。

(二)电力设备的可靠性技术

传统的电力设备可靠性评估基于威布尔得出的浴盆曲线法。由于可靠性特征曲线形似浴盆而得名,但此法只适用于对有支配性耗损故障的设备进行维修,且精确度不高。将可靠性预测理论和强度及寿命理论结合起来,综合考虑影响锅炉部件故障的各种因素,对预测锅炉部件的可靠性做了有益的尝试。另外,它还运用多元统计方法中因子分析和聚类分析,从反映火电大机组运行可靠性的指标体系出发,对我国火电100MW及以上机组的运行可靠性进行了分析,提出了企业综合可靠性水平的评估方法。用它可以简单分析我国不同地区火电大机组运行的可靠性水平。

(三)信息管理与决策技术

近30年来,管理决策作为一门独立学科,有了很大发展。状态检修作为一种先进的检修体制,是与多方面的管理工作分不开的。世界各国从不同的管理目标出发,形成了不同的管理系统。芬兰的IVO输电服务公司开发的变电站检修管理系统(SOFIA)是一建立在对一座变电站的长期检修计划的基础上,从寿命周期费用(life cycle cost)着手,使用设备的劣化模型的数学形式(状态模型)来估计设备将来状态的一种检修管理系统。

测量生命体征的方法范文7

【关键词】少儿;脾外伤;非手术治疗;

脾外伤是小儿闭合性损伤的常见疾病,传统治疗中,一旦被确诊为脾外伤,需及时采取手术治疗[1]。目前医疗的不断发展,医学上逐渐对脾脏产生认识,且通过不断的研究后,非手术治疗已经成为目前小儿脾外伤主要治疗手段。

1.资料与方法

1.1一般资料

选择我院从2012年8月~2015年8月的脾外伤患者26例为研究对象,女性8例,男性18例,年龄3~11岁,平均年龄(6.4±0.9)岁。病程1~19h,平静病程(7.4±0.9)h。Hb75~135g/L,Hb>120g/L患者7例,Hb75~120g/L患者15例,Hb<85g/L患者4例。车祸受伤15例,挤压受伤6例,摔伤5例。1例合并肾挫伤,2例合并肝挫伤。

1.2诊断方法与临床表现

本组患儿皆有腹部、肋骨外伤史,腹部呈压痛或者疼痛,有2例患者呈反跳痛,3例患者入院时为出血性休克症状。经输血、输液后,血流动力趋于平稳。26例患者经CT、彩超检测后,确诊为脾外伤,据创伤外科协会经脾外伤分级标准,I级患者14例,II级患者8例,III级患者4例。

1.3方法

置于外科病房监护,卧床休息2~3w,对患者生命体征进行监测,血氧饱和度、血压、心率等,动态对患者血红蛋白、体征做观察,及时获悉患者目前身体情况。以禁食方法,为患者保持肠胃的畅快,避免为肠胃施压。对患者适当采用止血剂与抗生素。定期取B超检查,若病情严重时,可取CT治疗。住院治疗2w后,患者出院,3~5个月内,限制活动。

患儿入院后,保持安静,在翻身时,应尽量保持轻柔。取输液、抗炎、止血、肠胃减压方法,缓解患者症状,平稳患者各项指标。取面罩给氧,有休克症状患者,可采取静脉滴注方法,输入盐溶液15ml/kg,根据患者实际情况,输入不同量的全血、代血浆,输入剂量为2h内15ml/kg,若是休克依然无法修正,则应将输血速度加快。对患者行动态生命体征监测,观察患者学业动力指标、血氧饱和度等相关指标,患者腹部经围大小,若是患者腹部经围有变大情况,经B超检查后,患者体内积液过多,可转为手术治疗。

2.结果

本组26例患者皆采取非手术治疗成功,有1例患者入院后Hb有较大的变化趋势,但生命体征较为平稳且腹部无刺激,在输血治疗后,患者Hb逐渐保持平稳,不影响此次研究。所有患者皆无并发症。

26例患者在入院后,取卧床治疗,经生命体征监测,有10例患者输血120ml、肢体平衡液后,生命体征逐渐趋于正常。有5例患者有腹胀情况,且有逐渐加重的趋势,血氧饱和度下降至91%,甚至有失血性休克表现,在输入15ml/kg血液,休克症状逐渐缓解。另外2例患者,在输血15ml/kg后,血液指标和血氧饱和度有下降趋势,患者周围血红蛋白和血红细胞急剧下降,在采取应急措施后,症状得到稳定。

3.讨论

脾外伤是小儿常见性腹部闭合伤,病因主要有打击伤害、追击伤害、坠落伤害。在挤压或者暴力情况下,多数因上腹部、左季肋受伤,导致胸部骨折,因肋骨骨折,脾部失去保护,因挤压、撞击而导致脾破裂。多数脾外伤还合并其他脏器的伤害,为治疗带来巨大的挑战。

脾实质破裂出血,脾在包膜下可保持完整,也有因脾实质膜下出血,导致血液凝固、堵塞,积血位于被膜之下,但为深入腹腔。在症状轻微,受伤不重的情况下,患者早起临床表现并不明显,自身不适症状较少,甚至伴随数月。当被膜下出血,未经手术治疗,一旦受到大力挤压,或者再次外伤,很可能会导致患者出现延迟性出血,延迟性脾破裂而导致的大出血,其死亡率远远高于原发性批损伤。有时或许因为翻身时收到压迫,都可能会导致脾破裂,从而引发急性大出血[2]。因此患者在脾受伤后,应及时检查,排除脾外伤的可能,避免造成健康隐患。

脾受伤到迟发性脾破裂的发作期,其时间从几天到数月不等,因此,对于脾外伤患者,必须要保持绝对的安静,以免翻身之时,导致急性脾出血,为患者带来更多的健康威胁。

脾本身有自愈能力,当脾脏少量出血之时,可自行停止,微小的损伤能够自行愈合。对于受伤轻微的患者,必须对其并且做密切观察,保障患者的生命安全,首先应考虑采取非手术治疗方法,在保证生命的基础上,保留患者脾脏。从国内外的研究中表示[3],脾外伤采取非手术治疗,其治愈率可达50%左右,失败率为30%,从此数据中可见,采取非手术治疗,能在减轻患者治疗创伤,和术后并发症的基层上,帮助患者缓解症状,从而恢复健康。儿童的脾包膜和血管中有较多的平滑肌与弹力纤维,在脾损伤后,易导致血管收缩,同时,脾实质对出血有较好的压迫作用,可自行止血,减缓患儿的失血量[4]。

在行脾脏外伤后的非手术治疗时,应遵循适应症:入院时患者生命体平稳,且血流动力稳定,患者轻度休克,在输血、补液后有逐渐改善的,患者身体血红蛋白、血压具有改善症状。在恢复后维持稳定,且无持续失血征兆。在身体检查、辅检查中,并未发现有腹部其他器官严重受损,不需要行手术治疗。医院监护设备齐全,可对患者的各项生命体征做监测,采取相应的检测,可对患者提供明确依据。

目前行非手术治疗成为临床的首要选择,在患者受伤轻微,且生命体征皆显示正常的情况下,选择非手术治疗,可有效减少患者并发症情况,提高患者治疗有效率。手术治疗创伤大,术后并发症较多,对患者身体健康会造成严重的影响。且行脾摘除术后,比普通人感染率高出50~60倍,对患者而生命安全构成严重的威胁。采取非手术保守治疗是最为安全的治疗方法,且患者满意度较高。从本次研究中可见,在患者各项身体指标显示正常的情况下,使用非手术治疗,获得了家属的一致认可,在治疗5个月后,大部分患者皆恢复正常,且身体未留下健康隐患。

【参考文献】

[1]夏德铭.非手术治疗外伤性脾破裂22例体会[J].医学信息,2012,25(4):247-248.

[2]梁峭嵘,张惠琴,梁彤,等.超声造影在肝脾外伤非手术治疗中的作用[J].中国超声医学杂志,2009,25(10):971-973.

测量生命体征的方法范文8

【关键词】 急性胰腺炎;降钙素元水平;并发感染;诊断价值

急性胰腺炎是一种炎症反应, 受到多种病因影响, 胰酶激活之后导致胰腺组织自身出现水肿、消化、出血或者坏死症状, 具有病情危重的特点, 继发性感染患者易出现感染性休克以及器官功能障碍等症状, 病死率较高。急性胰腺炎并发感染是导致频繁发生并发症、提高死亡率以及造成胰腺炎病程迁延的主要因素[1]。作者选取河南省濮阳市人民医院收治的52例急性胰腺炎患者作为研究对象, 对降钙素元水平在急性胰腺炎并发感染中的诊断价值进行了解, 具体报告如下。

1 资料与方法

1. 1 一般资料 选取本院2011年8月~2012年12月收治的52例急性胰腺炎患者作为研究对象, 随机分为A组和B组, A组患者均为感染患者, B组患者均为未感染患者, 各26例。A组:男15例, 女11例, 年龄22~75岁, 平均年龄(47.6±1.21)岁;B组:男17例, 女9例, 年龄23~77岁, 平均年龄(48.2±1.23)岁。两组患者在性别、年龄以及病程等资料方面差异无统计学意义(P>0.05), 具有可比性。对两组患者的生命体征以及检测指标进行观察对比。

1. 2 急性胰腺炎并发感染的诊断标准 患者上腹部超过两个象限存在腹膜刺激征, 患者体温高于38℃, 且白细胞>20×109/L;运用CT对患者胰腺或者胰腺周围的坏死组织进行检查, 检查其是否出现小的、不规则气泡;运用CT或者B超进行引导, 将患者的坏死组织吸取出来作为涂片, 进行细菌培养, 如结果为阳性, 则表明患者出现并发感染。

1. 3 方法 根据急性胰腺炎并发感染诊断标准, 确诊患者为急性胰腺炎后, 从患者静脉中抽取2 ml静脉血作为标本, 对血清降钙素元水平进行检测;另外, 对患者白细胞、C反应蛋白进行检查, 对患者急性生理、体温以及慢性健康标准评分等指标进行准确监测;运用双抗夹心免疫发光法对患者血清降钙素原水平进行测定, 运用电脉法测定C反应蛋白。

1. 4 统计学方法 采用SPSS17.0软件进行数据的统计与分析, 计量资料采用t检验, 组间比较采用χ2检验, P

2 结果

两组患者的各项检测指标对比:对两组患者的体温、白细胞、C反应蛋白、血清降钙素原水平以及急性生理及慢性健康标准评分进行对比, A组患者的血清降钙素原水平明显高于B组患者, 差异具有统计学意义(P0.05, 见表1)。

3 讨论

急性胰腺炎是外科中比较常见的急腹症, 其主要由于患者胰腺血液供应缺乏、胰管阻塞或者胰管内压增高等因素影响, 出现的一种胰腺急性炎症, 其具有并发症发生率高以及病死率高的特点, 主要伴有腹胀、腹痛、恶心、压痛、呕吐、腰肌紧张、血淀粉酶升高、尿淀粉酶升高以及肠鸣音不断减弱等临床症状, 超过一半的患者易出现胆道疾病并发症[2]。为有效降低病死率, 需要降低急性胰腺炎患者器官功能的衰竭率以及后期感染率。

如急性胰腺炎患者出现并发感染, 且器官朝衰竭情况发展, 那么患者死亡率将会超过50%。因此, 需要对急性胰腺炎并发患者采取积极、有效措施进行治疗, 以便能够增加患者寿命期限, 提升患者生活质量。结果表明, 对急性胰腺炎患者是否出现并发感染进行提前判断是十分重要的, 能够有效增强患者治疗效果[3]。在临床上, 如急性胰腺炎患者并发感染, 对其运用血浆降钙素原水平进行检测, 能够准确掌握患者体内含有的分子量糖蛋白以及氨基酸成分含量, 如患者在治疗期间出现感染, 患者的甲状腺C细胞与外周血水平数值较高, 进而能够准确确诊患者症状。急性胰腺炎并发感染患者与未并发感染患者的生命体征与检测指标无显著差异, 对患者病症情况运用普通检测法不能保证检测、确诊结果的准确性, 容易提高患者器官衰竭率和死亡率。在本组研究中, 对所有患者运用降钙素原水平进行检测, 并对患者生命体征、血浆、血清进行检测, 差异具有统计学意义(P0.05), 表明对急性胰腺炎并发症感染患者进行判断时, 对血清降钙素原水平指标进行判断效果高于其他检测指标。

综上所述, 在临床上运用降钙素原水平对急性胰腺炎并发感染患者病情进行判断, 具有较高应用价值, 值得推广。

参考文献

[1] 曾珠.降钙素原在急性胰腺炎并发感染中的应用价值.华南国防医学杂志, 2011,25(1):73-74.

测量生命体征的方法范文9

关键词:计算机应用;中文信息处理;生物信息学;文本挖掘;信息抽取;机器学习

中图分类号:TP391 文献标识码:A

1 引言

当前,生物医学领域的研究正在飞速发展,大量的生物医学知识以非结构化的形式存在于各种形式的文本文件中。国际上生物医学领域的权威数据库MEDLINE(Medical Literature Analysis and Retrieval System Online)的文献总数目前已达到1600万篇,近年来年均发表文献超过60万篇。如何才能有效地利用这些文本中所蕴含的生物医学知识无疑对分析海量的生物医学数据是非常重要的。常用方法是通过关键词在MEDUNE中或者互联网上进行检索,但是这只能从大量文档集合中找到与用户需求相关的文件列表,而不能从文本中直接获取用户感兴趣的事实信息。因此,提供从大规模生物医学文献中自动获取相关知识的有效工具是一项迫在眉睫的任务。

文本挖掘技术在文本知识自动获取中起到了重要作用。文本挖掘通常包括信息检索、信息抽取、数据挖掘三个步骤。其中信息检索(Information Retrieval,IR)用于识别相关文本,信息抽取(Information Extraction,IE)用于识别实体、关系、事件等信息,数据挖掘(Data Mining,DM)则从结构化信息中识别出相互间的关联。生物医学文本挖掘的研究重点主要由信息抽取和数据挖掘两方面的研究组成。具体来说,包括生物医学领域命名实体识别、同义词和缩写词识别、关系抽取、利用推理进行关系抽取的假设生成、文本分类以及上述工作的集成框架等。该领域研究的主要方法是通用的机器学习方法、领域知识、面向任务的前处理和后处理技术的相互结合。

文本挖掘在生物医学领域中的应用,可以提高生物医学信息建设和管理的效率。生物医学数据库的建设是最早推动生物医学文本挖掘的动力。通过信息抽取技术可以建设以疾病诊断、药物设计为目的的专用蛋白质作用关系数据库。例如建设特定疾病如乳腺癌、老年痴呆症的蛋白质作用关系相关数据库。通过数据库描述的蛋白质作用网络,将极大地有利于疾病诊断、药物设计,促进相关生物医学研究的进展。近年来文本挖掘技术在生物医学领域中的应用多是通过挖掘文本发现生物学规律,例如基因、蛋白质及其相互作用的关系,进而对大型生物医学数据库进行自动注释。例如:现有研究成果已经可以对蛋白质数据库加注功能关键词,并利用这项功能发现大分子问的相互作用关系。使用标准词汇对实验数据统一标注,架起了生物医学文献与生物医学实验数据的桥梁。借助生物医学文本挖掘技术进行数据标注的方法,广泛应用在功能基因组学数据上。经过人手工核对,正确的标注信息将赋予实验数据,有效的文献信息也将作为标注依据链接到实验数据。

生物医学文本挖掘的更大意义在于可以通过对文本分析研究帮助人们发现在文本中隐含的知识,从文献中挖掘出来实验假设和实验建议,以便生物学家验证得到新的科学发现,从而提高人们对生物医学现象的认识。例如,运用分子生物学文献的信息抽取技术来分析海量的生物医学数据,可以帮助分子生物医学专业人员理解分子生物学实验数据,研究分析实验结果。

生物医学文本挖掘是生物信息学研究的分支之一,是生物学研究中不可缺少的环节,它汇集着具有不同专业背景研究者的共同努力,推动和促进了生物医学的发展,对实现疾病的辅助诊断、预防和治疗,新药的辅助发现等起到了重要的作用,为人类对生命的探索做出了重要贡献。生物医学为文本挖掘技术提供了大量的验证数据,对文本挖掘技术起到了反推动作用。这是一种跨学科性研究,涉及到自然语言处理、机器学习、生物信息学等方面的技术,非常具有挑战性。目前,该研究领域吸引了来自计算语言学、生物信息学、机器学习等方面研究者的广泛关注,本文侧重介绍生物医学命名实体识别、缩写词和同义词识别、生物医学实体关系抽取、建立相关资源以及技术评测等。

2 命名实体识别

生物医学文本挖掘的基本任务之一是生物医学命名实体识别(Biomedical Named:Entity Recognition,Biomedical NER),其目的是从生物医学文本集合中识别出指定类型的名称,如蛋白质、基因、核糖核酸、脱氧核糖核酸等。这是进一步抽取关系和其他潜在信息的关键步骤。

生物医学领域的命名实体具有如下特点:新的命名实体不断出现,目前并不存在一个完整的包含各种类型的生物医学领域命名实体的词典,所以简单的文本匹配算法已经失去了作用;很多生物医学命名实体都是多词短语,有些有前置修饰语,例如:activated B cell lines,有些名称很长,例如:47kDa steroI regulatory element binding factor,这些特点给确定命名实体的边界带来了很大的困难;相同的词或者短语可以表示不同类别的生物医学命名实体,要依据上下文才能推断出来,例如:IL-2既表示蛋白质名称,又表示DNA名称;很多生物医学命名实体拥有多个不同的书写形式,例如:N-acetyl-cysreine,N-acetylcysteine,NAcetylCysteine等表示同一命名实体;很多生物医学命名实体是用“and”或者“or”连接的并列结构,它们共享同一个中心名词,例如:91 and 84 kDa proteins,这样的命名实体也很难正确识别;生物医学命名实体还存在着嵌套现象,例如:<PROTEIN><DNA>kappa 3</DNA>binding factor</PROTEIN>,因此还要解决候选命名实体的重叠问题;缩写词占有较高的比例,例如:IFN,TPA等等。很多缩写词的形成是没有规律可言的,并且缩写词还具有高度的歧义性,一般情况下,扩展形式比缩写词形式有更多的证据确定它的类别,缩写词形式和它的扩展形式相比更难分类。总之缩写词的识别很大程度上依赖于上下文,而不能依赖于现存的生物词典。因此,生物医学命名实体识别是富有挑战性的一项研究。

目前,生物医学命名实体识别的方法分为以下 三类:基于启发式规则的方法,基于字典的方法和基于机器学习的方法。基于规则的方法需要耗费大量人力建立识别规则库,而基于字典的方法存在着名称冲突和覆盖率受限的不足。目前研究的重点主要是基于机器学习的方法。

机器学习方法是从样例数据集合中统计出相关特征和参数,以此建立识别模型。目前已经有很多机器学习方法应用到生物医学命名实体识别当中,如贝叶斯模型、隐马尔可夫模型(HMM)、支持向量机(SVM)、条件随机场(CRFs)、最大熵(ME)等。基于机器学习的方法依赖于大量的标注语料,因此所面临的问题是如何获得廉价的大量训练数据。

支持向量机方法是一种比较有效的学习方法,已经成功应用到自然语言处理的多项任务中。Ka-zama等应用支持向量机来识别生物医学命名实体并使用GENIA语料作为训练语料。Lee等提出了一种基于支持向量机和查找字典的两阶段生物医学命名实体识别的方法,在第一阶段,使用SVM分类器识别命名实体并且用简单的字典查找作为后期处理来校正由SVM模型识别带来的错误;在第二阶段,把识别后的命名实体用SVM划分成语义类。该方法把任务划分成以上两个子任务,能够针对每一个任务选择更相关的特征,选择更为合适的分类方法,减轻了不平衡的类分配问题所产生的影响,提高了整体任务识别的精确率。AbGene系统是比较成功的生物医学命名实体识别系统之一,曾被多个研究者作为命名实体识别组件用于关系抽取研究当中。该系统使用7 000个手工标注命名实体类别的句子作为贝叶斯模型的训练语料,并采用手工统计规则作为后处理,同时使用命名实体所在的上下文来帮助校正识别错误。该系统达到了85.7%的精确率和66.7%的召回率。Chang等设计的GAPSCORE系统考虑到单词的出现次数、词形和上下文并以此为句子中每个词分配一个得分,然后使用基于词形和上下文等特征来训练N-gram模型,具有高分的单词更可能是基因和蛋白质名称。Zhou等人使用基于丰富特征集合的方法训练隐马尔可夫模型,他们在GENIA语料上获得了66.5%的精确率和66.6%的召回率。Yi-Feng Lin等使用基于特征的最大熵模型并结合后处理过程,在分类为23个实体类别的genia语料上获得了72.9%的精确率和71.1%的召回率。Tzong-hanTsai等使用条件随机域模型结合丰富的特征集合和后处理过程在BIONLP2004测试语料上获得了69.1%的精确率和71.3%的召回率。

近两年来,生物医学领域命名实体识别的研究不断扩展和深入。一是命名实体识别扩展到新的语义类型,如临床术语、化学名词语义类等。二是各种新方法的应用,如自动构建训练语料的bootstrapping方法,多分类器结果的重新排序(reranking)方法等。此外还有嵌套命名实体识别。

目前性能最好的生物医学领域NER系统的F测度已经达到80%以上,但与通用领域NER结果(90%以上)还存在一定差距,还需要研究人员的进一步努力。

3 缩写词和同义词的识别

很多生物医学命名实体存在多个名称和缩写形式,因此必须有效地识别这些同义词和缩写词,目前大部分研究工作都集中在未登录的基因名同义词和命名实体缩写词的识别上。

抽取生物医学命名实体缩写词及其全称形式,所用方法依赖于全称和缩写词的接近程度。一般而言,全称或者缩写词通常在括号里,因此,识别缩写词被简化为寻找最佳的缩写词和对应全称的对齐过程,这样的对齐过程在很大程度上依赖于上下文。

大部分缩写词的识别方法属于以下三种方法之一:首字母匹配法、首字母和其他字母匹配法、特定模式匹配法。首字母匹配法最简单,即匹配缩写词每一个字母和周围文本中若干词的首字母。第二种方法是放宽条件,即允许匹配首字母之外的其他字母,这种方法一般使用启发式规则进行识别。第三种方法是识别那些后面还添加一定模式的缩写词,这也需要手工建立一些规则。

Liu和Friedman在大量MEDLINE文本中统计缩写词和全称的搭配,以此作为规则来检测缩写词与全称的配对,取得了96.3%的精确率和88.5%的召回率。在应用手工规则识别缩写词和全称的研究中,Yu等获得了95%的精确率和70%的召回率,Schwartz和Hearst在1000篇MEDLINE摘要的集合上识别与酵母有关的缩写词,获得了96%的精确率和82%的召回率。Chang使用缩写词特征训练逻辑回归模型,并且用这些特征评价缩写词的候选全称形式,在Medstract语料上获得了80%的精确率和83%的召回率。就目前识别精度来看,在单篇文章中自动识别生物医学缩写词和相应全称的问题已经基本解决,上述识别系统都取得了较高的精确率和召回率。今后的研究将把缩写词识别与其他文本挖掘任务结合,并应用到实际的生物医学文本挖掘系统当中。

同义词识别是建立一个能自动更新的同义词词表的基础,具有重要的应用价值。虽然从在线数据库中能获得基因名称的同义词列表,但这些数据库中多数为基因的正式名称,因此相对于文献中的实际基因名称,其数据并不完整。为了建立出现在文献中有代表性的基因和蛋白质名称同义词列表,需要从生物医学文本中自动抽取基因和蛋白质名称同义词。

Yu等人结合了AbGene基因命名实体识别系统,采用统计方法、基于支持向量机的分类器、基于自动生成模式和手工生成规则等算法相结合,同义词识别的召回率为80%,精确率为9%。Cohen采用自动模式抽取方法对MEDLINE摘要进行同义词抽取,通过分析同义词共现网络结构选取最佳同义词模式,获得的精确率为23%,召回率为21%,该系统可以根据文本中出现的词间的明确逻辑关系来推断它们是否为同义词,与没有类似推断的系统相比,召回率提高了10%。

基因和蛋白质名称的同义词抽取研究结果的精度普遍还较低,因此更具挑战性。目前,一种新的基因蛋白质名称的标准化工作正在开展,其研究步骤是首先进行基因和蛋白质名称的识别,然后再进行基因名称的规范化(Gene Name Normalization)。此外,使用Ontology方法用于同义词识别也是最新的研究趋势。

4 关系抽取

生物医学文本中关系抽取的目的是从多个给定类型的命名实体如基因、蛋白质和药物名称等当中检测是否存在预先指定类型的关系,如蛋白质之间的抑制关系,实体之间的从属关系等。大多数生物医学命名实体关系抽取系统主要抽取特定命名实体之间的二元关系,即两类命名实体之间的关系。

生物医学文本中的关系抽取还存在相当的困难,主要原因包括:文本中陈述同一事实有多种不同的陈述方式;文本中并不仅仅是简单的语法类型; 文本中包括很多未登录命名实体;关系信息存在于多个句子之中;存在很多不能抽取出任何关系信息的句子。

目前生物医学领域命名实体关系的抽取主要使用了以下方法:共现方法、关键词方法、机器学习方法和自然语言处理方法。

共现方法认为离得越近的命名实体越可能相关,越经常一起出现的命名实体越可能相关。PubGene系统使用共现方法建立了一个包含基因和基因交互关系的数据库,实验结果达到了60%的精确率和51%的召回率。当仅考虑出现在5篇或5篇以上文章中的基因对关系时,精确率上升到72%。还有研究者在同一个短语中或者同一个句子中查找共现的基因对。Ding等做了一项全面的量化研究实验,发现用共现方法识别关系在同一摘要中得到的精确率为57%,召回率为100%;而在同一句子中精确率为64%,召回率为85%;在同一短语中精确率为74%,召回率为62%。

为了识别关系的类型,识别算法必须检验相关的信息。一种简单的推断方法是识别那些可以区分特定类型关系的关键词或者短语,这就是关键词方法,其具体应用是使用词模式。在此方法中,研究者给出了一些生物医学命名实体模式和区分特定类型关系的常用词。这些模式通常比较简单,不需要更多的词性信息或者复杂的语义信息,如<protein A><action><proteinB>,这里的<action>是由14个词及其变体组成的词表;Ono等的方法中则使用了20个模式。

在基于机器学习方法的关系识别中,把句子中的关系共现表示成向量空间模型,然后使用分类器给句子中可能存在的关系打分。Eskin和Agichtein使用SVM算法和基因序列kernel来预测蛋白质在细胞质中的位置,其性能达到87%的精确率和71%的召回率;而预测蛋白质在过氧化物酶体中的位置,其精确率为44%,召回率为21%。JuanXiao等使用基于特征的最大熵模型识别蛋白质的交互作用关系(Protein-Protein Interaction,PPI)获得了88.0%的精确率和93.9%的召回率。Ameet SoniC343使用条件随机域模型识别PPI并和基于规则的系统作了对比,实验证明基于CRFs的系统比基于规则的系统识别性能有很大的提高。

用于关系抽取的自然处理方法一般要使用领域Ontology和句法结构分析。简单的方法可以只考虑词性,如在识别蛋白质和蛋白质的关系中,句子中的蛋白质名称都必须是名词。Thomas等仅使用词性作为是否存在关系的评分标准。句法分析器是生物医学文本中进行关系抽取的有利工具。如使用浅层句法分析器(Shallow Parser)确定已知动词的主语和宾语,使用完全句法分析器(Full Parser)确定句子中所有组成部分的关系。Park等使用句法分析器,使关系抽取结果达到了80%的精确率和48%的召回率。Zhongmin Shi等使用统计句法分析技术同时识别生物医学命名实体及其间的功能关系,通过使用有噪音标注数据的半指导学习方法获得了83.2%的F测度值。

Stephens等提出了使用向量空间模型从文本中识别基因对关系及其共现强度的方法,使用了TF-IDF计算公式和用户定义的阈值来挖掘命名实体之间的关系。文献中提出一种无指导的关系抽取方法,该方法使用了类似于互联网页面重要性评价HITS算法的思想,称为基于图的交互增强方法。

5 语料库建设和领域本体知识库

统计机器学习方法需要大量的已标注文本数据作为学习器的训练语料,所以,生物医学文献语料库的标注成为相关研究的基础。生物医学文本标注的内容主要包括命名实体、命名实体关系。目前国际上可以公开获取的生物医学文本挖掘的标注语料库有:GENIA语料库、GENETAG语料库(也是BioCreAtlve Task 1A的评测语料)、Medstract语料库、Yapex语料库、Protein Design Group(PDG)语料库和University of Wisconsin语料库等。表1中列出了每个语料的发行时间,语料内容的切分单位(以句子或摘要为单位),语料的大小(以词为单位)。表2中列出了各个语料可以应用的文本挖掘任务。

GENIA语料库是标注规模最大、语义分类最多、应用最广泛的标注语料库。该语料库标注包括词切分、句子切分、词性标注。语料中标注了关于人类血细胞转录因子领域的基因和基因产物命名实体,由2000篇MEDLINE摘要组成,共有18545个句子,39373个命名实体,36个语义类。它也是JNLPBA语料库的母语料库。需要指出的是:PDG和Wisconsin语料库中只列出所包含的命名实体,但没有指出所在文本中的位置,无法实现正确的评价,因此较难应用于一般的命名实体识别任务。Medstraet是这些语料中唯一有指代消解标注的,并且给出了缩写词的扩展形式。

上述语料库的原始语料皆出自国际权威的生物医学数据库MEDLINE,信息检索和文本挖掘研究主要集中在该数据库上。MEDLINE中生物医学文献数量目前已超过1 600万篇文献,其中超过300万篇文献是近5年内出版的。美国国立医学图书馆的Entrez-PubMed提供了免费的MEDLINE检索服务,是世界最著名和使用最广泛的MEDLINE网上检索系统,于1995年7月推出,已经成为科研人员获取医学文献信息的首选。PubMed提供了主题词检索和自由词检索。

MeSH(Medical Subject Headings)是美国国家医学图书馆(NLM)用以分析生物医学期刊文献等资源的主题内容的控制语汇表,也是NLM出版的MEDLINE数据库主题检索的索引词典。MeSH由22 995个主标题(Descriptors,main headings)组成,分为15个层次。MeSH主标题层级结构安排的目的是为信息检索提供服务。生物信息学中最具有权威性的本体论是基因本体论(Gene Ontology,GO),由基因本体论协会建立。其目标是建立一套结构化的、精确定义的、通用的控制性词汇,使其在任何生物体内都能描述基因和基因的产物所表现的角色。GO构建了3个相对独立的本体,即生物过程(Biological Process)、分子功能(Molecular Function)和细胞成分(Cell),它们是基因和基因产物的所有属性。

6 评测会议和相关学术会议

文本信息处理技术的评价通常包含两个部分:标准的评测数据集和评价标准。标准评测数据集一般由领域专家通过手工标注相关文本来获得,这样的数据集通常称为金标准(Golden Standard)。其中比较流行的金标准语料库是GENIA语料库。将 自动识别结果与标准数据集相比较,就可以评价某个文本挖掘技术目前所达到的水平。

生物医学文本挖掘评价标准与通常的文本挖掘评价标准类似,也是由精确率(Precision),召回率(Recall)和F测度(F-score)来评价的。

近年来出现了很多公开评测生物医学文本挖掘算法的国际会议,对本领域研究的发展起到了重要推动作用。表3列出了当前国际上主要的评测会议。

在近年来举行的竞赛和评测中,最有影响力的是TREC Genomics Track,该评测由美国国家技术标准局(National Institute of Standards andTechnology)支持。Genomics Track从2003年开始,以后每年一次,评测任务主要为分子生物学领域的文本检索和分类。2004年有29个研究组参加,2005年有41个研究组参加。我国大陆有复旦大学、清华大学、大连大学等几家单位先后参加这两届评测。

JNLPBA/BioNLP 2004(Joint Workshop onNatural Language Processing in Biomedicine andits Applications)评测是与国际计算语言学会议同时召开的研讨会,其主要评测任务是生物医学命名实体识别,共有八个参赛系统参加评测。BioNLP 2007的评测任务是临床医学文本多标记分类,共有50个参赛系统参加评测。BioCreAtlve(Critical AssEssment of Information Extractionsystems in Biology)也是一个重要的生物医学文本挖掘评测会议,由西班牙国家癌症研究中心CNIO、美国MITRE公司、美国生物技术信息中心NCBI等5个机构负责组织。该评测包括两个任务:其一是识别文本中的基因和蛋白质名称,除了识别命名实体外,各参评系统还要识别出这些命名实体的同义词;其二是用GeneOntology codes注释蛋白质,识别出蛋白质的功能。目前该评测已经举行了两届,2004年评测包括多种文本挖掘任务,共有10个国家的27个研究组参加了此次评测。2006年评测的总结会议在ACL2007上进行。

KDD(Knowledge Discovery and Data Mining)挑战杯是一个公开评测数据挖掘算法的竞赛。尽管KDD的传统任务既和文本无关也和生物医学领域应用无关,但是从2002年已经开始了生物医学文本挖掘任务的评测,这也是最早的关于生物医学文本挖掘的评测。KDD竞赛包括两部分:第一部分是识别基因功能;第二部分是预测基因对信号传输路径的影响。第二个任务可以作为一个统计分类问题来处理,其中涉及到基因功能信息、蛋白质定位以及蛋白质交互等。参赛者所建立的系统用来帮助FlyBase数据库管理。

生物医学文本挖掘是一个跨学科的交叉领域,自然语言处理、生物信息学、机器学习领域都召开了关于这个主题的学术研讨会(Workshop),在自然语言处理领域已经发展成为一个相对独立的研究分支。表4给出了各领域中相关学术会议情况。2000年以来,国际计算语言学界的两个主要学术会议ACL(Annual Meeting of the Association for Computational Linguistics)和COLING(InternationalConference on Computational Linguistics)的每届会议都有相关文章发表;从2003年起,每届会议均设有一个相关主题研讨会(Workshop)。生物信息学领域与生物医学文本挖掘相关的学术会议主要有从1996年开始每年一月在夏威夷举行的Pacific Symposium on Biocomputing(PSB)会议和始于1993年Intelligent Systems in MolecularBiology(ISMB)年度会议。从PSB2000开始,该会议几乎每届都把文本挖掘作为会议主题之一;PSB2007则提出了“New Frontiers in BiomedicalText Mining”的主题。和PSB差不多同时,ISMB也在每届会议发表了这方面的文章,并且近几年把文本挖掘和信息抽取列为会议主题之一。国际生物信息学杂志Bioinformatics近年来开辟了数据和文本挖掘专栏,每期均有此类文章发表。

国际机器学习研究领域也对生物医学文本挖掘表现了很大兴趣,2005年国际机器学会ICML(International Conference on Machine Learning)的一个Workshop是LLL05(Learning Language inLogic),其主题为:Challenge task:Extracting Relations from Bio-medieal Texts。会议为关系抽取提供了训练和测试语料、评测程序,有5个国家的6个研究小组参加了评测。

7 国内相关研究

目前国内在生物医学文本挖掘领域的研究相对还比较少,主要有清华大学和哈尔滨工业大学,均取得了一定成果。清华大学研究者在蛋白质关系抽取方面做了深入研究,其主要工作包括:基于动态规划算法的模式匹配方法,用于抽取蛋白质交互作用关系,取得了80%的召回率和精确率;在此基础上采用最小描述长度原理进行模式优化,进一步提高了抽取精度。他们还将模式匹配与浅层句法分析结合起来,通过句法和语义约束,很好地识别了生物医学文本中的同位和并列句,将原模式匹配方法的精确率和F测度提高了7%。哈工大研究人员主要致力于生物医学命名实体识别和关系的识别的研究,先后尝试了多种机器学习方法。先后应用SVM算法、Generalized Winnow、CRF等方法进行命名实体识别,在实现中选择了丰富特征并结合后处理过程,在相同测试集上取得了优于国际同类研究的结果。目前,他们在综合多种统计学习方法进行多分类器融合的研究上取得了一定的成果,进一步提高了生物医学命名实体识别的精确率和召回率。在关系识别的研究上主要应用基于特征的机器学习方法并取得了一定的成果。

8 结论与展望