日常的医学交流所使用的术语词汇广泛丰富、专业性强、容易混淆,同一种疾病可以有多种名称,同一个词汇会有多种含义,容易造成交流的障碍。这种情况不影响医务人员和病人之间的沟通,是因为说话人之间可通过更详细的解析和语言环境来加以判断,但对于计算机在医疗实践和科研中的应用却带来困难。因而必须把医学信息根据某一特性或特征进行归纳、区分,以及把医学信息的某种符号转换成便于计算机识别与处理的符号,才能让医学信息在各医学系统的交流上得到统一,信息方可共享和利用。因此,医学信息的分类和编码是其达到信息系统互联互通的重要基础。
信息分类
(一)信息分类的基本原则
分类是人的一种思维习惯,源于人类通过对事物特点属性的认识和理解而划分事物的一种方法。医学信息分类就是在医学上对疾病、诊断等事物或事件的区分,目的是使医学数据按一定的体系结构归类,以便于理解和使用,例如对心电图异常的分类、病人疾病诊断的分类等。信息分类应遵循如下原则:
1.科学性宜选择事物或概念(分类对象)最稳定的本质属性或特征作为分类的基础和依据。
2.系统性信息分类既要体现各种信息之间的区别,又要体现其相互间的内在联系。将选定的事物、概念的属性或特征按一定排列顺序予以系统化,并形成一个科学合理的分类体系。
3.可扩展性标准的制订要留有扩展、延拓的余地;通常要设置收容类目,以保证增加新的事物或概念时,不打乱已建立的分类体系,同时还应为下级信息管理系统在本分类体系的基础上进行进一步纵向延拓细化创造条件。
4.兼容性医疗信息系统是由若干分层和子系统构成的庞大系统,子系统间存在相互联系和信息共享,如病人基本资料和处方中都包含病人这一类信息。处方信息在对病人这一信息进行定义和再分类时需要和病人基本资料类信息兼容。
5.实用性考虑到医学上的实际应用需要,在信息的属性和特征中分类出符合现实需要、适合使用和便于操作的类别。
(二)分类的基本方法
1.线分类法(层级分类法、体系分类法)线分类法是将分类对象(即被划分的事物或概念)按所选定的若干个属性或特征逐次地分成相应的若干个层级的类目,并排成一个有层次的,逐渐展开的分类体系。在这个分类体系中,被划分的类目称为上位类,划分出的类目称为下位类,由一个类目直接划分出来的下一级各类目,彼此称为同位类,同位类类目之间存在着并列关系,下位类类目与上位类类目之间存在着隶属关系。
优点:层次性好,能较好地反映类目间的逻辑关系;使用方便,既符合手工处理信息的习惯,又便于计算机处理信息。
缺点:结构弹性较差,分类结构一经确定则不易改动;效率较低,当分类层次较多时,代码位数较长,影响数据处理的速度。
2.面分类法(组配分类法)面分类法是将所选定的分类对象的若干属性或特征视为若干个“面”,每个“面”中又可分成彼此独立的若干个类目。使用时,可根据需要将这些“面”中的类目组合在一起,形成一个复合类目。
优点:弹性大,面之间的属性内容和数量有变化也不会影响其他的面,适应性强、易于修改。
缺点:不能充分利用信息,需手工来组成信息类目,使用比较困难。
3.混合分类法混合分类法是将线分类法和面分类法组合使用,以其中一种分类法为主,另一种做补充的信息分类方法,这种分类方法常用于药品的分类。
信息编码
信息编码是将编码对象转换成有一定规律性、易于计算机和人识别与处理的符号体系的过程。转换得出的符号体系称为代码。代码可以是文字、字母、数字、图形或颜色等。
(一)编码的基本原则
1.唯一性虽然一个编码对象可以有很多不同的名称,也可按各种不同方式对其进行描述,但在一个分类编码标准中,每一个编码对象有且仅有一个代码,一个代码只唯一表示一个编码对象。
2.合理性代码的结构要与分类体系相适应。
3.可扩充性必须留有适量的后备容量,以便适应日后更新扩充的需要。
4.简单性代码结构应尽量简短,以便节省存贮空间、减少代码的差错率和提高机器处理的效率。
5.适用性代码要尽可能反映编码对象的特点,有助记忆,便于填写。
6.规范性在一个信息分类编码标准中,代码的类型、结构以及编写格式必须统一。
(二)信息编码基本方法
编码方法应以预定的应用需求和编码对象性质为基础,选择适当的代码结构。决定代码结构的过程中,既要考虑各种代码的编码规则和优缺点,还要分析代码的一般性特征,选取合适的代码表现形式,研究代码设计所涉及的各种因素,避免潜在的不良后果。
1.顺序码从一个有序的字符集合中顺序地取出字符分配给各个编码对象。这些字符通常是自然数的整数,如以“1”打头;也可以是字母字符,如AAA、AAB、AAC等。顺序码一般作为以标志或参照为目的的独立代码来使用,或者作为复合代码的一部分来使用,后一种情况经常附加分类代码。在码位固定的数字字段中,应使用零填满字段的位数直到满足码位的要求。顺序码有3种类型:递增顺序码、分组顺序码、约定顺序码。
(1)递增顺序码:编码对象被赋予的代码值可由预定数字递增决定。例如,预定数字可以是1(纯递增型),或者是10(只有10的倍数可以赋值),又或是其他数字(如偶数情况下的2)等。用这种方法的代码值不带有任何含义。使用这种编码方法后,一旦以后需要对原始代码集进行修改,则可能需要使用中间的代码值,这些中间代码值的赋值根据不必按1递增。
(2)系列(分组)顺序码:这种代码首先要确定编码对象的类别,按类别确定它们的代码取值范围,然后在各类别代码取值范围内对编码对象顺序地赋予代码值。分组顺序码只有在类别稳定并且每一具体编码对象在目前或可预见的将来不可能属于不同类别的条件下才能使用。
(3)约定顺序码:约定顺序码不是纯顺序码,这种代码只能在全部编码对象都预先知道并且编码对象集合将不会扩展的条件下才能顺利使用。在赋予代码值前,编码对象应按某些特性进行排列,如依名称的字母顺序排序,按(事件、活动的)年代顺序排序等。这样得到的顺序再用代码值表达,而这些代码值本身也应是从有序的列表中顺序选出的。
2.无序码无序码是将无序的自然数或字母赋予编码对象。此种代码无任何编写规律,是靠机器的随机程序编写的。无序码既可用作编码对象的自身标志,又可作为复合代码的组成部分(复合代码的其他部分则以其他编码规则为基础)。
3.缩写码这种代码的本质特性是依据统一的方法缩写编码对象的名称,由取自编码对象名称中的一个或多个字符赋值成编码表示,缩写码能有效用于那些相当稳定,并且编码对象的名称在用户环境中已是人所共知的有限标志代码集。
4.层次码层次码以编码对象集合中的层级分类为基础,将编码对象编码成为连续且递增的组(类)。位于较高层级上的每一个组(类)都包含并且只能包含它下面较低层级全部的组(类)。这种代码类型以每个层级上编码对象特性之间的差异为编码基础。每个层级上特性必须互不相容。细分至较低层级的层次码实际上是较高层级代码段和较低层级代码段的复合代码。
层次码通常用于分类的目的,层级数目的建立依赖于信息管理的需求。层次码非常适合于诸如统计目的、报告货物运转、基于学科的出版分类等情况。在实践中既有固定格式,也有可变格式,固定格式比可变格式更容易处理一些。
5.矩阵码矩阵码以复式记录表的实体为基础。赋予这个表中行和列的值用于构成表内相关坐标上编码对象的代码表示。这种方法的目的是对矩阵表中的编码对象赋予有含义的代码值,这些编码对象在不同的组合中具有若干共同特性。矩阵码可有效地用于标志那些具有良好结构和稳定特性的编码对象。
6.并置码并置码是由一些代码段组成的复合代码,这些代码段提供了描绘编码对象的特性。这些特性相互独立。这种方法的编码表达式可以是任意类型(顺序码、缩写码、无序码)的组合,非常适用于那些具有若干共同特性的商品分类应用。代码段可用于描绘性编码(何种产品、何时何地生产)或是用作开发制造业方面的成组技术方法。
7.组合码组合码也是由一些代码段组成的复合代码,这些代码段提供了编码对象的不同特性与并置码不同的是,这些特性相互依赖并且通常具有层次关联。组合码经常被用于标志目的,以覆盖宽泛的应用领域。例如身份证编码,整个18位组合码共分4段,前两个代码段标志了编码对象(公民)的空间和时间特性,第3个代码段则依赖于前两个代码段所限定的范围,第4个代码段依赖于前3个代码段赋值后的校验计算结果。
来源:医信局
图源:图虫创意
转载请注明:http://www.0431gb208.com/sjszlfa/3059.html