《计算机科学》-2005年第04期目录-好期刊

计算机科学 2005年第04期杂志文档列表

计算机科学杂志人工智能与图像处理技术

19-21

决策表分析的统计依据

作者：魏玲; 张文修单位：西北大学数学系; 西安; 710069; 西安交通大学理学院; 西安; 710049; 西安交通大学理学院; 西安; 710049

摘要：给出了决策表的条件属性约简的非参数统计检验方法.首先,给出与决策表相应的列联表,进行条件属性与决策属性间相关性的显著性检验,在一定的显著性水平上,依据相关性显著与否,来判别该属性相对于决策行为是否冗余,从而获得属性约简;进而,采用Lambda系数对与决策属性显著相关的属性进行相关性度量,说明用条件属性对决策属性进行预测将消减误差的比例.并在列联表的基础上,获得决策表的一级规则.病例决策表的实验表明,该方法简单,有效.

22-23

复杂信息系统分布式决策融合模型及应用研究

作者：魏守智; 赵海; 王刚; 张晓丹单位：东北大学信息科学与工程学院; 沈阳; 110004

摘要：针对复杂信息系统信源为涉及多个不同专业背景的多源异类、异构信息,融合过程必须将多个异构模型集成起来进行联合问题求解的特点,提出了一种新的复杂信息系统分布式层次化决策融合模型,实现了集成神经网络组与专家系统及改进的分布式D-S证据推理模型的融合、特定领域中理论及经验模型与上述模型的融合,改进的D-S证推理模型解决了当证据矛盾时导致错误结果的问题.油田剩余油分布及潜力预测的应用,表明提高了预测的精度和可靠性,为复杂融合系统的工程实现提供了重要的提示.

24-26

流数据近似统计算法研究

作者：聂国梁; 卢正鼎; 聂国栋单位：华中科技大学计算机科学与技术学院; 武汉; 430074; 山东省建行; 济南; 250012

摘要：流数据的统计是许多决策支持系统的关键所在.研究了流数据的分布特点,定义了评价函数F,设计了一种系统框架,扩展了指数级直方图,提出了松散性指数级直方图及其动态维护算法,基于滑动窗口技术解决了流数据的统计问题.该方案利用o(1/εlog2N)比特的空间,解决了流数据最近N个数据中值为1的个数统计问题,并保证相对误差不大于ε.理论和实践表明,F值越大,其优势越明显.

27-30

基于构造性覆盖算法的离群数据挖掘研究

作者：张旻; 张铃单位：解放军电子工程学院204研究室; 国家教育部安徽大学人工智能与信号处理重点实验室; 合肥; 230039; 国家教育部安徽大学人工智能与信号处理重点实验室; 合肥; 230039

摘要：本文提出一种通过构造覆盖领域进行离群点(outlier)挖掘的新方法.由于覆盖领域构造的特殊性,使得覆盖算法非常适合离群点的挖掘.在分析覆盖模型的基础上,给出了覆盖模型的离群点的定义和算法步骤.这样将复杂的离群点挖掘问题变成十分简单的覆盖领域样本分析问题,而且算法十分直观,并能很好地解释离群点的含义,同时适合对高维及海量数据的处理.本文给出实验例子,结果表明该方法是有效可行的.

31-33

基于排序FP-树的频繁模式高效挖掘算法

作者：秦亮曦; 李谦; 史忠植单位：中国科学院计算技术研究所智能信息处理重点实验室; 北京; 100080; 中国科学院研究生院; 北京; 100039; 广西大学计算机与信息工程学院; 南宁; 530004; 中国科学院研究生院; 北京; 100039; 中国科学院计算技术研究所智能信息处理重点实验室; 北京; 100080

摘要：FP-growth算法是目前较高效的频繁模式挖掘算法之一.在FP-growth算法中,FP-树及务件FP-树的构造和遍历占了算法绝大部分的时间,如果能减少这方面的时间,则有望进一步改善算法的效率.本文给出了一个频繁模式挖掘算法SFP-growth.算法通过将FP-树有序化及采用高效排序算法等措施来提高FP-树构造的效率,从而使算法达到较高的效率.实验结果表明,SFP-growth是一个高效的频繁模式挖掘算法,其性能优于Apriori、Eclat和FPgrowth算法.

34-36

一种基于前缀树的频繁模式挖掘算法

作者：朱光喜; 吴伟民; 阮幼林; 刘干单位：华中科技大学计算机科学与技术学院; 武汉; 430074

摘要：挖掘频繁模式是许多数据挖掘任务的关键步骤.基于FP-Tree的挖掘算法由于无须生成候选项集效率明显高于Apriori 类算法,但FP-Tree结构存在动态维护复杂、而且在挖掘过程中需要递归地创建大量的条件FP-Tree,时空效率不高.因此,本文提出一种基于前缀树的新算法.该算法通过引入一种新结构-前缀树(Prefix Tree)用来压缩存放数据所相关信息,并通过调整前缀树中节点信息和节点链直接在Prefix Tree上采用深度优先的策略挖掘频繁模式,而不需要任何附加的数据结构,从而大大提高了挖掘效率.

37-41

Web搜索中的数据挖掘技术研究

作者：耿桦; 李媛; 朱炜; 潘金贵单位：南京大学计算机软件新技术国家重点实验室; 南京大学多媒体技术研究所; 南京; 210093

摘要：WWW已经成为世界上最大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点.Web挖掘也已经成为数据挖掘中相对成熟的一个分支.本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述.文章首先对目前流行的Web内容挖掘方面的常用技术进行了研究分析,然后着重研究了Web结构挖掘技术,介绍并评价了多种算法模型.接着介绍了用户使用的挖掘,并提出了Web内容挖掘技术,结构挖掘技术和用户使用挖掘相结合,应用于开发智能型搜索引擎的趋势.

42-44

基于Skowron分明矩阵的快速约简算法

作者：王元珍; 裴小兵单位：华中科技大学计算机学院数据库与多媒体研究所，武汉430074

摘要：属性约简是Rough集理论的核心内容之一,计算所有的属性约简已经被证明是NP完全问题.本文基于分而自治思想,在Skowron分明矩阵法的基础上,给出了最小析取范式的判定定理,从而提出了计算所有属性约简的算法.理论分析和实验结果表明,该约简算法在效率上较现有的算法有显著提高.

44-48

命名实体识别研究

作者：张晓艳; 王挺; 陈火旺单位：国防科技大学计算机学院; 长沙; 410073

摘要：命名实体识别是文本信息处理的重要基础,已经逐步成为自然语言处理的一项关键技术.其基于规则、统计、机器学习的研究方法及成果,都推动了自然语言处理研究的发展,促进了自然语言研究与应用的紧密结合.本文回顾了命名实体识别技术的发展过程,分析了主要的方法和技术,并展望了未来的发展趋势.

49-51

一种基于义素的网页信息项语义匹配方法研究

作者：卢正鼎; 张茂元单位：华中科技大学计算机科学与技术学院，武汉430074

摘要：本文提出了一种改进的基于语义的义素相似度,并从理论上分析参数β值的影响效果.在这个基础上,提出一种基于义素的词相似度,从语义上去匹配新名词和旧名词.在基于义素的词相似度基础上,提出一种网页信息项的语义匹配方法,来识别网页信息项的类别.实验结果表明,基于义素相似度的网页信息项语义匹配方法具有较好的匹配效果.

52-54

Visual Prolog的搜索控制机制分析

作者：雷英杰; 王宝树; 赵晔; 王涛单位：西安电子科技大学计算机学院; 西安; 710071; 空军工程大学导弹学院; 陕西三原; 713800; 西安电子科技大学计算机学院; 西安; 710071; 空军工程大学导弹学院; 陕西三原; 713800

摘要：回溯机制是逻辑程序设计的重要设施.回溯本身是一种获得目标所有可能解的良好方法.然而回溯也有副作用,一是它可能导致Visual Prolog给出多余的答案,而Visual Prolog自己不能区分实质上相同的两个解,因此会降低效率;二是尽管一个特殊的目标已被满足,但是回溯机制可能还会强迫Visual Prolog继续寻找另外的解,因此会增加系统开销.在这些情况下,必须仔细控制目标搜索求解的回溯过程.本文在揭示Visual Prolog回溯机制所存在问题的基础上,通过实例,对Visual Prolog的静态截断机制、失败谓词fail与否定谓词not等控制谓词,以及动态截断机制等所构成的完整的目标搜索求解控制机制进行了详细分析,从而揭示出回溯机制和搜索求解控制机制的本质特性及应用机理.

55-58

基于搜索空间划分的并行概念生成算法

作者：齐红; 刘大有; 胡成全; 卢明; 赵亮单位：吉林大学计算机科学与技术学院; 长春; 130012

摘要：概念格作为形式概念分析理论中的核心数据结构,在机器学习、数据挖掘和知识发现、信息检索等领域得到了广泛的应用.概念格的构造在其应用过程中是一个主要问题.本文提出了一种基于搜索空间划分的并行概念生成算法,它对整个闭包搜索空间进行划分,并引入一种有效的测试方法,只搜索那些能生成正规闭包的子搜索空间,从而有效提高搜索效率;同时,在计算闭包过程中保存一些必要的中间结果,用来提高闭包运算速度;由于所有子搜索空间相对独立,因此很容易得到一个并行的概念生成算法.

59-61

基于最小生成树的多序列联配算法

作者：胡桂武; 郑启伦; 彭宏; 邓伟林单位：华南理工大学计算机科学与工程学院; 广州; 510640; 广东商学院数学系; 广州; 51020; 华南理工大学计算机科学与工程学院; 广州; 510640; 广东职业技术学院计算机系; 广州; 510300

摘要：多序列联配(MAS)是现代生物信息学中的重要工具之一,MAS问题是NP-难的,因此需要一些启发式方法在合理的时间内联配大的数据集.本文提出了一个基于最小生成树的多序列联配算法,并使用BALiBASE标准数据集合,对我们的算法进行了性能评价,结果表明算法较之ClustalX类的算法其精确度更高.

62-63

基于自相合性的主曲线的特性分析与研究

作者：邵保军; 苗夺谦; 张红云; 唐庆适; 王真单位：同济大学计算机科学与工程系; 上海; 200092

摘要：主曲线是穿过数据云'中间'的满足自相合性质的光滑曲线,它是线性主成分的非线性推广.在本文中,基于主曲线的自相合条件,构造一个微分方程,通过求解这个微分方程,我们得到了环形均匀分布的主曲线;通过对实验结果的分析与研究,我们得出了一些有趣的结论.

64-66

基于聚类的核主成分分析在特征提取中的应用

作者：王和勇; 姚正安; 李磊单位：中山大学软件研究所; 广州; 510275; 中山大学数学与计算科学学院; 广州; 510275

摘要：本文分析了一般主成分分析在处理非线性问题上的不足,阐述了核主成分分析方法及其计算速度的缺陷,提出了基于聚类的核主成分分析方法.试验结果显示:基于聚类的核主成分分析方法具有好的特征提取性能,相比核主成分分析大大提高了特征提取的速度.

计算机科学杂志北大期刊 CSCD期刊 统计源期刊

基本信息

BASIC INFORMATION

计算机科学 2005年第04期杂志文档列表

计算机科学杂志北大期刊CSCD期刊统计源期刊

基本信息

BASIC INFORMATION

计算机科学 2005年第04期杂志 文档列表

计算机科学杂志北大期刊 CSCD期刊统计源期刊

计算机科学 2005年第04期杂志文档列表