HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

近似数与有效数字集锦9篇

时间:2023-03-06 15:57:39

近似数与有效数字

近似数与有效数字范文1

与实际数字比较接近,但不完全符合的数称之为近似数。

对近似数,人们常需知道他的精确度。一个近似数的精确度通常有以下两种表述方式

用四舍五入法表述。一个近似数四舍五入到哪一位,就说这个近似数精确到哪一位。

另外还有进一和去尾两种方法。

近似数与有效数字范文2

【关键词】课程改革,有效性,有效的课堂

数学课程的课堂教学效率是对数学课程教学活动进行合理性评价的一项重要内容,这要求教师在教学过程中除了心中有教材,心中有学生,做到“有材、有人、有效”,在教学过程中彰显师生的互动,注重课堂的有效性。有效的课堂教学是兼顾知识的传授、情感的交流、智慧的培养和个性塑造的过程。有效的课堂教学重视教学过程的探索性,重视教学中的师生的交往与对话。本文拟围绕数学课程如何提高课堂教学策略进行初步探讨。

1.以生活实际为基础,把内容开放,创设有效的情境

开放教学内容,就是要创造性地应用教材,使教材走近学生,真正成为学生学习的有力依据。教师要善于把教材知识与学生的生活联系起来,挖掘学生身边蕴藏的许多熟悉、新奇有趣的生活数学为教学所用,寓数学知识于学生喜闻乐见的活动之中,让学生能用数学眼光去审视、分析、解答实际问题。例如,教学“年、月、日的认识”时,我设置了以下的教学环节:

师:老师想知道同学们最喜欢哪一天?并说说为什么。

生1:我最喜欢1990年的8月1日,因为那天刚好是我的生日。

生2:我最喜欢就是每年的六一儿童节,因为有得玩又有得吃。

生3:我最喜欢农历的一月一日,因为有“利是”可以拿。

生4:我喜欢2008年8月8日,因为奥运会在那天在北京举行。

师:哗,同学们原来喜欢这些日子呀,那其他同学有没有留意到他们都用了哪些时间单位?

生5:年、月、日(板书)

师:你们还从哪见过年、月、日?

生6:日历上。

生7:电视的新闻上。

生8:手机的显示屏上。

师:年、月、日在我们的生活中应用非常广泛,想不想更深入的了解有关知识?那今天我们就一起来学习年、月、日的有关知识。

在本环节的教学设计上,我从学生喜欢哪一天入手,“你最喜欢哪一天?”把教材与学生的生活联系起来,激起学生的兴趣,“留意同学在说的过程中都运用了数学的哪些时间单位?”“想不想更深入的了解有关知识?”这样的引入,能结合学生的实际情况,尊重学生的已有经验,激活学生的认知心理,引导学生根据已有的生活经验,概括出本节课的课题,简单、明了,引人入胜。

2.组织有效的课堂交流——有效的保证

注重数学交流,培养学生的数学交流能力,已经成为当今数学课程改革的一项重要内容,《数学课标》明确指出“数学教学是数学活动的教学,是师生之间、学生之间交往互动与共同发展的过程”,学生要交往、互动就必须通过“交流”这种学习模式,只有通过师生之间、生生之间的交流才能有序地展开数学活动的每一个环节,让互动成为实质,让活动得以落实。教师必须准确了解学生的学习现状,才能找准课堂教学法中引导学生交流的起点,一般情况下课堂交流可以是师生谈话式、分组讨论式、实践探究式。在教学“根据实际情况取商的近似值”时,我设计了如下的教学环节:

出示例12的(2)王阿姨用一根25米长的红丝带包装礼盒,每个礼盒要用1.5米长的丝带,这些丝带可以包装多少个礼盒?

师:这道题是怎样列式的?

生1: 25÷1.5=16.666……(个)

师:这道题应该结果等于多少?是不是还是用刚才我们学过的“进一法”取进似值?请同桌互相说说:

多媒体出示讨论提纲:

(1)这些红丝带到底可以包装几个礼盒?为什么?

(2)你能给这种取近似数的方法取个恰当的名字吗?)

……(学生讨论交流)

师:包装17个够吗?能不能刚才我们所用的取近似值的方法?哪个小组说说你是怎么想的?

生2:我认为这道题不能用“进一法”取近似值,因为结果有余数,说明有多余的丝带,但不够包装一个,所以只能包装16个。

师:有别的说法吗?

生3:我们小组也认为只能包装16个,我们通过计算,发现如果要包装17个礼盒必须要花17×1.5=25.5(米)长的丝带,但现在只有25米,所以只能包装16个礼盒。

师:那你们认为给这种取近似值的方法取个什么名字好呢?

生3:去一法。

师:你们认为这个名字恰当吗?

生4:我认为不太恰当,因为如果是“去一法”,16.666……去一后变成了15个,所以不太恰当。我们小组认为“不入法”比较恰当。

生5:这个名字也不太好,“不入法”感觉好像没有取到近似值,结果还是16.666……

(学生这时议论纷纷,教师这时适时引导)

师:在这种取近似值的方法中,我们只是把16.666……后面的尾巴去掉了,没有进一,也没有去一,大家觉得把这个尾巴去的掉的方法取什么名字好呢?

生6:那就叫做“去尾法”

近似数与有效数字范文3

数学教科书是实现课程目标的重要教学资源,因此不论从教师的教还是学生的学的角度都要求数学教科书所呈现的每一个知识点,每种解题方法都应当是最准确的,每种表达方式都应当是最精炼的,最能体现数学思想方法的运用的,针对这些问题,我进行了一些思考,现把我的想法表达于此。

疑惑一:小学与中学的某些书写要求为什么不一致。

如:在小学运算结果中是假分数时要求必须化成带分数,否则运算结果不准确;而初中代数式书写时带分数必须化成假分数,否则表达结果不准确。尽管新教材没强调这一点,但小学教师和初中教师都默认这种做法,进行评价时都是这样的标准。这样让学生无所适从,增加了学习的难度,降低了学生的学习兴趣,也使初中教师在做这一要求指导时很艰难,很吃力,不该是问题的成了问题,使教师无所适从,为什么教材对此不能明确化、统一化呢?

针对这一问题我建议教科书把它明确化统一化。无论小学还是初中都把它写成假分数,就可以使小学初中的书写要求一致,当然,根据小学生的特点及实际问题的需要,把假分数可以化成带分数,为了孩子后续的学习教师不过分强调就可以了。

疑惑二:近似数的书写的要求与有效数字的确定发生矛盾。

如:北师大版七年级数学下的第80页例二,我国国土面积为9596960平方千米,四舍五入到千位得到9597000平方千米,只从数来看,容易让人误解为精确到个位,有效数字7位,对于近似数中的0是补位还是有效数字,学生辨认起来增加了难度。

针对这一问题,建议对于大于十的近似数写成科学计数法的形式,这样有效数字的确定就变得容易了。

疑惑三:类似的法则为何叙述不一致

如:单项式乘以单项式法则和单项式除以单项式法则类似,但说法不一致。

单项式乘以单项式法则:单项式与单项式相乘,把它们的系数相同字母的幂分别相乘,其余字母连同它的指数不变作为积的因式。

单项式除以单项式法则:单项式相除,把系数同底数幂分别相除后作为商的因式,对于只在被除式里含有的字母则连同它的指数作为商的一个因式。

类似的法则表述不一致给学生的理解记忆运用带来了麻烦,增加了难度。

我认为这两个法则的说法可以统一起来,并且在学单项式除以单项式时类比单项式乘以单项式的法则去理解记忆运用,注意区分它们的不同点就行了,这样有利于学生的学习,也能使学生在学习过程中体会数学中的类比思想的运用。

近似数与有效数字范文4

人教版(2012年6月第1版)七年级上册数学教材对近似数这一节删去了有效数字的内容,降低了学习难度,目的是让学生更易于掌握近似数的知识,但在实际教学中所出现的习题与考题中都考查到了对近似数内容的灵活应用,使学生感觉到能听懂却不能独立准确地解答题目,鉴于此,拟从以下几个方面对近似数题型的解法加以阐述:

1求近似数对应准确值的取值范围

一般来说,把一个数精确到哪一位,可以表示出误差绝对值的大小.如,一个近似数精确到十位,说明结果与实际数相差不大于5,依次类推,一个近似数精确到0.1,说明结果与实际数相差不大于0.05,等等.

由此看来,对于近似数的题目,只要熟练掌握了近似数的知识,然后灵活应用就可以解决好所给的问题.

近似数与有效数字范文5

【关键词】内容过滤;数字图书馆;推荐系统

1.基于内容过滤的推荐方法的特点

1.1 基于内容过滤的图书推荐系统的原理

基于内容的推荐系统(Content-based

Recommendation)也被一些学者称为“Fea-

turebased Recommendation”,其技术方法主要源于“信息检索(Information Retrieval,IR)”。最初的基于内容的推荐系统根据用户对内容的偏好,自动检索过滤众多内容,选择一些与用户偏好匹配度高的信息推荐给用户。

基于内容过滤的图书推荐系统根据读者的兴趣向量在图书特征向量中自动寻找与之匹配的产品,并依据相似度的高低顺序,产生推荐图书序列表,进而主动向读者推荐产品。读者兴趣向量主要包括读者的专业、学历、导师等身份信息和历史借阅、查询数据等信息,据此建立读者模型。图书特征向量主要是指经过人工著录的图书书目数据库,包含了书名、责任者、主题词、出版社、ISBN、出版日期等信息。当某本图书的特征向量与读者的兴趣特征向量产生较大交集(即较大效用值)时,系统就把该图书作为读者的备选推荐产品。系统再依据效用值的大小对备选产品进行排序,最后向用户推荐。

基于内容过滤的图书推荐系统的主要分为以下四个步骤:(1)读者兴趣向量的建模与表达,图书特征向量的建模与表达;(2)在同一向量空间下,计算读者兴趣特征向量与图书特征向量的相似度;(3)根据相似度的大小对结果进行排序,取前几位图书产生推荐列表;(4)若读者兴趣特征模型产生更新,或增加新的图书特征向量模型则返回步骤1。

1.2 基于内容过滤的推荐系统的优点和存在问题

基于内容过滤的推荐系统利用资源和用户兴趣的相似性来过滤信息,它的关键问题是相似性计算,优点是简单、有效,缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。基于内容过滤的推荐系统根据用户查询内容而进行推荐,其推荐结果具有短期效应,适合电子购物系统。而对于拥有长期用户的系统来说,则没有充分利用用户的历史数据尤其是相似用户的相关数据,缺乏推荐潜在兴趣产品的功能。

1.3 内容过滤推荐系统有利于充分开发数字图书馆资源

数字图书馆的建设不应该仅考虑组织众多的数字化资源,被动地等待用户前来选择,而应以用户为中心,整合数字资源,提供主动的信息服务。构建一个融多种技术为一体的信息推荐系统。在数字图书馆的环境下,图书文献信息的种类和数量都非常多,用户不可能像在实际的图书馆那样直接选取所需的文献资料。因此,数字图书馆应该充分揭示有关信息,自动推荐用户可能感兴趣的图书文献,实现数字资源的深层次挖掘分析,提高其使用价值。

1.4 基于内容过滤推荐是数字图书馆环境下的基本需要

数字图书馆具有信息量庞大、内容繁杂、形式多样、数据对象异构、分布式存储等特征,用户选择和利用所需信息比较困难。数字化图书馆虽然提供服务的方式与传统图书馆有些不同,但为用户提供高质量的服务的职能却没有改变。通过对信息资源的推荐有助于用户作出正确的评价和选择,使价值高的信息资源能够充分被利用。

2.基于读者文件的内容推荐算法

为了计算读者与推荐图书的相似度,首先需要将读者的兴趣表达出来以供系统识别和计算。读者的兴趣在系统中表示成读者兴趣文件,文件应该包括读者兴趣的内容并用系统可以理解的形式表达出来。读者兴趣文件是图书推荐系统的重要组成部分,是推荐算法的重要依据。

读者的兴趣主要受到读者的专业、身份、借阅行为等信息影响。根据系统建模工程方法,本文将读者的信息抽象为属性和操作。读者的属性主要指读者的专业、身份、职称、研究方向等较为固定的静态信息。这些可以从图书馆管理系统的读者数据库中获取,也可以通过读者自行修改完善个人信息而获得。读者的操作主要是指借阅、查询等行为信息。该信息可以从图书馆管理系统中的流通数据库中获得。本文假定读者在图书管理系统中的操作行为都因兴趣动机而起,因此操作行为可以反映读者的兴趣特征。于是本文通过对操作行为的研究揭示读者兴趣。

根据兴趣的时效性,将用户的兴趣模型概括为近期兴趣和长期兴趣。近期兴趣主要依据读者的近期借阅、查询行为而产生,具有高效用性、亟需性和短期性等特性。长期兴趣主要依据读者的专业、身份等静态属性而产生,具有高匹配性、稳定性和长期性等特性。

与读者的操作行为产生关联的读者属性通常为读者的专业、课程、研究方向、身份、职称、年龄、性别、兴趣爱好等。

表1 读者属性列表

专业 课程 研究方向 职称 年龄 性别 兴趣爱好

教师

学生

其他

读者属性可以通过读者个人ID信息自动抽取或通过读者主动填写个人资料获取。

读者的操作信息主要记录了读者的外借图书信息,检索、下载的文献信息。

表2 读者操作信息列表

外借 图书信息

借阅时长

评价

检索下载 内容主题

评价

在基于内容过滤的图书推荐系统中,从读者的属性列表和操作信息列表中提取若干兴趣特征词,形成读者兴趣特征向量。因此采用读者的兴趣向量模型来表示读者兴趣文件。在介绍图书特征向量的表示之前,本文先对向量空间模型加以说明。向量空间模型(Vector Space Model,VSM)是由康奈尔大学G.Salton教授提出的,把文本简化为以向量分量的权重为分量的向量表示,把文本处理过程简化为空间向量的运算,使问题复杂性大大降低,关键是基于空间向量模型的。

在读者兴趣特征向量建立后,需要对此进行定量化表达,以便推荐系统能够进行精确计算。在图书推荐系统中,采用对不同的兴趣特征赋予不同的权重,以达到对特征向量的量化处理。权重值依据喜爱程度从低到高表示为-1分到1分不等。未曾获得读者评价的特征值表示为0分。读者的近期兴趣特征值和长期兴趣特征值应该赋予较高的权重。当读者的操作信息表更新,读者的近期兴趣特征值就相应变化。而读者的长期兴趣特征值则应保持稳定的权重值,除非读者的属性表中更新了读者的研究方向、专业、兴趣爱好等信息。

3.基于读者文件和图书文件相似度计算

在读者文件和图书文件建立之后,需要将二者进行相似度计算。通过计算,可以精确计算读者与图书的匹配度,从大量图书中迅速过滤出与读者兴趣匹配值高的图书,进而形成推荐列表,帮助读者选择图书。

3.1 几种常见的相似度计算方法

计算相似度的方法比较多,常见的有余弦相似性计算法、皮尔森相关系数法和改进的余弦相似性法。如今许多计算方法都是基于这三种方法做出的修正和改进。下面对这三种方法分别简要介绍。

(1)余弦相似性(Cosine):在信息检索领域,两篇文档之间的相似度往往通过把文档看作是一个词频矢量,然后计算两词频矢量的夹角余弦来表示。同样,也可以将这种方法用于图书推荐系统,将读者对图书的评分看作为n维图书空间上的向量,如果读者对图书没有进行评分,则将读者对该图书的评分设为0,读者间的相似性通过矢量间的夹角余弦来度量。设读者i和读者j在n维图书空间上的评分分别表示成,则读者i和读者j之间的相似性sim(i,j)为:

其中,分子为两个读者评分向量的内积,分母为两个读者评分向量模的乘积。

(2)皮尔森相关系数(Pearson):也称为相似相关性(Correlation)。假设读者i和读者j共同评分过的图书集合用Ii,j表示,则读者i和读者j之间的相似性sim(i,j)可以通过Pearson相关系数来度量:

其中,Ri,c表示读者i对图书c的评分,分别代表读者i和读者j的平均评分。

3.2 形成推荐列表,帮助读者选择图书

读者文件与图示文件的相似度值计算出来以后,重复N次计算,得到读者文件与所有图书文件的相似度值。按照值的大小,从高到低依次排序。选取前几项,查检对应的图书,形成推荐列表,推荐给读者。

4.结语

随着信息网络的广泛应用,信息数据在飞速增长,一方面为人们提供了极为丰富的信息资源,另一方面也增加了人们寻找合适资源的时间成本和难度。人们在信息领域的个性化需求,必将推动推荐系统的快速发展。当推荐系统进一步成熟并在现实网络中得到广泛深入的应用,人们将享受到推荐系统所带来的人性化的推荐服务。

参考文献:

[1]谢琳惠.推荐系统在高校数字图书馆的应用[J].现代情报,2006(11):72-74.

[2]黄希全.数字图书馆推荐系统中用户偏好的建模方法[J].情报杂志,2006(1):28-30.

[3]张俊,黄水清.国内外数字图书馆个性化信息服务系统的功能与特征比较研究[J].情报理论与实践,2005,28(6):609-612.

近似数与有效数字范文6

合理的近似,是人们在日常生活中对一些无法进行精确测量和计算的数量,进行近似的或粗略估计的一种方法。一个人估算能的强弱直接影响到他的生活节奏的快慢和工作效率的高低。让学生意识到估算的价值,增强估算的意识,从而自觉地应用估算,具有重要的意义。合理的近似计算往往能够体现学生是否有明确的物理思想与求解问题的灵活方法,也往往体现出学生学习潜力和科学素质。

合理的近似,不仅仅是一种计算方法,还能充分利用物理知识,把握问题的物理本质。对培养学生灵活运用物理知识解决实际问题的能力具有不可低估的作用。所以说,学会合理地近似是培养学生能力,提高学生素质的重要手段。

高中物理中的合理近似是对物理量的大致数据范围或数量级进行科学推算,以及合理地利用相关物理知识把握问题的本质,进行相应的推理计算。特别是在万有引力定律的应用上,合理近似尤为重要。

在科技高速发展的今天,学生的数字计算能力急速退化。现在的学生,一遇到大的数字计算,首先想到的是计算器而不是想着自己如何动笔来算算,导致在考试时最终的结果不能准确地计算出来,但是如果能在平时的教学中,注重培养学生的估算能力就不至于在没有计算器的情况下就不知所措。

一、数量级计算

在万有引力定律的应用中,经常会涉及很大数量级的计算问题,天体运动中的一些常数就是很大的数字,比如万有引力常数G=6.6710-11N·m2·kg-2,地日之间的距离r=1.491011m等等,在实际教学中发现,如果遇到这种计算题,学生常把物理过程写出来,把数据代入,但不会计算出结果。基于这种情况,就要教会学生大胆地进行估算。

当遇到这种数量级的计算时,利用“四舍五入”化为整数,可大大简化计算,且不会影响数量级。另外,有时对于π的近似也很关键,较为准确的数值是3.14,而在天体运动的计算中就可以近似为3,化为整数,不会影响计算结果。

二、物理规律的应用

1.万有引力近似等于重力

从理论分析可知重力是万有引力的一个分力,二者是不可能相等的,但在高中阶段处理问题时,如果涉及重力加速度,我都有一个合理的近似,认为万有引力近似等于重力,即GMmr2=mg,意思是说,在一个质量为M的天体表面或者上空的某一个位置,在该位置质量为m的物体受到的万有引力近视等于在该位置物体受到的重力。

2.天体运动情况的近似计算

(1)运动轨道的近似

由开普勒三大定律可知,天体的运动轨道为椭圆,我们可以近似为匀速圆周运动,这样就可利用匀速圆周运动的知识求解问题,主要利用一个思想,就是万有引力提供向心力,即F万=F向。

这种类型试题具有明显的开放性,它启示我们:物理问题的近似方法往往不止一种。所以在平时的教学中,应善于从不同角度应用不同方法对同一问题进行估算,进而比较不同方法的优劣。这类试题注重对信息提取能力的考查,通常题目呈现的信息是丰富的(包括可以间接获取的信息),任何一种可行的方法均只应用题目中的一部分信息。

(2)地表附近的近似

在地表附近运动的天体,距离地表的高度h远远小于中心天体的半径,所以在此有个合理的近似,认为天体运动的半径r近似等于中心天体的半径R,即r≈R

该近似多运用于求解某天体的第一宇宙宇宙速度。

参考文献

近似数与有效数字范文7

关键词:粗糙本体;语义扩展;查询匹配;检索

一、简介

控制阀是自动化系统的重要组成部分,合理的选择控制阀对于自动化系统极其重要。然而,产品选型设计往往关联着需求方与供给方不同企业,其来自需求方的应用需求同来自供给方的产品属性之间往往存在着巨大的“语义鸿沟”,造成自动化选型的困难性[1]。

检索是实现选型设计自动化的有效手段。然而,传统的基于关键字检索方法仅仅考虑到了语法层次的问题,即检索条件在数据库中是否能够得到匹配,完全摒弃了检索条件的概念特征;从知识表示的角度来看,关键词的检索仅仅考虑了数据匹配,而没有考虑数据本身的结构特征,势必无法支持复杂的检索需求,因而难以应用于控制阀产品的自动化选型中[2,3]。本体具有“概念化、形式化、明确性、共享性”[4]的优良特性,基于它的检索方法能够有效地捕捉用户的检索意图,合理组织底层数据,因而受到广大学者的积极关注[5-7]。然而,精确本体不能很好挖掘隐藏的语义信息,导致检索的全度和精度不理想。

针对这些问题,本体提出了一种基于粗糙本体的控制阀产品检索方法,通过引进粗糙集到本体中,粗糙本体的概念是S.Ishizu提出的,使本体能够表达不精确的信息,能够解决不精确信息影响检索结果的问题。本文包括:粗糙本体库的构建,查询语句的自然语言处理及基于本体和粗糙本体库上下位语义扩展,基于语义扩展后的关键字和文档的查询匹配。

语义信息检索是一种基于概念和概念之间关系的匹配机制,语义信息检索的重点和难点是找到不同概念之间的映射关系,于是本文用本体和粗糙本体来实现检索。

对比用精确本体进行语义扩展,粗糙本体能客服精确本体中信息不完整的问题,粗糙本体是用粗糙集理论对精确本体的扩展。粗糙本体的实现难点是知识的表征以及粗糙本体的定义问题。

二、控制阀本体库和粗糙本体库

基于粗糙本体的检索方法利用本体“概念化、形式化、明确性、共享性”的特点,可以有效地分析用户的检索意图,合理组织底层数据,实现高效的产品检索工作。文章中的控制阀本体源于我们先前的工作通过计算将满足设定阈值的词加入查询,本体模型基于NIST的CPM而扩建。粗糙本体用粗糙集理论对精确本体的扩展,它不仅可以通过精确概念得到粗糙概念,而且继承了精确本体的可扩展性,因此用它来表示粗糙概念。

粗糙本体定义

粗糙本体表达为O=,C是粗糙概念集,P是属性集,R是粗糙概念间的关系集。为了描述概念粗糙度,粗糙集的上近似和下近似被用来表述概念边界粗糙度。粗糙概念C是一个三元组C=(U,L,Y),对于一个给出的内涵Y,U是概念内涵的上近似扩展,L是概念内涵的下近似扩展。

表征:将粗糙本体引入语义信息检索的前提条件就是知识表征。

一个代表性的OWL表征的粗糙本体模型:

粗糙本体是基于粗糙集对精确本体的扩展,因此具有本体库的可扩展性[11]。用OWL编码的粗糙本体,粗糙度的描述需要增加到对象关联中,也就是上近似扩展和下近似扩展。表达OWL粗糙本体分成几步:(1)定义粗糙类;(2)定义子类;(3)定义粗糙概念上近似扩展和下近似扩展;(4)定义精确类的函数范围。分词后提取得到的关键字在本体树找到对应的位置,同时也在粗糙本体树中找到相应的位置,然后同时进行语义扩展,找到精确本体中的上位词及相对具体的下位词。(作者单位:北方民族大学计算机科学与工程学院)

创新项目:北方民族大学研究生处创新项目(YCX1563)

参考文献:

[1] 白静.产品智能选型设计方法及应用研究.博士后论文.2011:1-6

[2] Mousavi SM, Jolai F, and Tavakkli-Moghaddam R. A Fuzzy Stochastic Multi-Attribute Group Decision-Making Approach for Selection Problems[J]. Group Decision and Ngotiation. 2013.22(2):207-233.

近似数与有效数字范文8

关键词:人工智能;神经网络;多方案集成法;集群识别策略

中图分类号:TP391.43 文献标识码:A

1 前言

由于汉字其独特的复杂结构,考察人类认识汉字的过程成为研究人类认识能力的一个良好手段。这是因为人类对具有丰富结构特征的汉字进行辩识时,不仅要应用模式识别能力,还要应用推理判断能力。这样人对汉字识别的过程既包括高层的以符号推理为主的“深思熟虑”型的智能,又包括底层的非推理的“本能反应”型的智能,使得它处于人类高层智能与低层智能的结合部,能够部分为意识所觉察和描述。汉字识别技术的研究是揭示人类智能奥秘的一个理想窗口,也是实现人工智能的良好平台和环境。手写体汉字识别方法的研究,具有广阔的应用前景,它使习惯汉语的计算机用户保持传统的书写方式,又享受到计算机给人们带来的快捷和便利。

2 手写体汉字识别系统的工作过程

手写体汉字识别系统采用光电转换装置把汉字转换为电信号,送入经过训练的计算机,由计算机自动辨认、“阅读”。手写体汉字识别系统由汉字图形输入装置、预处理器、识别器和后处理器等几个主要部分组成,其工作过程如下:

首先,待识别的汉字经过汉字图形输入装置,产生模拟电信号。模拟电信号经过模数转换,转换为带灰度值的数字信号。经光电转换后的待识汉字是一种二维点阵图形,将其送至预处理环节。预处理的内容和要求取决于识别方法,一般包括行、字切分、二值化、细化或抽取轮廓、平滑、规范化等。

行、字切分。首先从上到下,搜索一行文字的上下边界,切分出文字行,然后从左到右搜索一行文字的左右边界,切分出单字或标点符号。

所谓二值化,即把汉字图形带灰度电平的数字信号处理成二值(0,1)的数字信号,其中,“0”部分代表背景象素点,“1”部分代表笔画象素点。

细化即是将二值化的汉字点阵逐层剥去轮廓边缘上的点,变成笔化宽度只有一个bit的汉字骨架图形。

对汉字图形做平滑处理的目的是去掉图形中的孤立噪声、干扰并平滑笔画边缘。

规范化就是把文字尺寸变换成统一大小,文字位置纠正,字笔画粗细变换等文字图形的规格化处理。

识别器是整个汉字识别系统的主要环节。待识汉字经过预处理后,汉字模式成为规范的二值数字点阵信息,将其送至识别器。识别器首先进行特征抽取,即从预处理后的点阵图象中按一定的方式抽取汉字特征。

最后为了进一步提高整个系统的正确识别率,对识别结果进行后处理,即对单字识别的结果,利用语言知识等上下文进行识别结果的确认或纠错。

特征抽取与分类器的设计是整个系统中最为重要的环节,稳定特征的抽取与良好性能的分类器的设计是整个识别系统的核心,他们直接决定了识别系统的性能。下面从特征抽取和匹配判决的角度对现有的识别方法进行分析。

3 手写体汉字识别方法分析

手写体汉字识别是一个高难度的模式识别问题,传统的模式识别理论不能提供系统具体的方法,相关学科的交叉研究又不够深入,研究人员往往靠直觉和实验效果来选择识别方法,从预处理、特征选取、分类决策到后处理,人们提出了种类繁多的识别方案,很难进行理想的归纳分析,从特征选取和分类决策角度可将其粗略地分为四类:统计模式识别法、结构模式识别法、松弛匹配识别法和人工神经网络识别法。

3.1 统计模型识别方法

统计模式识别法采用统计特征向量进行模式描述,该方法不直接考虑汉字的笔划结构,主要是选取分类性能好、稳定的统计特征。识别时根据未知样本的特征向量与识别字典中的参考特征向量的匹配程度来判定识别结果。

进行特征提取时,通常先对汉字点阵进行某种局部或全局性的变换,从点阵平面得出特征平面;再对特征平面进行区域选取、网格划分、投影及变换等处理,从而形成特征向量。

统计模式识别法的特点是对局部噪声和微小畸变不敏感,分类性能较稳定,粗分类效果良好。传统的统计方法一般采用多维特征值累加的办法,把局部噪声和微小的畸变“淹没”在最后的累加结果里,同时那些用来区分字型结构的“敏感部位”的差异也随之淹没了,因此这种方法对于近似字的识别率很低。

3.2 结构模式识别方法

结构模式识别方法,也叫句法结构识别法。汉字是一种特殊的模式,汉字图形含有丰富的结构信息,用一定的方法提取含有结构信息的结构特征及其组字规律,作为识别汉字的依据。这种方法把待识汉字模式看作是由若干个较简单的子模式构成的集合,后者又可继续分解为若干个更简单的子模式,最简单而且不可再分解的子模式叫基元。这样任何模式都可以用一组基元及一定的组合关系形成的符号串来描述。识别器将输入的汉字描述为一串符号串,然后和存储在字典中的标准汉字符号串逐一相比较,和哪一类接近就被识别为哪一类。

由于结构法描述模式细部结构的能力较强,因此对相似字的分类能力较强,但是该方法所需的工作量很大,能够识别的字数有限。

3.3 松弛匹配识别方法

松弛匹配是目前广泛使用的一种手写体汉字识别方法,它利用了计算机视觉中的形状分析和匹配,该方法把汉字看作多角形轮廓,首先试探着将输入特征向量中的任一维特征和标准特征向量的所有维以初始概率进行匹配,然后利用支持函数不断地迭代对匹配概率进行更新,通过不断动态地改变相关概率,抛弃小者,保留大者,直到最后确定一个稳定的匹配。

当松弛匹配与具有很好描述能力的结构特征配合时,一般都能实现较好的识别性能,但它的最大缺点是计算量大,运行相当耗时,因此该方法适宜于用作细分类方法。

3.4 人工神经网络识别方法

人工神经网络汉字识别方法,利用子结构检测器进行手写体汉字笔划的分割识别和特征抽取,所抽取到的特征用集识别和特征抽取与一体的人工神经网络进行识别,并用“弱刺激畏缩”学习算法实现神经网络的组块神经元的建立,来解决BP网络收敛速度太慢的问题。另外,还利用叠层BP网的手写体汉字识别方法,同时选用外轮廓线、笔划、特征点分别为叠层BP网中的输入层、隐含层和输出层的特征进行分类,通过总网和子网的分批学习,以缩短网络的学习时间,解决手写体汉字复杂多变的问题。人工神经网络识别法具有自适应功能、泛化功能、非线性映射功能及高度并行处理等优点,

在脱机手写体汉字识别过程中,由于每个人书写汉字都各有特点,差异较大,所以在研究识别方法的时候,着重考虑的是如何找出它们共同的特点,尽量消除这些差异,提高总体识别率。但同时带来一个问题,由于汉字中的相似字也有较多共同点,而使得相似字的识别更加困难,虽然整体识别率提高了,而相似字的识别率反而降低了。由于汉字识别的人工神经元网络方法在小规模分类中的具有很强的分类能力,对手写体相似字有比较满意的区分效果,但是,随着分类规模的逐渐加大,其分类能力则明显下降。而传统的统计识别方法的大规模分类能力强,如何利用统计识别方法大规模分类能力,缩小识别范围,在小范围内体现人工神经元网络对相似字识别的优势,本文通过研究将这两种方法结合起来,充分发挥统计识别方法整体识别率高和人工神经元网络方法对相似字区分能力强的特点,使得相似字的识别率大大提高。

4 手写体汉字识别技术的应用

手写体汉字识别已经历了漫长的研究历程,在预处理、特征抽取、匹配判别及后处理等各个环节产生了许多有价值的思想和方法,具有广阔的应用

4.1 基于语言知识的手写体汉字集群识别

单个字的机器识别能力是有限的,近年来基于语言知识的集群识别是手写体汉字识别的一个发展趋势。

集群识别的基本思想是,首先把若干个待识对象在语料库和语法库的引导下,约束成一个群体,作为一个被识别对象,接着把集群捆绑形成的群体作为一个完整的识别对象同时加以识别分类,最后模仿人类细看的原理,把同类分类的结果与识别对象进行比较认同。集群识别思想包含两层反馈线路,内层反馈是为了对同步分类的结果进行反馈验证,外层反馈是为了对集群捆绑的成员进行重新分配。若反馈验证表面前面的集群捆绑有错误成员,再进行调整。利用模型、语言的多种统计知识及距离测度,对汉字识别的各个关键环节进行综合评判的策略和方法。

4.2 心理学研究成果在手写体汉字识别中的应用

汉字识别的心理学研究对手写体汉字识别具有启发意义。对人类汉字的认知心理实验研究结果进行总结后,认为人的汉字识别是经由整字属性及分层结构的多种途径复合而成的,其中大多数都可以在手写体汉字的机器识别中模仿应用。基于人类认知心理的手写体汉字机器识别模型,,应用子模式法和整模式法建立了一个实验系统,有效的提高了系统性能。这方面的研究虽然起步晚,但却是一个值得注意的新动向。

4.3 小波变换在特征抽取中的应用

小波变换是一种在图象分析、图象压缩中的重要分析工具,小波变换的多尺度分解特性更加符合人类的视觉机制,与计算机视觉中由粗到细的认识过程十分相似,更加适于图象信息的处理,因此一些研究者将该方法用于手写体汉字的特征抽取,取了较理想的效果。汉字的二维点阵图象按行、列分开进行一级小波变换后,得到一个低频分量和三个高频分量,低频分量保持了图象的大致轮廓,而高频分量表示图象的细节部分。将汉字图象经过小波变换后,使提取横、竖、撇、捺笔划非常容易,且简洁、明晰,再加上特征点共同组成特征向量,然后进行识别。

4.4 模糊数学方法在手写体汉字识别中的应用

模糊数学作为描述不确定事物的有效方法,在模式识别领域得到了广泛的应用,手写体汉字识别的研究对模糊数学也寄予很大的希望。在特征抽取中引入模糊数学的思想,提出汉字的模糊方向线素特征识别方法,有效地克服手写体汉字识别中变形问题。虽然模糊数学在此领域的应用还有许多问题亟待解决,如隶属函数的确定,模糊集合运算量大等问题,但是用模糊数学工具探索手写体汉字识别过程中的许多不确定问题,是一种值得重视的工具。

5 结论

通过对手写体汉字识别的基本原理和常用方法综合介绍,针对目前研究的热点问题,本文主要分析了手写体汉字识别的多方案综合集成方法、心理学研究成果的应用、小波变换特征抽取方法应用以及模糊数学方法在手写体汉字识别技术中的应用。从分析中看到,各种方法都有自己的优点和不足,特别是近年来手写体汉字识别研究的经验表明,重视多学科的交叉渗透,加强人类识字规律的心理学研究并努力借鉴,注意吸收和利用人工智能、神经网络以及模糊数学等最新研究成果,是当前技术条件下脱机手写体汉字识别研究的一个重要方向。

参考文献:

[1] 郭宝兰, 张彩录. 光学字符识别技术发展[J]. 计算机世界报, 2008(10).

近似数与有效数字范文9

作者:郭莉 单位:华侨大学外国语学院

源自汉语的日谚“人間万事塞翁が馬”,单一个“万”字便涵盖了诸多纷繁的世事。那么模糊视阈下的中日谚语数字翻译是否有规律可循呢?数字翻译的格式塔接近性原则格式塔理论中的接近性原则认为,某些事物或事物的各部分,彼此在时间或空间上愈接近,则愈被感知为一个整体。如下图所示,在第一行中我们看到的是abc/def/ghi/jkl四个组合,而箭头下方,由于c,d,e和i,j,k的位移,这些圆点分成了两行,于是我们看到的是ab/cde/fgh/ijk/l这些新的组合因为此处的数字“一”并不是精确数字,是一个模糊的概念,表示同一个整体。根据格式塔接近性原则,同一整体内的事被认为具有相同的性质,另外,狐狸在日本民俗中有诓骗人之说,也不是正面的形象,因此,日语若译为“同じ穴の狐”,则可以称得上是等效的翻译。成语“一个半斤,一个八两”,在古代中国的计量单位中,一斤为16两,半斤等于八两,意思是彼此不相上下。

我们同样不能简单地直接翻译成“4分の1キロと250グラム”,既不体现幽默,也毫无美感可言。然而日语中有这样一个熟语:“団栗の背比べ”,指排在一起比个头的“団栗”(橡子),其实大小都差不多,不分高下。它也符合格式塔的接近性原则,这两种说法诙谐相应,因此几乎成了固定的翻译。再如,“五十步笑百步”,同在逃兵的行列里的人,败逃五十步的讥笑败逃一百步的,比喻缺点或错误性质相同,只有情节或重或轻的区别。而日语除了“五十歩百歩”之外,“青柿が熟柿弔う”,也与此有异曲同工之处,青涩的柿子哀悼已经成熟掉落的柿子,却没有注意到自己也难逃相同的命运。或者译为“目糞鼻糞を笑う”,同是不洁之物,却相互讥笑,更具讽刺效果。另外,对应于汉语的“八九不离十”,日本人用射靶做比喻,可形象地翻译为“中らずといえども遠からず”,或者直接翻译为“十中八九”,也是格式塔接近性原则的又一体现。可见,模糊数字的使用,往往具有一定的民族文化背景和语言表达习惯,当日语的数字概念无法表示汉语数字的模糊性时,格式塔接近性原则,可以帮助我们捕捉生活中其他生动有趣的例子,借以表达其特殊的语用含义。数字翻译的格式塔闭合性原则格式塔理论认为,知觉印象随环境而呈现最为完善的形式。这种完整倾向说明知觉者心理上的一种推论倾向,即当一个完整的图形,期间有少许的断缺,观察者在视觉上及心理上仍然倾向趋于完满。这被称之为格式塔闭合性原则。这也就是为什么在文学翻译中,模糊语言所提供的模糊语境,往往能给读者以丰富的、耐人寻味的审美空间的原因。一个不完整的圆形和三角形,可以被我们的知觉填补、恢复为一个完整的圆形和三角形或者梯形。格式塔闭合性原则与模糊数字的意象延展特性不谋而合,如汉语成语“匹夫不可夺其志”,我们可以翻译为“一寸の虫にも五分の魂”(即使一寸的虫子也赋有灵魂,充满气魄),此处的“五分”虽意指半寸,却能让人充分感受到弱小的生命当中精神的具足与饱满,可谓神似之译。王羲之的书法秀丽中透着苍劲,柔和中带着刚强,相传他在木板上写字,字迹透入木板三分之深。成语“入木三分”便由此而来,形容书法极有笔力,或比喻分析问题很深刻。根据格式塔闭合性原则,这里的“三分”虽然仅是整体的一部分,但已然显示出其力透纸背的用笔和用心。翻译成日语时,我们可以选择对目的语读者来说更容易产生共鸣的“归化译法”,译为“筆力が強い”或“洞察が鋭い”。

数字模糊性的美学价值在于,提供了丰富的想象空间以及意象上的留白,我们完全可以把这种模糊的表达与格式塔闭合性原则相结合,重构目的语的格式塔意象,以达到“神似”的翻译效果。数字翻译的格式塔同构性原则格式塔学派通过对物理“场”的研究,认为人的心理中也有一个力学的“场”。这两个场相互作用形成了“心理-物理场”,知觉也就是一个“场”。物理现象,如电场、磁场有动力结构,在知觉活动中,人的意识经验也有着同性质的动力结构,因此与物质对象之间存在同形同构关系。[2]727这一关系的基础是事物本身所表现出的力的结构,它与人的情感、情绪中力的作用相似,因此物理现象能表现人类的思想情感。这就是格式塔异质同构性原则。格式塔心理学美学的最主要代表人物阿恩海姆有一个著名的例子:一棵垂柳下垂的枝条之所以看上去是悲哀的,并不是因为它像一个悲伤的人,而是因为垂柳的形状、方向和柔软性本身传递出一种被动、下垂的视觉信息,与悲哀的心理结构具有相似性。马致远《天净沙•秋思》中的名句——“枯藤老树昏鸦,小桥流水人家,古道西风瘦马。夕阳西下,断肠人在天涯”,诗人并列了九个不具连续性的意象,描绘出晚秋黄昏萧瑟苍凉的景象,抒发了断肠人零落凄苦的心境。成语“明日黄花”出自苏轼《九日次韵王巩》诗:“相逢不用忙归去,明日黄花蝶也愁。”原指重阳节过后逐渐萎谢的,现比喻过时或无意义的事物。在日本,五月五日端午节有插菖蒲避邪之传统习俗,所以六日的菖蒲就如同九月九日(重阳节)之后的一样,派不上用场了。根据格式塔同构性原则,日语“六日の菖蒲十日の菊”不正具有相似的意境吗?又如汉语“一星半点”,“一”和“半”并不是具体的实指,而是“微乎其微”之意,日语中相对应的表达有“雀の涙”(麻雀的泪珠)和“爪の垢”(积存于指甲里的泥垢),这样的翻译既体现出类似的意境,又形象生动、简约幽默。在语言转换的过程中,格式塔同构性原则往往表现出的是一种比喻意义、象征意义,需要译者突破字面的意思,甚至是句法的限制,在整个情境当中解读源语言的情感信息及美学信息,在目的语当中还原、再现原作品的美感。否则犹如“隔靴搔痒”(二階から目薬),不得要领,劳而无功。

相关期刊