HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

计算机学术研究论文集锦9篇

时间:2023-03-01 16:24:13

计算机学术研究论文

计算机学术研究论文范文1

1 计算思维的含义阐述

计算思维在本文中是指周以真老师定义的一个概念,是一种以计算科学为理论基础解决问题以及进行设计等行为运用的思维,是一种涵盖面极广的思维。另一种更易懂的解释为,将一个复杂问题通过转化简约等方式重新定义,使人们找到解决方法的思维;可通过分解来设计繁杂的系统;是运用适合的方法对问题建模随后处理的思维;是一种启发式的求解过程,是用以解决问题的科学思维方法。

计算思维可以由人或机器完成,通过建立一定的模型利用具体的算法完成原本复杂的问题。计算思维的本质是抽象以及自动化,抽象是以符号为表达方式,超时空性的,具有不同于数学科学和物理的复杂性,如堆栈和算法,并不是如数学中那样简单的数据相加组合,而是一种复杂的运算过程。抽象在计算思维中还需要现实的参与完成,所以就必须预估可能出现的错误,并了解处理问题的方法。计算思维还包含一个重要的问题就是抽象层次,这是一种通过层次了解复杂的方法,各层次间有着具体的联系,在执行某复杂机械系统时,通过各层次的建模来保证机械自动的运行。

周教授提出的计算思维具体有六个特点:

(1)计算思维不只是有关计算机的思维,而是一个思维概念,范围广博。

(2)是一种在社会中发挥主观能动性所必须的根本性的灵活技能。

(3)不是机器的,而是人类的解决问题的思维。

(4)计算思维涵盖着工程思维、数学思维等科学思维的内容和方法。

(5)不是创造出的一个物品,而是一种思想,是人们可以利用解决问题,相互交流的思维方式。

(6)计算思维是解决问题的重要途径,应当被所有的学科运用。

周教授最初提出计算思维时,获得了美教育界的积极响应,不久便提出计算思维融入计算机专业相关课程的提议,并专门对计算思维做了总结性的报告。英国教育界也对计算思维有着积极地相应,不只是计算机专业,各学科都对计算思维做了研究和讨论。值得一提的是,计算思维也是NSF重要基金项目的促成者,有着重要的意义。

2 计算机科学与技术的方法论阐述

计算机科学技术的方法论是董荣胜和古天龙老师构建的方法论体系,主要研究对象是计算的性质特点及计算方法等。该方法论体系是以《计算作为一门学科》中计算学科的定义矩阵为理论基础的,这个定义矩阵具有高度的概括性,其本质也就是计算学科的本质。对于定义矩阵的要点把握,可以通过横向、纵向的具体内容来把握。横向的内容包括抽象和理论以及设计三方面的联系,是计算机方法论最关键的部分,是推动学科发展的力量。纵向的内容是分支学科中共通的反映计算学科的内容,是帮助人们认识计算学科以及利用方法论完成任务的重要助力。纵向各分支学科的关系主要有以下方面:

(1)各领域研究的内容部分一致。

(2)计算学科的具体内容在各分支中均有体现,各分支是计算总学科的体现。

通过计算机方法论学科的具体组成,除了语言的定义以外,还有形式化的定义。因此董教授和古教授又对增加了对方法论的定义又形成了“计算教育哲学”这门新的学科。此后董教授在教育领域不断推荐这种理论体系,并与古教授一起编写了相关的教材。二人合编的著作目前已在我国多所高校使用。不仅在国内,国外也有许多学者对计算机方法论有着浓厚的兴趣,不断有相关的会议召开讨论这一理论。

3 计算机科学与技术的方法论和计算思维之关系探讨

计算思维和计算机科学与技术的方法论在研究内容上,与数学科学有着相同的地方。国内主要研究方法论,国外则主要研究计算思维。但与数学学科相比,方法论在研究理论的体系构件上,已经有已有的成果,在研究时也可以借鉴国外的许多优秀理论。计算思维与方法论虽然有着不同的研究角度,但都是对计算学科本质内容的研究,一个从思维角度研究计算学科一个从方法论角度研究计算学科。计算思维透过学科的思维本质进行研究,并能对其他学科产生影响,不仅是一种计算的思维,也是一种普遍的,有助于任何人完成任务的灵活思维方式,应成为新实际的必备技能。针对计算思维与其他学科的结合,很多学科的教师会有着对计算思维的疑问,对此有关的研究总结了适用于计算思维研究的问题特点:

(1)问题的表述要清晰,对于此问题解决后能从中得到的好处,必须要清楚。

(2)解决某一问题的方案以及问题解决带来的进步要能够测试。

(3)所研究的问题能够分成不同的层次和步骤完成。这样有利于通过一小步的完成看到相关的进步。

计算机科学技术方法论是对学科构建的理论体系的相关研究,是研究一门学科理论进化过程的。在体系构建过程中,利用一般的方法论结合着计算学科的基本概念,由理论到实际的构建体系。在体系的框架完成之后,再填入具体的实质内容。关于理论体系中内容的填充,注意的方面主要有两点:一是学科有着深刻的理解,能划分其概念;二是分析了解计算学科发展的一般规律。计算机科学技术的方法论一般利用例证来解决学科的问题,为学习者未来的事业之路打下良好的基础。方法论的基本概念主要有抽象以及理论设计,这也是方法论教学中最容易教授的概念。科学与研究掌握计算机方法论则有利于在其指导下有条不紊地展开研究。

综上所述,计算思维和方法论虽然各有自己的研究对象与研究特色,但二者之间有着很强的关联性,二者相互补充相互提高,对于学生和研究者来说,培养计算思维,利用方法论,对于学习和研究都是非常有益的。

参考文献:

[1] Wing J M. Computational Thinking. Communications of the ACM, 2006, 49(3).

[2]中国计算机科学与技术教程2002研究组.中国计算机科学与技术学科教程2002.北京:清华大学出版社,2002 [3]周以真.计算思维.中国计算机学会通讯,2007,3(11).

[4]王飞跃.从计算思维到计算文化.中国计算机学会通讯.2007,3(11).

[5]董荣胜.向学术界推荐一个认知计算学科的工具――计算机科学与技术方法论(大会报告).上海:新世纪计算机教育及CC2001研讨会,2001.7.

计算机学术研究论文范文2

关键词 库恩理论 计算机科学与技术 跨越式发展

中图分类号:TP3 文献标识码:A

0 引言

随着计算机及信息技术的不断发展,对于计算机科学与技术的进步程度及速度的衡量方法的研究越来越受到相关工作及研究人员的关注。库恩提出的科学革命模式就是一种以模式的形式将计算机科学与技术的发展趋势表现出来的一种方法。①此论文基于库恩理论对计算机科学与技术的跨越式发展进行了较为系统的研究。

1 库恩理论概述

库恩理论主要是对科学的动态发展状况进行了一个较为系统的论述。该理论冲破了古典经验论,指出科学之所以能够成为科学或称之为科学就是因为范式的形成的理念。库恩理论诞生之后,不仅被广泛应用于科学技术发展的各个领域,而且有效地促使相关工作人员在范式的指导下从事科技工作。所以,从这个角度上来说科恩理论的提出具有十分重要的理论与实践意义。其实,库恩提出的理论主要包括:前范式科学理论,常规科学理论及科学革命理论,其中科学革命理论也称为新常规科学理论。而科学革命实质上就是新的范式来替代旧的范式的一个过程,新旧范式之间是不可以通约的。②

2 基于库恩理论的计算机科学与技术的发展历程分析

基于库恩理论的计算机科学与技术的发展历程可以分为三个时期,即计算机科学与技术前科学时期、计算机科学与技术常规科学时期、计算机科学与技术革命时期。

首先,对于第一个时期来说,也可以大致归纳于三个阶段——计算工具的发展阶段、机械式计算机的发展阶段、继电器式计算机发展阶段。由此也可以看出,计算机科学与技术前科学时期的时间跨度比较大,而且各种思想和学派比较繁杂。不论是计算工具阶段、机械式计算机阶段还是继电器式计算机发展阶段都没有系统的结构,也没有相关的指导理论,所以整个的发展来看,方向非常地模糊,发展进度的衡量标准也不明确。而这些都是库恩的前科学时期的典型特点。虽然,计算机科学与技术的前发展阶段存在很多突出的问题,但是这个阶段的一些基本原理和基本思想是现代常规科学时期的电子计算机发展的基础。

其次,计算机科学与技术常规科学时期。在这个时期人类历史上真正的第一台电子计算机诞生,而且理想计算机理论和计算机体系结构的提出,为计算机的发展提供了一定的理论标准,计算机科学与技术的发展形成了一个相对稳定的范式,这个范式的形成,有效地促进了计算机的快速发展。在这个时期计算机的演变经历了电子管时代、晶体管时代、集成电路时代、大规模集成电路时代、智能计算机等阶段。③

第三,计算机科学与技术的革命时期。这个时期虽然计算机的发展非常地迅速,而且功能也在不断地完善。但是计算机科学与技术的发展与摩尔定律密切相关。有相关专家在回顾40年来半导体芯片行业的发展中提出在今后的几年里摩尔定律可能还可以适用。但是,如果晶体管电路的性能接近极限的话摩尔定律将走到尽头并有可能完全失效。所以,很多专家预言,一旦摩尔定律走到尽头,电子计算机科学与技术发展的革命必然到来。

3 基于库恩理论计算机科学与技术跨越式发展的可能性分析

通过上面的分析可以看出范式其实是一种相对稳定的模式,一般来说一种范式要被彻底地必须有一个长期积累的过程。必须要一定的量变才会引起最终的质变,一种旧的范式才能被一种新的范式替代。而单个的事实或单个事件通常不能证实或一种范式。所以,对于计算机科学与技术来说,只有当旧的范式不能满足实际需求的时候,而且有更好地范式代替旧的范式时,才会出现新旧范式的更替。所以,从这个意义上来说科学革命的实质就是新旧范式的转化、过渡或者更替。

同时,计算机科学与技术的发展存在很大的潜在威胁性,所以很多相关工作者及科技研究人员,都在致力于研究一些新材料和新技术。如果这些新材料和新技术的研究能够在危机出现之前研究出成果的话,就可以有效地避免危险的出现。这样就可以有效地实现计算机科学与技术的跨越式发展,计算机科学与技术就可以从以电子计算机为标志的常规科学阶段,直接进入新的常规科学阶段,而这必将加速计算机科学与技术的发展。现阶段人们正在着力研究的新领域包括:光子计算机、量子计算机、DNA计算机等。

4 结语

通过论文的分析可以看出,库恩理论的提出揭示了计算机科学与技术发展的内在规律,基于库恩理论的计算机科学与技术的发展历程可以分为前科学时期、常规科学时期以及科学与技术革命时期三个时期,而且基于库恩理论计算机科学与技术跨越式发展的可能性很大。最后,希望论文的研究为相关工作者及研究人员提供一定的借鉴与参考价值。

注释

① 杨玉成.拉卡托斯的研究纲领和经济学方法论[J].自然辩证法研究,2011,(2).

计算机学术研究论文范文3

关键词:数字化学习;研究性学习;数字网络化;计算机数字技术

中图分类号:J124-4 文献标志码:A 文章编号:1007-0125(2014)11-0170-01

现今世界正被计算机数字技术和新媒体艺术代表的信息科技所改变,传统的美术教学形式也正受到这种信息科技的冲击和挑战,故此美术教学自身正发生着无声变革,教育者们正努力探索数字化时代内美术教学实现其技术与美育契合的可能,这些变革的实施正改变着今后传统美术教学的生存空间,更是变着美术教育的思维方式和学习方式。

一、计算机数字化学习的内涵

教育界论坛给出数字化学习的学习类型,指明在计算机数字化的学习环境中,学习者借助数字化资源,运用计算机数字化的学习方式开展学习。计算机数字化学习包含如下观点:计算机数字化学习的基本要素包括:数字环境、数字资源、数字方式。

计算机数字化学习模式给予计算机辅助美术教学很大的理论支持,过去对数字化技术在教学中仅仅是单纯呈现,忽视了技术与课程的有效整合,如今,教育者更多地认知计算机数字化学习的基本要素、重要特点、核心价值、技术特点和学习模式,这为提高学习者的美术学习成绩起到至关重要的作用,为探索基于计算机辅助美术教学的研究性学习具有指导作用。

二、研究性学习的含义

目前,国内教育者对研究性学习的教育理论有很多观点和解读,这些各异的观点和解读是由于教育者所处在不同的角度和立场而发出的。华东师范大学霍益萍教授对研究性学习给与了布角全面的解读,提出研究性学习的广义和狭义两个层面的界定:广义的研究性学习“泛指学习者主动探究的学习活动,是一种学习的理念、策略和方法,适用于学习者对所有学科的学习”;狭义的研究性学习是“作为一门独立的课程,指在教学过程中以问题为载体,创设一种类似科学研究的情境和途径,让学习者通过自己收集、分析和处理信息来实际感受和体验知识的生产过程,进而了解社会、学会学习,培养分析问题、解决问题的能力和创新能力”。

国内外对研究性学习的解读虽有着不同的观点,但究其对培养学习者提高学习能力,探索未知事物有着共同的特性,主要都重视发挥学习者的主导性和团队协助行;重视培养学习者对知识信息的探究素养;重视培养学习者获知的严谨态度和科学研究的方法;重视培养学习者的创新意识和实践技能;依靠教育者的指导辅助作用。研究性学习是教育者指导辅助学习者,由学习者主导探索未知事物,通过其对问题的观察思考、数据择控、数据分析、结果猜测、后续探究等过程,解决问题最终得出结论和报告等。

三、计算机辅助美术教学的研究性学习的含义

基于计算机辅助美术教学的研究性学习是计算机数字技术与美术艺术研究性学习的整合,是计算机数字技术支持下的美术教学课题的学习研究,是发挥计算机数字技术的开放自由、互动自如、信息广阔、异步相通等优势,输送研究性学习的研学思想理念,建立符合艺术特点的自主探究、协作学习、个性化学习等专业学习方式。

计算机辅助美术教学的研究性学习具有以下一些鲜明的特点。

(一)学习者具有开放的学习空间。基于计算机辅助技术优势的研究性学习,使得学习者无现实空间和时间的局限,计算机数字环境下的虚拟空间给予学习者无以伦比的开放特性。

(二)学习者具有数字网络化的学习过程。学习者更多的学习内容、资料来自于计算机数字网络;学习结果和成绩可网络交流、资源共享;学习结果运用数字网络平台与世界同步,并随之全球。

(三)学习者借助计算机数字技术特性开展多样化学习方式。在计算机辅助美术教学的研究性学习中,设计美术课题的学习情景是多种多样的,可以是计算机数字网络平台上开展,也能是计算机单机条件下开展,更可能是兼顾计算机数字网络及数字单机共享条件下开展。

四、总结

在当今数字化科技浪潮的影响下,基于计算机辅助美术教学的研究性学习更像是在现代教育教学理论的指导下,以网络技术和多媒体技术为支持,旨在培养学习者创新精神、主动探究意识和运用信息技术进行实践的能力,促进学习者发展的新型的教学模式,这种模式是现代乃至今后的美术教学的发展趋势。

参考文献:

[1]人才培养模式改革课题组.网络课程教学模式的设计研究[J].山西广播电视大学学报,2004,(04):72-73.

[2]戟锋,杜爱明.推进我国教育信息化进程的三大主要任务[J].现代教育技术,2001,(08):47-48.

[3]黄永明.开展研究性学习,培养学生的创新精神和实践能力[J].教育探索,2003,(11):54-56.

[4]丁顺宏.成人高等教育教学模式研究[D].上海师范大学硕士论文,2010,(04):35-37.

计算机学术研究论文范文4

虽然计算机设计的初衷是缘于数值计算,但是英国数学家图灵(a.m.turing)在《机器能思维吗?》(1950)一文中已经预见到计算机和自然语言将结下不解之缘,并且提出检验计算机智能的最好方法就是对语言信息的处理能力。1977年,费根鲍姆(feigenbaum)提出知识工程,计算机信息处理出现了从“数据世界”向“知识世界”的转移趋势。知识世界的载体是语言符号系统,语言信息处理的需求促使语言研究过程和语言研究成果的技术化趋势日益明显,当代语言学已凸显出“语言科学”与“语言技术”的二分互补格局,由此我在《南京师范大学语言科技系建设发展规划》(2001年2月)中提出“语言科技”的新思维。“语言科学”主要指基础性的描写语言学和理论语言学。“语言技术”主要指面向信息处理的应用语言学或计算语言学,其研究任务可划分为“文本处理技术”和“语言模拟技术”。简而言之,语言文本处理技术是通过编辑和编程,将印刷文本转化为可供计算机使用的电子文本的技术。语言系统模拟(simulation)或者语言能力仿真(emulation)技术是通过算法和编程,将自然语言的理解和生成能力输入计算机的技术。获得语言能力的计算机可以实现“人—机对话”而成为名实相符的“电脑”。为研制智能机服务的“语言系统模拟”,可比喻为“语言基因图谱分析工程”和“语言能力移植工程”。强调语言研究的技术化,并非忽视传统语言学研究存在技术性的一面,例如实验语音学和方言语音调查等。之所以以往未能突出语言研究的技术化,其原因在于——除语音研究可借助声学技术设备以外——语言研究的绝大多数领域还一直没有相应的实验性技术设备。

虽然当代语言学家不可能也不必要都转向计算语言学研究,但具有一定的语言信息处理意识却非常必要。早在1964年11月,美国科学院语言自动处理咨询委员会就在《语言与机器》的报告中明确指出:机器翻译遇到了难以克服的semanticbarrier(义障)。然而这一警告,除了致使机器翻译研究热的暂时消退以外,并没有引起语言学界的足够重视。1982年,日本制订了一个为期10年面向ai(人工智能)的“第五代计算机”即智能机的研制计划,其中包括自然语言处理装置。1992年结束时,只部分达到了预定目标。随后又公布了另一个为期10年的“真实世界计算机(rwc)计划”即“新信息处理技术计划”。(许万增1996,p.61-62)据说,90年代后期日本不得不宣布暂停研制,其根本原因就在于未能穿过语言研究的“瓶颈”。自然语言处理装置的任务无法实现,计算机谈何“真实世界”或“人工智能”。时至今日,这一“义障”仍然没有跨越。在《新世纪将对人类产生重大影响的十大科技趋势》(新华社北京2000年12月30日电)的报道中,列出21世纪的“认知神经科学领域”和“信息技术领域”,并分别提出来“探索意识、思维活动的本质”和“计算机向智能化方向发展”的任务,然而没有语言科技领域的合作——关键是认知语义结构网络研究的根本性突破——则不可能实现。

无论从手段还是就目标,对准自然语言处理的当代语言学研究,其性质都应界定为“语言科技”。“语言科技”的内涵是以理论研究为指导,以描写研究为基础,以应用研究为枢纽,促使语言研究向计算机应用、数学、认知科学和现代教育技术领域延伸,沟通文理工相关学科以实现语言研究过程及其成果的技术化;“语言科技”的外延表现为语言工程科技、语言教育科技和语言研究科技。语言学和计算机科学等学科相结合的“语言工程科技”,研究领域是“人—机对话”,其目标主要是自然语言能力的模拟。语言学与现代教育技术相结合的“语言教育科技”,研究领域是“人—人对话”,其主要目标是实现语言教育的多媒体和网络化。“语言研究科技”是将语言研究活动与计算机工具相结合,其主要目标是实现语言学自身的计算机化,包括语料库、词库和句库的研制,语言研究的分析性、统计性、比较性和实验性软件的开发等。这一新思维既突出了当代科技发展所要求的“语言学的技术化”,又体现了以语言学为本而沟通文理工相关学科的研究旨趣。

二、计算语言学的界定要突出技术性

20世纪50年代以后,在理论方法交叉渗透而形成诸多边缘语言学的同时,语言学与计算机结合的趋势开始出现。1954年,在美国乔治敦大学所进行的世界上首次机器翻译试验,标志着计算机科学与语言学的结合已经起步。在这一研究领域,立足于不同的学科视角或知识结构,先后出现了一系列名称术语,如“语言工程”、“语言工程学”、“自然语言的计算机处理”(工科视角)、“语言信息处理”(信息学视角)、“数理语言学”(数学视角)等等。20世纪60年代以后,计算机和语言学的结合逐步深入到语言学的各个领域,形成了包括计算语音学、计算词汇学、计算语法学、计算语义学等分支学科在内的计算语言学(computationallinguistics)。其中“计算语音学”等名词,虽然计算语言学界没人提过,因为已经存在着“言语识别”、“言语合成”等计算机应用专业术语,但是从“语言工程学”到“计算语言学”的术语演变中,透露出“语言学立场”在这门交叉学科中的日益强化。虽然目前的计算机运算速度已经可以满足语言信息处理的技术要求,但是之所以“人—机对话”尚未实现,其“瓶颈”就在于现有的语言研究成果无法满足计算机处理的要求。归根结底,语言信息处理的最终目标就是“计算机模拟语言能力工程”或“语言能力移植计算机工程”。探索语言能力的性质和描写语言系统的结构,这些艰巨性工作还得由语言学家先来完成。语言信息处理或计算语言学务必以语言学为本而以计算机为用。语言学家必须具备“数字化”意识,了解计算机需要怎样的语言描写成果,然后才可能将研究目标对准语言工程。

迄今为止,正如许多发展中学科一样,“计算语言学”的定义尚无一致认定,归纳起来盖有四种观点(侯敏1999,p.2—p.6):

第一种,计算语言学是以计算机为工具研究语言学。侯敏认为,任何一个学科在使用工具方面都是自由的,使用不同工具研究一个学科会带来不同特点,但不因为使用了新工具就产生了新学科。虽然并不排除新工具的使用没有导致新学科的产生,但同样不能否认工具的变革有可能带来学科体系的革命,以致于产生新的分支或交叉学科。现代自然科学之所以能够建立,无疑得益于望远镜和显微镜的应用,前者打开了人类认知的宏观世界之门,后者打开了人类认知的微观世界之门。望远镜和显微镜带来的不仅仅是“这一个工具”,而是人类认知方式的巨大变革,从而引起了天文学、生物学等自然科学的一系列革命,产生了一系列新学科。因此,问题在于如何使用新的工具或新认知方式。如果仅仅利用计算机做语言研究的统计工具,也许不会产生新的分支学科,但是利用计算机作为语音分析和合成的工具,则形成了计算语音学。

第二种,计算语言学是把语言学成果应用于计算机。侯敏认为,计算机的应用领域几乎没有限度,什么学科的成果都可以在计算机上应用,因此在计算机上应用语言学的研究成果不足以建立新学科。问题不在于在什么学科的成果能在计算机上应用,而在于在计算机上所应用的成果的性质。与其他学科研究对象的性质迥然不同,语言学科的研究对象——语言——是人类最重要的认知符号系统和知识载体,因此面向信息处理的语言成果应用于计算机足以建立新的学科。以往的语言学研究是面向人际交流,而计算语言学研究是面向人机交流,两者具有截然不同的性质。版权所有

第三种,计算语言学是研究语言中的可计算问题。侯敏认为,虽然利用可计算理论研究语言符号是建立了一个新学科,但是这种说法偏于保守,没有把计算语言学推进语言学发展的作用充分体现出来。问题在于面向信息处理的计算语言学研究,其显著特点就是语言的可计算性。“推进语言学发展的作用”这不是计算语言学的定义,强调“研究语言中的可计算问题”未必保守,反而突出了计算语言学的显著特点。

第四种,计算语言学是建立基于计算机科学理论的语言学理论。侯敏认为,把计算机科学的基本思想和方法引进语言学领域,不但可以产生许多应用性课题,而且能够促使研究者从新的角度观察语言学,建立与传统语言学不同的理论。因此计算语言学是一种基于计算机科学理论所建立的语言学理论。问题在于:一方面计算语言学需要理论但本质上不是一门理论科学,同时并非所有的计算语言学家都乐意或适合从事理论研究,另一方面计算语言学的应用性质决定了研究成果的技术性特征,而绝大多数人可能更适合于——实际上也更需要——语言信息处理的技术性研究。

第一种和第二种是欧洲流行的广义定义,主张计算语言学是计算机和语言学的交叉,第三种和第四种是盛行于美国的狭义定义,主张计算语言学是计算机科学和语言学的交叉。也就是说,前者仅仅把计算机当成语言学研究中的一种新工具应用,而后者强调计算机学科的要求和理论对语言学的影响。陈小荷(2001)认为,计算语言学就是以计算机为手段来研究自然语言,较严格的定义是“通过建立形式化的计算模型来处理自然语言的一门科学”。要建立形式化的计算模型来处理自然语言,首先要完成适合于计算机使用的自然语言系统的描写。这一面向“人—机对话”的机用语言系统,与以往面向“人—人对话”的日常语法系统不同。因此机用语言系统的描写应当纳入计算语言学的研究范围,即完成了“机用语言系统”以后,才能“建立形式化的计算模型”使计算机获得自然语言能力。综上所论,计算语言学可以定义为——利用计算机作为工具研究语言、研究机用自然语言系统、研究语言系统或语言能力的计算性,同时建构基于计算机应用、数学模型、认知科学等相关学科基础之上的语言理论的新学科。姑且图示如下:

工具性:利用计算机研究语言

计算语言学描写性:研究机用自然语言系统

技术性:研究语言系统的计算性

理论性:建构新的语言学理论

虽然计算语言学的关键任务是研究人机之间的语言交际问题,即“如何教计算机学会说话”。但是从本质上来说,研究语言系统或语言能力的可计算性和利用计算机工具来研究语言是相通的,只是前者探索的是适合于人-机对话的语言能力,而后者讨论的是适合于人-人对话的语言规则。

依据目前的语言研究成果和信息处理技术路线,计算语言学包括应用基础研究、应用研究和理论研究三个方面。(陈小荷2001)应用基础研究指语言处理的基本技术研究。现阶段的主要进展是:1.自动分词技术:这是计算机理解自然语言的第一步。目前汉语书面语自动分词的正确率达到95%以上。2.词语特征标注技术:现阶段的词语特征包括词性和义项,这是句法结构理解的基础。两种标注可采用相似的计算模型但后者要复杂得多,目前尚无大规模的实验结果报道。3.语句分析技术:句法结构和语义结构是自然语言理解的关键技术,目前分析真实文本句子的正确率仅在40%左右。4.语料库建设技术:语料库是为特定目的而收集的言语作品集,包括语料处理和检索。研究语句分析需要存放句法分析树的“树库”,但目前的汉语语料库加工程度较低,所建立的树库很少且规模不大。5.语言知识库建设技术:语言知识包括词汇知识、语法知识和语义知识等,事实性和规则性知识分别放在机读词典和规则库中。语句分析技术之所以不能取得突破,主要原因就是目前尚无适合于中文信息处理的大规模语言知识库。

应用研究指自然语言处理的应用工具的研制。现阶段的热点主要有:1.机器翻译工具:半个多世纪过去了,机器翻译的质量仍然令人失望。现在通行的是有限范围翻译和机器辅助翻译。2.自动文摘工具:微软公司的词处理器word有用于英语的文摘功能,哈工大研制的hit-863i型中文自动文摘系统可按用户设定的比例压缩原文。3.自动校对工具:现在存在的主要问题是误报率过高,并且深层错误难以发现。4.信息检索工具:有主题词检索、全文检索两种。前者需要预先有一个主题词表;后者任意字符串都可成为检索对象。另外从语料库中自动获取各种知识的“信息抽取”在线工具的研究刚刚兴起。5.言语识别和言语合成工具:言语识别(或语音识别)可分为词语识别(计算机口语命令)、有限词汇识别(电话订票)和无限词汇识别(将成段说话转为文字)。言语合成(或语音合成)指用计算机将书面语转换为口语即“文语转换”,存在的问题主要是断词不当且语调刻板,仿真度亟待提高。

然而,如果以为应用性特征明显的计算语言学仅仅是技术,则未免失之于偏颇。计算语言学有着相应的理论研究,大致包括人工智能理论(含计算模型理论。目前的人工智能研究,主要还是集中在人工体能、人工技能。在语言能力移植电脑过程未取得实质性进展以前,还谈不上真正的人工智能)和语言学理论两个方面。例如计算机如何或是否可以模拟人脑和语言能力,如何寻找合适的语言计算模型等,就是计算语言学家特别关心的理论问题。除此之外,还有对自然语言本质属性的重新认定、面向信息处理的机用语法学理论、语言系统与数学模型的关系、语言结构和数理逻辑的关系、语言符号的数字化可能性及其局限性、语言的异质性和受限性或语域理论、元语言理论和研究方法等一系列问题。总体而言,一方面,由于牵涉的学科太多,计算语言学的理论研究还相当薄弱,另一方面,与科技发展息息相关的计算语言学不容过多地沉醉于理论探索。计算语言学的强大发展动力植根于鲜明的应用性,必须通过实践推动理论探索。

三、语言系统的计算机模式化要求

从语言学家的立场出发,语言系统的计算机模式化要求,就是要了解计算机需要怎样的语言描写成果,传统语言学(此处指非面向语言信息处理的语言学)的研究是经验描写解释型,而计算语言学的研究是实验操作技术型,自然语言系统要能进行操作技术化处理,首先必须实现语言的计算机模式化。冯志伟(1999,p.215)认为自然语言处理一般应经过三个过程:1.形式化,将所研究的自然语言问题以一定的数学形式表示出来;2.算法化,把自然语言的数学形式转换为算法形式;3.程序化,根据自然语言的算法形式编写计算机程序。侯敏(1999,p.30)认为语言系统的形式化或计算机模式化必须满足三个要求:1.高度抽象化,即从语言现象中抽象出一般规则;2.元语言的形式化,即采取形式逻辑、数学公式、程序语言等形式语言作为元语言;3.运用过程的严密化,即运用过程必须具有数学与逻辑的严密性。

袁毓林(1993)认为形式语言至少具有三个特点:基本单元的明确性、基本运算和基本关系的明确性、运算优先级别的明确性,但是自然语言在这三方面皆不明确。具体而言,1.语法范畴的边界不明,例如语素、词和词组之间、词类之间的界限不明;2.结构关系难以定义,通常所说的结构关系,如主谓、动宾等往往很难明确界定;3.层次关系不外显,人们通常根据语感和语境等来识别结构层次。侯敏(1999,p.36—40)不赞同这种分析,针锋相对地提出:1.可以根据实际需要或应用目的来确立词项或划分词类;2.结构关系分析需要深入到语义平面;3.形式语法已经给出了体现层次的结构树,在分析歧义结构中可加入语义限制,至于有些连人都解决不了的层次歧义结构也不必要求计算机解决。侯敏的观点是“理论追求的是完美,工程追求的是适用”,避开理论困难而采取工程方法,可以建立一个语言分析的近似模型。

所谓“语法范畴的边界不明”,主要是因为这些“范畴”的设置从某种程度上肢解了语言事实;所谓“结构关系难以定义”,主要是因为这些“结构”难以反映语言的本质结构;而所谓“层次关系不外显”,恰恰是语言结构的特点之一。这些探索和争论,实际上反映了三个根本性的问题:1.汉语结构语法学中长期存在的一些困扰,不仅是套用西方语法学框架框范汉语事实所产生的龃龉,而且也是语形语法学自身无法克服的固有问题。几千年来的西方语形语法学研究之所以能够存在,就是因为人脑在发育过程中逐步自建构了与认知能力协同发展的语义结构网络,为语形语法规则提供了语义选择清单与路径。虽然这些语形语法规则在人际交流中可以使用,但是在语言能力的计算机移植中却顿时陷入困境,因为计算机不存在语义网络结构的自建构功能,缺少语义激活路径。根据语形语法规则,计算机造出来的符合自然语句标准的概率极低,多为与对象世界不存在一致性的随机词语串。2.计算语言学所要求的自然语言的形式化,是基于计算机运算模式的语言研究成果。移植进计算机的“定域受限语言系统”和自然语言系统并不完全相等,严格说来,只是一种接近自然语言的计算机模式化符号系统。3.计算语言学的理论和方法,必须建立在语言的本质共性语义性和和计算机数字化运算模式的基础之上。如果对人类语言的认知语义性没有足够的认识,依然安居于语形语法窠臼而迟迟未能建构语义结构网络,语言信息处理的目标则不可能实现。

中国信息科学界有一种看法,计算机对于形态结构的印欧语言处理具有良好的支撑能力,而对中文信息处理则不然(陈力为2000)。之所以计算机对印欧语文信息处理具有良好的支撑能力,是因为印欧语文结构类型便于建立计算机处理模型。从历史上来看,谷登堡印刷术和打字机键盘都是基于字母的简约性而发明的。一方面,字母系统的符号简约性便于进行数据化处理,汉字符号的繁复性难以进行数据化处理;另一方面,印欧语的形态变化为形式化提供了识别标志,而汉语的孤立结构却没有明显的标志。依据现在的计算机处理模型,汉字的繁复性和汉语的非形态性必然导致中文信息处理中存在一些特殊问题:1.中文信息处理的第一个“瓶颈”。汉语的常用汉字数量繁多,汉字需要解决键盘输入、内部代码、汉字识别和显示、程序语言的数据类型、数据库的排序和检索等一系列问题。2.中文信息处理的第二个“瓶颈”。印欧书面语采取词分写形式,而汉语书面语采取单字连写形式。由于采用西方词法学框架,因此必须研制自动分词技术。假定考虑以“字”和“字义块”等作为汉语的结构单位,自动分词技术将相应改为“字义块”切分技术。3.印欧语的同音词较少,而汉语的同音字较多,同义词和量词也十分丰富,这些都给中文信息处理带来必须解决的难题。4.印欧语可以借助实词的形态变化即在词法层面上进行处理,汉语只有在句法和语义层面上进行处理,需要把语序和虚字的语法信息归纳出来再让计算机掌握。5.印欧语的句子结构是以动词性词语为核心的“主—谓”结构,而汉语的句子结构是以体词性词语为核心的“话题—说明”结构。印欧语的句子结构划一而句界分明,汉语的句子结构多样、成分缺省并且前后句义缠绵。

如果说语言系统是一座“冰山”,那么以上这些语言信息处理中遇到的难题还都是语言系统浮在海水上面的那一小部分,真正的障碍是隐没在海水下面的那一大部分。无论哪一种结构类型的自然语言系统的计算机模拟,包括形态语言,迟早会无可避免地碰撞上坚硬实在而又难以捉摸的“语义结构”。语言研究需要敢于在冰海下持续探索“语义结构”的潜水员。从自然语言系统来说,要让计算机理解语言通常认为必须使电脑能够解决三个问题:1.消除自然语言的一词多义;2.揭示自然语言的潜在意义;3.掌握自然语言的联想推理。这些问题都离不开语义分析,而语义分析技术尚处于探索阶段。(侯敏1999,p.247)对于第一个问题,一词多义可给出不同义项的清单。对于第二个问题,给出每一义项的显性和潜性语义特征清单。对于第三个问题,给出义项或义场之间的语义关联模式。由此可见,必须在以往的经验语感法和先验演绎法基础上,引进实验归纳法和结构优化法,消除语义“泥潭”情结,潜心于冰海中的语义“冰山”,才能逐步建构造语义结构网络。

就世界各种语言来说,语言的计算机理解的深层次难点可能还在于:1.至今尚未揭示出人类理解语言的机制,计算机只能局部模拟自然语言理解的某些简单过程;2.至今尚未完成人类理解语言所凭借的知识系统,建立人类进行语言表达的完整理论,计算机尚无从掌握人类语言的知识系统以及语言表达机制;3.至今尚未对人类语言所兼具的规则性和离散性、精确性和模糊性做出定量和定性的系统分析,计算机尚无从掌握语言系统的复杂性和语言使用的随机性。(傅永和1999,p.238—239)既然语言的理解和表达是一个以知识系统为基础的综合,因此语言系统的计算机模拟必须进行跨学科的研究,特别需要语言学、计算机科学、数学和认知科学以及百科知识学者的合作。与侧重于面对自然人语言学习的语形语法学不同,如果面向语言信息处理,那么就需要以计算机智能模式来重新确定语言学的理论基础、研究重点和研究方法。

面向自然语言处理的计算语言学理论基础,目前主要有基于语言规则性的理性主义理论(即先验主义)和基于语言随机性的经验主义理论。依据理性主义的语言学理论主要有:短语结构语法(psg)、扩充转移网络(atn)、配价语法(vg)、格语法(cg)、范畴语法(cg)、概念从属理论(cd)、多叉多标记树形图分析法(mmt)、词汇功能语法(lfg)和蒙塔古语法(mg)等。这些理论和方法,因为从“理性”出发,因此不可能反映以感受性为基础的自然语言的真实面貌,其缺失已经日益明显。为了克服理性主义理论的不足,采取经验主义理论处理大规模真实文本的语料库语言学应运而生。在收集语言资源或建立语料库的基础上,运用统计方法进行语言信息处理,语言交际过程的随机性由此得到关注。面对传统语形语法学对自然语言过程的不相适应和语义研究的复杂性,甚至有人尝试撇开语言学家的语言研究,以借助语料库逐步实现自然语言系统模拟。虽然借助语料库可以解决语言信息处理的一些问题,但是仅仅依赖语料库实现自然语言系统模拟注定此路不通。因为自然语言不是一个语料仓库,而是一个语义和语形复合性结构系统。无论是理性主义还是经验主义,都必须意识到:语言信息处理中所处理的是定域受限语言。这一研究的理论基础既不应是纯粹基于语言规则性的理性主义,也不应是完全依赖语言随机性的经验主义,而应是突出语言受限性的实验主义。世界语言学的发展经历了从经验科学到先验科学的漫长过程,计算机的发明必将促使当代语言学成为一门实验科学。强调计算语言学的实验主义,并非一概否定理性主义和经验主义,而是要在实验主义的基础上运用理性和经验的理论方法。

自然语言处理的语言理论,目前主要有基于语形的语言理解系统和基于语义的语言理解系统。前者是以语形语法研究的成果为出发点,从句法形式入手;后者是以语义研究的成果为出发点,从语义关系入手。两种理解系统在文本输入、预处理和自动分词等早期环节上基本相同,不同的是基于语形的理解系统先进行词法和句法分析,后进行语义和语用分析,基于语义的理解系统先进行语义分析和语义结构生成,后进行目标语的形式组合。生成语义学认为句子的句法特点取决于语义,语义部分才具有生成能力。认知语义学把意义看作一个植根于知识网络和信仰系统中的认知结构,理解一个语言形式的意义必须激发相关认知领域中的其他认知结构。既然语形结构只是语义结构的表层投影,既然基于语义的理解系统才符合语言的生成机制,既然语义处理才是语言信息处理的关键,那么只有基于语义的理解系统才能满足计算机对自然语言的理解和生成。

李葆嘉:论语言科学与语言技术(下)

四、人脑语言和电脑语言的性质异同

根据与“人脑语言学”的对应关系,计算语言学也可以称之为“电脑语言学”。从人脑角度出发,电脑语言学的研究是将人脑语言系统移植电脑工具的电子工程;从电脑角度出发,电脑语言学是电脑程序模拟人脑语言能力的仿生工程。

不管是系统移植还是能力仿生,首先必须认识到人脑和电脑的异同。1.构造机制的不同:人脑是生物神经系统,具有生物认知机制,而电脑是电子计算系统,具有电子运算程序。2.伴随情感的有无:人脑具有驱动感觉、思维和表达进行的情感性,而电脑只具有执行程序运算的机械性。3.经验基础的有无:人脑具有以感受性为特征的经验基础以及知识系统,而电脑即使配备了一定的知识背景,也不可能具有人脑一样的认知经验基础。4.认知理性的异同:人脑的感受和认知可以区别为非语言层次和语言符号层次,非语言层次包括直觉和感觉,语言符号层次包括知觉(游移性印象)、象觉(清晰性意象)和统觉(逻辑性抽象)。电脑的认知理性只能够定位于语言符号的象觉和统觉层次,难以具备丰富的认知层级系统。5.交流对象的异同:人脑的交流对象分别为对象世界和人际关系之间,具有交流的二重性;而电脑的交流对象只有执行程序的人或“人—机对话”的一重性,所谓“机—机对话”的实质仍然是“人—机对话”的连网,互联网交流仍然是执行者之间的交流。由于计算机永远不可能直接认知人所面对的对象世界,必须以人类的认知为中介,因此计算机永远不可能超越人类的智慧,计算机统治人类世界永远是一种不必要的担忧。

其次,必须认识人脑语言系统和电脑语言系统的差别。人脑语法或自然语言法则是在历史上逐步形成的,具有随机性、规约性、类推性和耗散性特点;而电脑语法或机用语言法则只是自然语法的再抽象化和再规范化,具有受限性、是否性、程序性和封闭性的特点。即使将来研究出适合于语言信息处理的机用语法,也不等同于自然语法。电脑所能获得的语言能力,只是自然语言的一部分或有限语言能力。因此,移植进电脑的语言系统必须进行界定:1.定域化语言:因为人脑语言是一个可以分为不同语域的复合性层级系统,所以必须首先确定电脑语言与人脑语言的对应层级,最佳选择就是规范性的日常语域。2.受限化语言:只能采取有限网络模式,才能将自然语言裁剪成适合计算机运算模式的机用语言。3.形式化语言:必须将定域受限语言的语义结构和语形规则分别形式化。4.算法化语言:借助一定的数学模型,将形式化语义和语形系统数字化。5.编程化语言:依据一定的程序语言,将数字化语义和语形系统编程化。

语言信息处理的目标,就是在受限性语言层面上逐步实现人—机对话。归根结底,自然语法≠电脑语法,电脑语言系统是通过建立形式化的计算模型进行处理的定域自然语言系统。电脑的运算速度可以远远超过人脑的思维速度,但是电脑不可能具备人的能动性认知行为。语形语法学面对是人—人对话,人们在语言习得过程中不知不觉地形成了建立在认知能力之上的语义结构网络,为语形语法规则提供了一份语义可选性清单。语言信息处理面对的是人—机对话,而语言“白板”的计算机并不具备这份语义可选性清单。语形语法规则,在教计算机如何说话的过程中顿时陷入困境。几千年来的西方语法学之所以能够延续下来,全赖人们具有基于认知能力的语义结构网络的自建构功能。反之,正是这一语义结构网络的存在,致使以往的语言学家误以为语形语法就是语法的全部或主要,而将语义结构法则长期放逐出语法学领域。

自然语言系统的计算机处理对西方具有两千多年传统的语形语法学提出了根本性的挑战,也为东西方语言学的合流带来了新的契机。回顾20世纪东西方语言学合流的历程,之所以出现西方语法学框架和汉语事实的错位,是因为合流基点的选择陷入误区。西语具有丰富的语形结构(这里指形态变化)而汉语基本没有(汉语主要依靠语序、虚词、韵律和语气,另外对语境或语用具有极大依赖性)。选择建立在形态变化基础上的西方语法学框架作为合流的基点,必然导致这一过程的曲折。反思的结果显示,东西方语言学合流的基点应当是建立在人类语言所共有的语义结构基础上的语义语法学理论。随着对语言能力研究的进一步深入和语言信息处理对传统语言学的挑战,传统语义研究在新的形势下得以复活。随着世界语言学从20世纪60年代以来出现了从语形研究向语义研究的转移,东西方语言学研究的合流将在新的基点上逐步实现。

五、面向语言系统模拟的语义语法学

尽管乔姆斯基理论认识到语言形式化的重要性,但生成语义学才是语言研究本体的转向。虽然配价语法和格语法的引进和对汉语语法意合性的认定,促使语义句法研究成为当代中国语法学界的热点,但迄今为止,中文信息处理应用系统自觉而全面地运用语义研究成果的鲜见。这一现状的表象似乎是语义研究成果不多,其根源却在于没有彻底认识到——必须从人类(不限于印欧族群)普通(不限于欧洲唯理主义)语法(不限于形态语言)的高度,来解决语言理论和研究方法的创新。无论是语言信息处理,还是语言机制揭示,汉语研究都需要既能反映汉语个性又植根于人类语言共性的原创理论。

人类的认知表现为对象世界的符号化(认知对象的符号化形成语义单元)、范畴化(语义单元的范畴化形成语义类别)和关联化(语义类别的关联化形成语义结构)。西方语言中的词法范畴原型是先民通过语音形式所表现出来的认知范畴或语义类别。语言的形态标记性、单位分布性和结构层次性都是语义类别关联化在表达层面的投影或者制约。一方面,随着人们认知的发展,反映原始认知足迹的形态范畴(如原始生物观的“性”、原始计算法的“数”)的价值日益消解;另一方面,随着语言系统的演化,表现原始认知足迹的语法手段又不可避免地合并、弱化和丧失。语序、功能词等手段的补偿,导致语言结构类型从综合型向分析型方向嬗变。这一过程证明,原始词法范畴在句法结构中并不具有充分必要性。一种语言可以没有词法形态变化,但不可能没有语义结构规则。不同的自然语言之间之所以可能互译,其基础就是存在可互通性语义,尽管结构类型迥然不同。(李葆嘉2001)

由此可见,人类语言的本质属性是语义性,其他属性都是语义性的派生。人类语言的共性可以概括为:在人类感知对象世界的过程中,神经机制依据象似性模式促使对象世界语符化,音义一体化的语符具有实体性和范畴性,由此组成的语义结构具有语境性和关联性,语义结构的语境性表现为语用、语义结构的关联性投影为语形,而语义结构模式具有生成性。图示如下:

神经机制语义实体语境-语用性

象似性认知过程语符语义结构生成性

对象世界语音范畴关联-语形性

在自然语言能力移植工程中,计算机需要的是具有语言本质共性的语义结构网络,由此有必要首先建构语义语法学。所谓“语义语法学”不是“语义+语法的学”,而是以语义为研究对象的语法学。把语义结构的表层投影——语形作为语法研究的纯正对象,有悖于语言结构的真实本体。乔姆斯基试图在语形结构进行数理化描写的基础上,建构反映语言能力的生成语法体系势必捉襟见肘。这一初始思路必然导致“抛开语义——深层语义——语义解释——逻辑表达——逻辑式”这样的“不断革命”。虽然乔姆斯基强调语言研究的目的在于揭示语言天赋,但依据其理论思路:普遍语法(研究对象)——语言能力(哲学基础)——自然主义(学科性质)——数学方法(方法借鉴)——符号描写(形式载体)——形式语法(研究成果),显然缺少人类天赋中最关键的认知性语义能力这一环节。完全排斥语义的经典理论阶段,其句法结构规则必然导致生成出一批语言事实中并不存在的语符串。即使在不得不引进语义解释的标准理论阶段,也没有放弃把形式结构作为句法生成的基础规则。然而,任何脱离语义的语法形式化注定流产,不可能达到揭示语言生成机制或普遍语法的目标。

如果说语义语法学的语言观强调人类语言的本质共性是语义性,那么语义语法学的语法观则突出语义结构是语法的主要研究对象。在欧洲传统语文学中,“语法”主要指基于形态变化的词法和句法规则。在历史比较语言学时代,“语法”包括语音法则,因此才有“青年语法学派”之称。20世纪的结构主义和描写主义促使“语法”研究的对象日益窄化。依据语言是音义符号系统这一论断,所谓“语法”即语言结构之法,当包括语音结构法和语义结构法。在语言系统的第一次划分中没有通常所说的“语法”即语形结构法的位置。语形结构是语义结构的表层投射或制约,语形结构法依附于语义结构法。语言系统的音义二分以及相关研究学科,图示如下:

语音分析(生理语音学、物理语音学)

自然语音解析

语言(语音学)语音结构(音位系统学、语流节律学)

符号语形结构(语形语法学)

系统语义投影聚合性义场(词类)

(语义学)语义结构(语义语法学)

组合性义场(句模)

以往的“语音、词汇、语法”三分法,迷糊了研究者的视线。虽然语形语法研究在语言交际和语言教学中具有一定或者相当用途,但是从研究角度而言,却避开了关键的语义结构法则。

人类认知的本质是对世界图式的语义符号化,人所认识的世界就是存在于语言符号系统中的世界。语义结构网络表现为“实体范畴化”(聚合性义场)和“关系模式化”(组合性义场)的相互交错。广义语义不仅包括实体范畴化的词汇语义和关系模式化的结构语义,而且包括语境范畴化的语用语义。语法的真实本体或语法研究的切实对象应当是语义范畴及其关联模式。结构语法和生成语言的不同之处,在于前者强调“语言系统”,而后者强调“语言能力”,但其共通之处却在于皆以语义结构的虚象——语形作为研究实相,始终游离于语法真实本体之外。依据语形语法学的有限范畴和简略框架(词类划分、语形成分、短语结构、句子成分等),既难以深入分析句法结构,更不可能有效驾驭语言结构的生成机制。从表达来说,语义编码是一切语言编码的基础,要揭示语言的奥秘必须从语义入手。语形型语言(并非只有语形,而是语形隐含或遮蔽了语义语法)和语义型语言(并非没有语法,而是没有形态变化语法)的研究基础,都应是语符的语义性。语义语法学的语法观突出语义结构,表面上突出汉语的个性特征,实质上受制于人类语言的本质共性。关于语形型语言和语义型语言的大致异同,图示如下:

语形型语言:形态手段

语义范畴——语义网络(知识世界)——元语言(日常认知)

语义型语言:非形态手段版权所有

人类的语言符号系统,本质上是一个意义隐喻系统。作为人类认知基本能力的隐喻,其更深层次是源于动物性感受的模仿(基于事物的相似性)与借代(基于事物的相关性)这两种认知能力。关于语言符号系统的形成大致流程,图示如下:

神经机制情绪模式

认知机制具体感受元语言(日常认知)——语义网络(知识世界)

对象世界经验框架

西方语法学源于古希腊的“语言·哲学·逻辑”混沌母体,西方哲人的逻辑研究基于思辩性语言活动。因为逻辑的基本单位是概念和命题,因此人们往往把注重语义的语法研究混同于逻辑的研究。汉语实词的义类划分不是根据逻辑意义,而是借助日常语义;汉语句读之间的语法关系不是根据逻辑关系,而是遵循事理关系。虽然逻辑规则是语法规则的部分再抽象化,但泛逻辑主义却致使人们误以为语法规则都可以逻辑化。自然语言首先具有本能传情性和日常认知性,语言结构法则主要依据广泛存在于日常生活中的事理关系。这一事理关系包括:时序先后性、空间位置性、主观因果性、主观目的性和评估好恶性等等。不是日常语法以思辩逻辑为基础,而是思辩逻辑以日常语法为基础。同样,虽然可以借用数理符号转写具有算法性的语言结构法则,但不可把语言法则混同于数理逻辑规则。

语义语法学的技术路线,是从建构现代汉语元语言系统到建构现代汉语语义网络。虽然自然语言信息处理依赖于语义结构的形式化,但是一些语言学家往往视语义研究成果为“非语法”,并且对其形式化的可能性持怀疑态度。一方面语义单元不具备语形变化的显著标记,而包含较多的意会性;另一方面语义单元并非没有范畴标准,也具有感受或认知的一致性。所谓语义的客观性和主观性就是语义的集体认同性和个人联想性,其本质是个体使用的“素单位”和集体认同的“位单位”之间的矛盾。语义语法学的研究对象首先是具有集体认同性的“义位”(标准体),然后才有可能是仅具个人使用性的“义素”(义位变体)。尽管语义单元或语元数量众多,语义结构关系复杂,但它们以潜在的元语言系统为基础。语义结构网络由语元实体和语义关系组成。同类语元之间具有聚合性语义关系,异类语元之间具有组合性语义关系。换而言之,每一语元都具有两种互相制约着的语义关系,一是同一义场内的各个“义位”之间的“义征”(语义特征)异同,一是不同义场的“义位”之间的“义联”(语义关联)异同。由此,可以依据义征和义联的异同而建立聚合性义位系统和组合性义联系统,在两者基础上在编织语义结构网络。句法结构的形式化应当是语义结构的形式化,而语义结构的形式化就是义场关联模式。

现代汉语语义语法的基础研究是建立“现代汉语元语言系统”,这一研究可比喻为“语言基因图谱分析工程”。其研究思路是:首先归纳出现代汉语词典中用于释义的最低限量词汇,以建构释义元语言系统;其次依据日常语言交际和语言教学中的用词,参照释义元语言以建立词汇元语言系统;再次抽象出义征范畴以建立析义元语言系统,完成语义标记集。在以上成果基础上,一方面可以结合认知心理学和神经语言学的成果进一步研究认知元语言系统,另一方面可以依据语言信息处理的要求,建立机用元语言系统。(李葆嘉等2002)

在现代汉语元语言系统这一基础性工作完成以后,才可以逐步建构现代汉语语义结构网络。研究程序和主要方法大致如下:1.义征对比法。依据有限网络模型,借助析义元语言系统对义元进行形式化描写即标注义征。给出义元在义场内的语义特征,其目标是建构聚合性义场。2.义联配比法。依据有限网络模式,对语义符号的配比关系进行形式化描写即标注义联,在分析和描写过程中归纳出关联性元语言系统和语义结构关联框架。语义句法的本质是相关义场之间的配比,因此义联标记体现着义场配比。给出义场之间的语义选择或语义制约规则,其目标是建立组合性义场。3.语形标记法。汉语具有词序、虚词和韵律等形式手段。韵律手段属于语音句法,可姑且不论。汉语的语形大致可以概括为两种:附着在词或词组上的词语级语形是完构成分;附着在句干上的句子级语形是完句成分。在进行汉语语形范畴化研究的同时,寻找语义关联和语形成分之间的对应性,然后对语形系统进行层级性形式化描写。4.合成建构法。在义征、义联和语形研究成果的基础上,通过相关标记的合成以建构语义结构句模系统。

“语言能力移植工程”的语言学部分主要是语义结构网络研究。通过建立形式化的计算模型,可以将语义结构网络进一步形式化、算法化和程序化。语义语法系统研究的每一结果,都可以也应当用计算机操作作为验证。以往的语法学研究,除了执著于语形研究以外,还有一个根本性的缺憾,就是不具备自然科学研究中的实验手段,因此难免经验性、臆断性和游移性等。采取计算机作为研究和验证手段,从而使语法研究具有鲜明的技术性和可证伪性。人们常说,只有学会一门外语,人们才真正了解自己的母语。与此同理,只有计算机掌握了自然语言,人类才深入揭示出自然语言的奥秘。换而言之,根据语言学习对象的不同,可能存在三种教学语法:一种是母语教学语法(着重于语形语法,因为人类对语义结构网络和语言知识库具有自建构能力),一种是对外语言教学语法(需要在语形语法的基础上增加与语言理解相关的社会文化知识,因为不同语言的语义结构网络具有不同的文化性),一种是计算机模拟语言能力的语法(需要语义语法和语言知识库,因为计算机不具备语义结构网络自建构能力以及与语言理解相关的知识系统的自学习能力)。也只有揭示出语义结构网络,语法学研究才能够在语形语法研究的基础上取得全面突破,语法形式、语形语法意义和语义语法意义,才能够全面贯通。

尽管语义研究及其形式化相当困难,但是在语义语法学理论的指导下,根据定域(语言定域)、定量(词语定量)、定性(义元定性)、定式(义联定式)的“四定”原则逐层实施,自然语言的理解与生成有可能在单句模式系统中首先实现。只要对语言本质的探索和人脑语言移植电脑的目标不变,就必须穿越语义研究的沼泽地。如果说20世纪是语形语法学的世纪,那么可以预言21世纪将是语义语法学的世纪。

六、语言科技复合型人才的培养

自然语言的计算机理解和生成已经成为国际语言学研究的聚焦,语言信息处理的技术水平已经成为当前衡量一个国家现代化水平的重要标志之一,尽快培养兼通语言学、计算机科学、数学和认知科学的复合型人才迫在眉睫。据《美国计算语言学杂志》1986年统计,全球设置计算语言学博士学位的大学已有105所,其中美国63所。在英国曼彻斯特大学已有计算语言学的学士和硕士专业。(侯敏1999,p.27)

中国的机器翻译在20世纪50年代启动,但由于反复不断的政治动乱停滞了近20年。1981年,成立了中文信息学会。1987年,隶属于中文信息学会的计算语言学专业委员会成立。通过计算机专家和语言学家的努力,已经取得语言信息处理的一系列成果。但迄今为止,中国大陆计算语言学方向的研究生的培养,或附属在汉语言文字学、语言学及应用语言学学位点,或附属在计算机应用等学位点,专门性的本科专业迄今尚无设置。根据目前中国高等教育学科体系,一方面,语言学和计算机科学分属不同专业,兼通语言学和计算机科学人才的培养如隔重山;另一方面,“中国语言文学”学科中,作为学术或准科学的“语言学”在前而作为艺术或教化工具的“文学”为重,两者始终捏而不合。

计算机学术研究论文范文5

【关键词】主体 云计算 产业化 系统动力学

中图分类号:TG333.2 文献标识码:A 文章编号:1009-914X(2013)35-204-01

0引言

目前国内外对云计算作出了大量研究,对于云计算的发展现状、关键技术、安全风险等研究取得了丰硕成果,但对于云计算产业化的研究还较为缺乏,尤其是将云计算产业化视作一个动态演化过程的研究并不多见;对云计算的研究还停留在初级阶段,得到具有实践性和可操作性结论的文献资料还较少。系统动力学被誉为是社会经济发展的实验室,运用系统动力学分析方法建立的模型能够充分反映系统的非线性结构和动态变化趋势。实施主体是云计算产业化过程中各项事物发展的提供者,在系统模型中起着核心作用[2],虽然有从主体角度研究高新技术产业化的,但从主体出发建立云计算产业化系统模型,并从系统动力学角度来探讨主体的作用及其关系的文献缺乏。

1 基于主体的云计算产业化系统的概念

云计算产业化系统的主体主要包括政府政策支持、高校和科研机构技术支持、投资机构资金支持、企业的综合管理支持、消费者的市场支持,这些主体要素的活动及其相关之间的互动关系,促使产业化活动的成功。

2 基于系统动力学研究的理论基础

系统动力学综合了信息论、决策论、反馈控制论、系统论、计算机仿真及系统分析方法,是一种处理复杂问题、定性与定量研究相结合的系统方法。它强调以系统思维的方式来分析问题与解决问题,通过因果反馈关系描述系统的动态复杂性,特别适合于解决经济、社会、生态等非线性复杂大系统问题,以帮助人们了解系统动态行为的结构性原因[3]。

3 基于主体的云计算产业化系统动力学模型

3.1 科研主体子系统

本文的科研主体包括高校和科研机构,两者的研究活动一致,包含云计算的基础研究和应用研究,即虚拟化技术、分布式存储等云计算主要基础技术的研究与开发。

应云计算发展趋势的要求,政府加大对云计算研究的支持,从而使高校和科研机构的研究人员注重对相关课题的申报,增加云计算的科研人数和科研项目数量,使科研成果(论文和专利)数量大大增加。企业可以通过与科研主体的合作,使科研机构有充足的资金进行基础研究,并将科研机构的成果转移到企业。同时,风险基金组织看到技术成果的利润前景,加大与科研机构的合作。反过来,当企业和风险基金组织对科研主体合作力度增强时,政府就会减少财政支持,使得科研机构的成果有更多的市场应用前景,不局限于研究课题。

3.2 投资主体子系统

投资主体主要指企业和高校外部融资机构,主要包括政府投资、银行贷款和风险投资机构的融资,其中银行贷款和风险投资机构对政府起着负反馈的作用投资的主要目的是使云计算规模化发展,获取高额利润和效益,这里的投资具有“高投入、高风险、高回报”的特点。

3.3 企业主体子系统

云计算作为高新技术,企业在其发展中起着核心作用,顺应国内外互联网发展趋势,调查消费者需求,与科研机构联合,吸收资金,将基础技术应用于云计算服务商品的开发中,并进行大规模推广,提高云计算商品的市场占有率。

从商业的角度,成功的产业化必备的要素包括市场规模,市场潜力和经济光景[5]。对于云计算来说,要从互联网发展的趋势入手,使得消费者对于云计算相关技术的应用更加广泛,随着消费者需求不断增强,市场占有率不断提高,更多企业开始转向云计算产品的研究开发,投资力度加大,获取高额利润。相反,利润增高使成本不断降低 ,逐渐有企业推出市场,从而形成负反馈作用。

3.4 动力学模型及分析

云计算产业化发展的过程包含多个连接在一起的正负反馈回路,连接方式的不同,导致了产业化发展系统的复杂成长特性。云计算产业化系统分析框架表明,产业化发展的过程实际上是其内部促进发展和环境条件限制其发展的正、负反馈机制共同作用的结果。当促进产业化发展的正反馈起主导作用时,云计算加速产业化发展;当限制产业化发展的负反馈起主导作用时,新兴技术产业化进程放缓。

为了实现云计算产业化健康发展,必须在科研主体、投资主体和企业主体3个系统中对各因素间的相互作用机制进行定性和定量研究,得出因素间相互作用和影响的规律,从而把握云计算产业化的发展规律。通过对模型动态过程的研究,可以找到促进云计算发展的内在驱动力,以及限制云计算发展的瓶颈,从而降低产业化内部能量的消耗,提高产业化效率。通过对模型中重要因素的动态分析,可以考察实现云计算产业化的优化路径,为云计算产业化发展提供完善的产业化政策建议和解决方案。

4 结语

本文在研究云计算产业化路径和相关主体的基础下,提出基于主体的云计算产业化系统的概念及其特征,在对云计算产业化机制进行细致思考后,借鉴系统动力学的研究方法,主要针对科研主体、投资主体和企业主体分别建立分析模型,并对模型的内部关系和运行机制进行详细阐述。最后对3个子系统之间的因果关系进行分析,建立3个主体之间的系统运行模型。本文的研究为定性分析云计算产业化提供了理论依据,也为进一步定量研究产业化投入产出、制定相关发展政策奠定了基础。

接下来,将以此研究为基础,根据主体要素之间的关系及内部运行机制,建立数学模型,调研相关数据,通过各种分析方法描述变量关系,并应用netlogo仿真软件对模型进行模拟,为云计算产业化发展提出指导性建议。

参考文献:

[1]詹洪文.云计算核心技术及其产业化浅析[J].高新技术产业发展,2011:30.

计算机学术研究论文范文6

关键词:计算机应用技术;实验课程体系;实验项目

计算机应用技术专业是我院于2005年设立的,学校于1987年成立了经济信息管理筹备组,设立“经济信息管理”本科专业,在管理信息系的基础上成立了信息学院,并于2006年开始进行“计算机应用技术”专业招生,学院将计算机应用技术学科确立为重点建设学科,学科建设目标是以信息管理与信息系统、电子商务等信息类专业为支撑点与财经等优势学科交叉渗透、互补发展;开设计算机科学理论、计算机软硬件系统及应用知识,包括计算机硬件、软件、网络技术与应用的基本理论、基本知识和基本技能与方法,熟练地进行程序设计和使用数据库技术和网络建设等从事针对金融、经济、统计等财经应用领域的软、硬件系统的开发设计或系统集成、企业信息管理,培养具有坚实的计算机软件理论基础知识,较强的应用软件实践与开发能力高级人才[1]。

由于发展时间短,该专业暴露出一些问题,诸如专业定位不明确、专业特点不突出,特别是实践教学环节,对于“面向应用,强调实践”的培养目标来说,直接关系着其目标的实现。在整个实践教学环节中,实验课程体系中哪些课程应该开出实验?开设哪些实验项目?这些问题对于所有开设此专业的财经类院校都在探索实践中。

1实验教学课程体系

1.1实验教学课程体系设置目标

实验教学课程体系设置目标是建立与理论教学有机结合,以能力培养为核心,确定分层次的实验项目。由于计算机技术专业是应用性很强的学科,并且随着大学生就业形势的日益严峻,考虑到学生的后续发展,计算机应用技术专业实验项目的设置和选择,主要依据两个方面,其一是注重与理论教学的有机结合,合理分配理论课与实验课学时的比例,根据培养目标形成配套、科学的实验教学课程体系,将培养学生宽厚的基础知识、扎实的专业知识和现代的计算机应用技术知识统一起来,培养学生科学思维能力和创新设计能力。其二是考虑计算机专业毕业生的社会需求,就业方面要求实验项目应与新实践技术应用、工程实践紧密结合,融入科技创新和实验教学改革成果;另外,考虑部分学生有继续深造的需求,应主要考虑实验项目与科学研究紧密结合,介绍新技术、新设备和新的研究发展方向。

根据《中国高等院校计算机基础教育课程体系2008》中的课程设置,计算机专业实验项目包括了3类:软件设计实验、硬件技术基础实验和应用技术实验。其中,分层次的实验教学体系涵盖基本型实验、应用型、综合型、设计型、研究型、创新型实验等[2]。

作者简介:冯海旗(1964-),男,教授,博士,研究方向为信息管理的理论与方法;张媛媛(1982-),女,助理工程师,硕士,研究方向为计算机应用技术。

图1计算机应用技术专业实验项目

1.2项目具体设置

(1) 根据现有的实验器材,确定能覆盖本中心所承担的所有实验教学项目。

目前我院的计算机应用技术实验教学中心共有专业实验室7个,包括电子技术实验室、计算机组成原理实验室、计算机网络与信息安全实验室、信息管

理与系统实验室、电子商务实验室、本科生开放实验室和研究生创新研究实验室。近年来,在教育部专项的重点支持下,中心得到了快速的发展,现有面积约1000平方米,各类实验设备、仪器仪表约830台套件。根据现有的实验器材,指定了相应的规划,开设的实验覆盖高等院校计算机专业实验项目,如表1所示[3]。

表1本中心开设的计算机应用技术专业实验项目

序号 实验项目名称 实验课/学时 所占课程比例 所属类别

1 C语言程序设计 22 30% 软件设计类

2 数据结构 10 19%

3 数据结构课程设计 18 100%

4 操作系统 16 30%

5 编译原理 10 19%

6 软件开发工具 16 30%

7 软件开发工具课程设计 18 100%

8 数据仓库与数据挖掘 8 22%

9 Java程序设计 12 33%

10 面向对象程序设计 12 33%

11 UML面向对象建模 20 56%

续表

序号 实验项目名称 实验课/学时 所占课程比例 所属类别

12 IT项目管理 10 28% 软件设计类

13 软件测试 16 44%

14 电工与电子学基础 10 19% 硬件基础类

15 数字逻辑 10 19%

16 计算机系统结构 8 22%

17 计算机组成原理 16 30% 应用技术类

18 计算机网络 8 15%

19 计算机网络课程设计 18 100%

20 网站开发技术 20 56%

21 嵌入式系统 6 19%

22 微机原理与接口 18 33%

23 计算机安全 10 28%

24 人工智能概述 8 22%

(2) 参考其他院校计算机科学技术专业成熟的实验教学体系,逐步确定自己的实验项目。

北京语言大学作为文科院校中,开设计算机应用技术专业较早并且较成熟的院校,教学特色突出,培养目标明确,充分利用学校英语环境好的优势,培养计算机专业知识扎实,同时英语能力较强的复合型人才。其实验教学体系完整,有突出特色的实验项目,语言信息处理研究所始建于1987年,是中国第一个以汉语信息处理为主要研究方向的研究所。研究所面向实际应用,主要研究计算语言学理论和面向信息处理的汉语语言理论,发展自然语言处理关键技术和知识库,开发相应的工具软件和应用软件,支持对外汉语教学和语言本体研究。分析其文科信息技术综合实验教学中心所开设的实验项目不难发现,软件设计类的实验项目所占比例达到64%,突出其语言信息处理特色的实验课程,其中汇编语言编程和Perl语言编程分别设实验课,实验课时分别有36学时和18学时。

中国人民大学信息学院针对计算机科学与技术专业开设的实验项目中,必修课中相对我校现有的实验课程,增设了“面向对象程序设计”和“汇编语言”两门课程,在选修课中主要分两个方向,一是信息管理方向二是计算机应用技术方向,计算机应用技术方向所开设的实验课程,涵盖了目前计算机专业领域热门的课题,包括信息安全、数字通信、无线通信技术、

计算机学术研究论文范文7

引言

随着计算机现代智能的高速发展,计算机已经完全融入我们的生活,甚至占据了重要领域,从国家核心科技到每个人生活的小细节,都离不开计算机的覆盖和使用。我们简单的在键盘上操作几个键,打出一系列符号命令,就能使计算机按照人类的要求,高速运行和进展,从而达到人力所不能达到的速度和正确率。

我们从小学习数学,数学是什么呢?数学是利用符号语言研究数量、结构、变化以及空间模型等概念的一门学科。数学,作为人类思维的表达形式,反映了人们积极进取的意志、缜密周详的逻辑推理及对完美境界的追求。数学更多的是一种抽象的概念,是一门重要的工具学科。人类利用抽象的概念及一些固定的定律形成理论,而脱离实际应用的概念并不是人类发展学习的初衷,而是利用它们来指导实际,化抽象为实体。而计算机就由此演化。1946年2月15日界上的第一台计算机诞生在宾西法尼亚大学,主要运用于高倍数的数学运算。时至今日,计算机直接能识别的语言仍然是1、0二进制代码。

1 计算机中所需要的数学理论

计算机学科最初是来源于数学学科本文由收集整理和电子学学科,计算机硬件制造的基础是电子科学和技术,计算机系统设计、算法设计的基础是数学,所以数学和电子学知识是计算机学科重要的基础知识。计算机学科在基本的定义、公理、定理和证明技巧等很多方面都要依赖数学知识和数学方法。计算机数学基础是计算机应用技术专业必修并且首先要学习的一门课程。它大概可分类为:

1.1 高等数学 高等数学主要包含函数与极限、导数与微分、微分中值定理与导数的应用、不定积分、定积分及应用、空间解析几何与向量代数、多元函数微分法及其应用、重积分、曲线积分与曲面积分、无穷级数、微分方程等。各种微积分的运算正是计算机运算的基础。

1.2 线性代数 线性代数主要包含行列式、矩阵、线性方程组、向量空间与线性变换、特征值与特征向量、二次型等。在计算机广泛应用的今天,计算机图形学、计算机辅助设计、密码学、虚拟现实等技术无不以线性代数为其理论和算法基础的一部分。

1.3 概率论与数理统计 概率统计与数理统计包含随机事件与概率、随机变量的分布和数学特征、随机向量、抽样分布、统计估计、假设检验、回归分析等。概率论与数理统计是研究随机现象客观规律并付诸应用的数学学科,通过学习概率论与数理统计,使我们掌握概率论与数理统计的基本概念和基本理论,初步学会处理随机现象的基本思想和方法,培养解决实际问题的能力。这些都是计算机编程过程中不可或缺的基础理论知识和技能。

2 计算机编程中数学理论的应用

计算机的主要专业知识包括计算机组成原理、操作系统、计算机网络、高级语言程序设计、数据结构、编译原理、数据库原理、软件工程等。计算机程序设计主要包括如:c语言、c++、java、编译语言、汇编语言等编程语言的基本概念、顺序结构程序设计、分支结构程序设计、循环结构设计、函数、指针、数组、结构、联合以及枚举类型、编译预处理、位运算、文件等内容,掌握利用各种编程语言进行程序设计的基本方法,以及编程技巧。算法是编程的核心,算法的运用离不开数学,数学运算正是编程的基础。

计算机科学是对计算机体系,软件和应用进行探索性、理论性研究的技术科学。由于计算机与数学有其特殊的关系,故计算机科学一直在不断地从数学的概念、方法和理论中吸取营养;反过来,计算机科学的发展也为数学研究提供新的问题、领域、方法和工具。近年来不少人讨论过数学与计算机科学的关系问题,都强调其间的密切联系。同时,人们也都承认,计算机科学仍有其自己的特性,它并非数学的一个分支,而有自身的独立性。正确说法应该是:由于计算机及程序的特殊性,计算机科学是与数学有特殊关系的一门新兴的技术科学。这种特殊关系使得计算机科学与数学之间有一公共的交界领域,它范围相当广,内容相当丰富,很富有生命力。这一领域既是理论计算机科学的一部分,也是应用数学的一部分。

2.1 计算理论是关于计算和计算机械的数学理论。主要内容包括:

①算法:解题过程的精确描述。②算法学:系统的研究算法的设计,分析与验证的学科。③计算复杂性理论:用数学方法研究各类问题的计算复杂性学科。④可计算性理论:研究计算的一般性质的数学理论。⑤自动机理论:以研究离散数字系统的功能和结构以及两者之关系为主要内容的数学理论。⑥形式语言理论:用数学方法研究自然语言和人工语言的语法理论。

2.2 计算几何学是研究几何外形信息的计算机表示,分析和综合的新兴边缘学科,它是计算机辅助几何设计的数学基础。主要内容如:贝塞尔曲线和曲面、b样条曲线和曲面、孔斯曲面。

2.3 并行计算问题是 “同时执行”多个计算问题。他的延伸学科有:并行编译程序、并行程序设计语言、并行处理系统、并行数据库、并行算法。

2.4 形式化方法是建立在严格数学基础上的软件开发方法。软件开发的全过程中,从需求分析,规约,设计,编程,系统集成,测试,文档生成,直至维护各个阶段,凡是采用严格的数学语言,具有精确的数学语义的方法,都称为形式化方法。

2.5 程序设计语言理论是研究书写计算机程序语言的学科。主要内容如:研究语法、语义、语用以及程序设计语言的优劣。

计算机学术研究论文范文8

【关键词】计算机辅助翻译 教学与研究 平台

【中图分类号】H319.3【文献标识码】A【文章编号】1006-9682(2011)03-0036-02

目前针对计算机辅助翻译的相关研究主要集中在计算机辅助翻译软件的翻译机能或者翻译效果,再或者计算机辅助翻译与人工翻译的比较研究。而对于基于计算机辅助翻译技术的应用范围及应用前瞻性研究并不多见。本文在概括计算机辅助翻译在高校教学与研究中的应用现状的基础上,对其在高校教学与研究中翻译语料库的建立、计算机翻译实验室、如何服务于翻译教学与实践等方面的应用及存在的问题进行分析。

一、计算机辅助翻译的应用现状

在我国许多翻译工作者已改变传统的翻译模式,计算机辅助翻译技术的应用也日趋普遍。在这一背景下,国内一些高校特别是外语院校已经开始了计算机辅助翻译在教学中的应用与研究。教育部在2006年审批并批准了在复旦大学、中山大学、河北师范大学三所非专业外语类著名高校里设立本科翻译专业的申请。2007年3月国务院学位委员会第二十三次会议审议通过了《翻译硕士专业学位设置方案》,决定设置翻译硕士专业学位。这些都是我国翻译学科建设发展的大事。以下分“计算机辅助翻译系统的技术现状”、“国内高校中计算机辅助翻译的应用现状”两个方面,对计算机辅助翻译的技术及应用现状进行概述。

1.计算机辅助翻译系统的技术现状

目前计算机辅助翻译技术不仅用于文字处理系统,而且正朝着智能声控翻译通信技术的方向发展,并派生出了许多面向于翻译应用的实用计算机辅助翻译软件,如国产第一家辅助翻译软件公司“东方雅信”研发的“雅信CAT专业翻译软件”、“雅信网络翻译系统软件(CAT网络版)”、“Trados”、台湾地区的“功学电脑自动翻译系统”等,计算机辅助翻译技术的发展如雨后春笋般展现出勃勃生机。

2.国内高校中计算机辅助翻译的应用现状

作为翻译学科建设的一个方面,计算机辅助翻译正成为重要一环。国内一些高校为提升外语类学生的社会竞争力,满足社会对计算机辅助翻译人才的需求相继开设了计算机辅助翻译课程或在翻译教学课程中加入计算机辅助翻译教学内容,计算机辅助翻译人才的培养和计算机辅助翻译教育教学正步入加速发展阶段。如北京大学已经开设了语言工程系,其中就有颁发计算机辅助翻译硕士学位的专业;北航外语系也已为专业研究生开设了计算机与翻译的课程;另外,北京工商大学、江南大学等院校已相继开设计算机辅助翻译课程。

二、计算机辅助翻译在高校教学与研究中的应用范围

1.设置计算机辅助翻译实验室、拓宽传统翻译教学新途径

现代学生除了掌握语言的互译能力,还应学习计算机辅助翻译技术在翻译实践中的灵活使用。“计算机辅助翻译实验室”正是为培养学生掌握计算机翻译辅助技能、提高翻译水平而搭建的实践环境。为此,北京外国语大学外高翻学院、上海外国语大学高级翻译学院、北京工商大学外语系、江南大学等高校为配合计算机辅助翻译教学的需要建立了“机器辅助翻译(CAT)实验室”。“计算机辅助翻译实验室”建设势必成为学校实验室整体建设规划的重要组成部分。在利用计算机辅助翻译实验室所进行的翻译实践成果的基础上,可以展开诸多延伸应用。以下就此予以论述。

2.计算机辅助翻译实验室的延伸应用

设置计算机辅助翻译实验室,不仅能够从总体上改进和拓宽传统的翻译教学途径,而且其延伸应用也非常广泛。其延伸应用如图1所示。

如图1所示,在计算机辅助翻译系统的基础上,以建立“教学研究平台”、“翻译服务平台”、“教学实践平台”、“技术培训平台”为目标,可以在翻译语料库的建立、如何服务于同声传译及翻译教学实践、如何服务于音像资料库等方面展开广泛的延伸实践与应用。

(1)教学研究平台。在以上叙述中,利用计算机辅助翻译实验室所进行的活动应该以计算机翻译实践为中心。可以预见通过计算机辅助翻译实验室进行的计算机翻译实践应该是以各类文献、资料的翻译为重点。通过所进行计算机辅助翻译实践,一方面要提高掌握和利用好计算机辅助翻译技术的水平,另一方面在进行计算机辅助翻译的同时,要将其同翻译、对译语料库的建立挂钩。这样就达到了一举两得的效果。

通过基于计算机辅助翻译实验室建立的翻译语料库,在教学上不仅能够普及和培养学生的计算机辅助翻译基础知识与技能,还能在翻译教学中得以应用,在改进翻译教学手段与形式、增加翻译教学内容、改善翻译教学质量上将发挥重要作用;在科研方面,翻译或对译语料库将成为重要的参考源。例如,北京日本学研究中心所开发的“中日对译语料库”自问世以来,在中日互译对比研究中发挥了不可低估的推动作用。可以预见,在领域和范围更广的基于计算机辅助翻译而建立的多语种翻译语料库的协助下,中外文对照研究将得到很大促进。这样,通过计算机辅助翻译实践完全可以形成一个服务于教学与科研的平台。

(2)教学实验平台。图1中所示,可以将计算机辅助翻译实践应用于翻译或者同声传译教学实践中。通过计算机辅助翻译所翻译的资料可以作为翻译或同声传译课堂教学的资料使用。比如可以将翻译时事新闻资料形成长效机制,为翻译和同声传译教学实践提供新鲜材料,也可为出版实践性、时效性强的翻译或口译教材奠定基础。同时,也可以将部分翻译和同声传译教学任务放到计算机辅助翻译实验室来进行,充分激发学生的积极性和创造性,鼓励他们建立不同专业领域、不同层次的语料库。这样,在不断积累与改进的基础上,将形成多领域、多层次的翻译语料库。

(3)翻译服务平台。如前所述,翻译语料库可以应用到教学研究平台,翻译与同传实践可以应用到教学实验平台。那么,除此之外,通过利用计算机辅助翻译实验室,还可以建立学校分专业分语种语料库和语汇统一数据库,为学校的教学、科研文献和论文翻译提供服务平台环境,提高学校各学科学术论文外文翻译水平、各学科外文文献利用水平,促进学校对外学术交流和学科研究中对外文文献利用,使其成为面向学校教师和学生应用的语言翻译服务平台。

(4)技术培训平台。在教学实验平台中,就利用计算机辅助翻译实践进行翻译和同传教学实践进行了论述。在进行这些翻译实践中,应该对计算机辅助翻译实验室的翻译技巧与知识不断进行总结改进。掌握运用计算机辅助翻译知识的专业翻译人才也会应运而生。而先期培养的人才对今后的计算机辅助翻译人才的培养又能起到推动作用。最终,实验室将为从事外语和翻译教学方面工作的人员提供计算机辅助翻译技术的培训。

除了计算机辅助翻译技术培训外,还可以充分利用计算机辅助翻译实践,将其应用于音像资料库建立中。比如在组建配音团队的建设中,计算机辅助翻译可以在字幕资料的翻译中得以应用。这将大大提高音像资料库的发展效率。

三、结束语

在现今的外语教学中,翻译教学举足轻重。而作为翻译教学的一环,计算机辅助翻译虽然方兴未艾,却在高校的翻译教学与研究中越发彰显出蓬勃的发展潜力,也愈发受到重视。目前普遍的计算机辅助翻译研究更多的是注重对基于计算机辅助翻译软件的翻译机能或者翻译效果,再或者计算机辅助翻译与人工翻译的比较研究。而对于基于计算机辅助翻译技术的应用范围及应用前瞻研究并不多见。

本文就围绕通过计算机辅助翻译软件建立起来的计算机辅助翻译实验室,从而建立服务于高校教学与研究的“教学研究平台”、“翻译服务平台”、“教学实践平台”、“技术培训平台”等这四个平台为中心,就计算机辅助翻译技术的延伸应用进行了尝试性论述。希望能对计算机辅助翻译技术引入高校教学与研究中,以及这一技术的进一步成熟、完善、实践与应用有所裨益。

参考文献

1 冯志伟.自然语言机器翻译新论[M].北京:语文出版社,1994

2 梁爱林.计算机辅助翻译的优势和局限性[J].中国民航飞行学院学报,2004(3)

3 弈 风.专业翻译领域的首选技术――翻译记忆[J].翻译中国,2000(28)

计算机学术研究论文范文9

写计算机论文,必须具有1定的理论基础,除了应该具有1般的哲学、逻辑学等基础外,主要应该具有计算机学、心理学发及学科教学方面的基础。教师要做好“平时烧香”工作,经常系统的看1些计算机专著,广泛涉猎计算机报刊,特别是与自已所教学科有关的报刊。此外,也要做好“临时抱佛脚”工作,结合拟将撰写论文的选题学习相关理论。

毕业设计和毕业论文是本科生培养方案中的重要环节.学生通过毕业论文,综合性地运用所学知识去分析,解决一个应用问题,在完成毕业论文的过程中,将所学知识进行合理的运用,它既是一次检阅,又是一次锻炼.不少学生在作完毕业设计后,感到自己的实践动手,动笔能力得到提高,增强了跨入社会去竞争的自信心.以下内容希望能对学生毕业论文有所帮助. 关于本专业毕业论文选题

计算机专业毕业论文的撰写前提,是先要求学员结合自己的工作实际,完成一定的应用型课题(项目)设计/开发工作,然后在课题(项目)完成的基础上,学习并研究相关学科专业领域知识,将自己的实际工作加以

总结,以形成毕业论文.这也就是我们所要求的:论文一定要在自己的工作基础上撰写出来, 切勿上网下载或找几篇文章拼凑.

计算机专业的应用很广泛,几乎遍及各行各业,因此论文选题的的范围也很广泛.网络学员应该结合自己的本职工作,选择一个适合自己的课题/项目和方向,加以研究,并完成课题/项目的设计和开发.在开发过程中,需要学习相关的应用技术和工具.课题/项目开发前,一定要进行计划,要按软件工程要求的那样进行问题描述,软件需求分析,总体设计,详细设计与实现,最后是测试,在整个过程中,要像软件工程要求的那样,撰写文档.在课题/项目的开发设计中,要注意及时记录和小结开发工作中成功经验和所存在的问题,出现问题时,可以查资料,或向老师及同学请教.通常,在开发完成之后,学员会形成自己的观点和经验,这些观点和经验正是论文写作的宝贵基础.当然光有观点和经验是不够的,还应该在理论的高度进行提升,即以专业理论来指导自己的论文撰写工作.因此,从这一意义上将,论文不是一份软件工程文档,工作汇报或工作总结,而是对自己实践工作进一步提升.

现在通过例子加以说明.假如一学员在中学教初中物理,平时见过或做过一些初中物理课件,也知道学校的工资,人事等管理已经计算机化.该学员初步可以选择的论文题目就是初中物理课件的制作(或××初中物理课件的设计与实现),或中学工资管理系统和人事管理系统的开

发(或××中学工资管理系统的设计与实现),这一论文题目同时也是学员要设计和开发的内容.在确定题目后,将自己的构思与指导老师及时进行沟通,以得到老师的指导.在此基础上,可按照前面所讲述的方法,实现该系统的全部或部分(可视学员需求和时间而定),为此学员在结合软件工程的要求,学习课件制作工具的使用,或应用系统开发工具的使用.当课题(部分)完成后,就可以开始对论文的框架进行构思.

事实上,计算机理论与应用专业有很多热点问题值得研究的问题.

对于理论问题的选择,选题可以参考计算机中文核心期刊上相关作者已经发表的文章所涉及的内容,要注意的几点是,研究者应该具有:1)较好的数学基础;2)教扎实的本专业理论知识;3)一定的研究能力;4)较多的参考资料(至少能够找得到,或知道如何找).

对于应用问题的选择,则广泛得多.例如应用领域的管理系统的开发,这一选题中可以考虑的问题有基于网络/Web的应用系统,或者选择基于单机的应用系统开发.

教师根据社会需求所拟定的选题是:院系行政教学,科研和研究生信息管理系统,本科生学籍管理系统等. 相关选题可以本文参考附录.

二,是本专业论文写作的特点,写作要点

本科毕业论文通常有如下四种类型:

1.1 完成一个不太大的实际项目或在某一个较大的项目中设计并完成一个模块(如应用软件,工具软件或自行设计的板卡,接口等等),然后以工程项目总结或科研报告,或已发表的论文的综合扩展等形式完成论文. 这类项目的写作提纲是:

1) 引言(应该写本论文研究的意义,相关研究背景和本论文的目标等

内容.);

2)×××系统的设计(应该写该系统设计的主要结论,如系统的总体设计结论(包括模块结构和接口设计),数据库/数据结构设计结论和主要算法(思想)是什么等内容.);

3)×××系统的实现(主要写为了完成该系统的设计,要解决的关键问题都有什么,以及如何解决,必要时应该给出实验结果及其分析结论等.);

4)结束语(应该总结全文工作,并说明进一步研究的目标和方向等).

1.2 对一个即将进行开发的项目的一部份进行系统分析(需求分析,平台选型,分块,设计部分

模块的细化).例如对一个大中型企业管理信息系统中的财务部分进行调研,分析和设计等,这类工作可以没有具体编程,但应得到有关方面的初步认可,有一定的工作量.这类论文的重点是收集整理应用项目的背景分析,需求分析,平台选型,总体设计(分块),设计部分模块的细化,使用的开发工具的内容.论文结构一般安排如下: 1)引言(重点描述应用项目背景,项目开发特色,工作难度等) ;2)项目分

5.1 学术论文要求文字流畅,层次清晰,词藻不能过分华丽,近年国内外在计算机方面的论文的语言较以前生动,但用词都以准确,不过分夸张为度。

5.2 标题要能反映内容。如有新意更好。例如,下面题目是个不好的题目:"图像处理的某些问题的研究",论防火墙技术"等,其中的"某些问题"不如换成最中心的词汇。论防火墙技术题目太大,不适合本科生作。

5.3 学术刊物上论文摘要一般 300 字左右,需要较高的综合能力。而学生毕业论文摘要可以写一页( 1000 字左右),因此活动空间较大,要好写一些。

摘要可以在全文写完后再写。要简明,

中英文摘要应一致,要突出自己的工作,要提供几个 key words 。

写英文摘要时,可先用英文的习惯和用语写摘要 ( 可以借助于电子词典),然后英译汉 , 用中文摘要去将就英文摘要。反过来,如果先写好中文摘要,再汉译英,则很难把英文摘要写得地道。

为了使得英文表达地道、准确,可以读十几篇相关研究方向的论文的摘要,注意一些表达词的使用,如 present, implementation, propose, give, argue 等。

平行的内容宜用平行的句型。例如下面的例子中,一句主动,一句被动,语感就非常糟糕: "This paper proposes a new algorithm and a prototype is presented.....".

5.4 前言部分要写问题背景,动机,要说明自己工作的工作有用,有意义(才能鼓励读者读下去),通常在介绍国内外工作后,用"但是"一转,指出前人工作的不足,引出自己的工作。在前言中简述自己作的主要结果,(例如明确地列出几条,说明本文的主要工作,主要成果)。前言部分的末尾介绍文章的组织情况,各节内容。

5.5 突出特色,一个项目中工作很多,有些是同行皆知,自己也无创新的,可以略写,要多写自己遇到的特殊困难和创造的特殊解决方法。使人家读了能学到东西,看到作者的创意。为了突出特色,还可以在一节中分成小标题写,一个问题一小段,与计算机相关的论文中还可以把数据结构和程序片段夹叙夹议呈现出来,比只用汉字解释得更清楚。

5.6 上升到理论,一般硕士论文会要求这一点。如果本科生能够在毕业论文中得出有意义的定理或命题,一般会认为是好成果。可能会被推荐到杂志上发表,或在考研、求职中得到承认。

5.7 各部分应详略得当。一般地,毕业论文应该主要写作者的见解和工作,把自己的创新写深写透。综述要有述有评有比较。只要是作了实验,写了程序,一般是想写的太多,写不完。反之,会感到空虚,没有写的,有的学生抄书来充篇幅,效果不好。一般地介绍相关工作(前人的成果)部分不应该超过总篇幅的 1/6 。

5.8 完整的论文应包括测试、运行结果及分析(图表或曲线)。

5.9 结论,小结。说明解决了什么问题,有什么创新,下一步工作主要内容等。

返回目录

六、参考文献及引用

参考文献是论文写作中的重要一环,带着问题读文献或杂志上的论文,不但注意学习学术内容,同时也注意学习选题方法、格式、标准的套话、起承转合的语言和方式,参考文献的写法,字体的运用等等。在论文中明确给出参考文献的出处,既代表着对前人成果的继承,也代表了对他人研究成果的尊崇,是科学研究中应培养的正确的科学态度和做人准则。

参考文献的写法:按参考文献在论文中出现的顺序,用编码的方式给出,如 [1] , [2] ,等。参考文献包括专著、学术期刊、学术会议、技术报告等。

七、 摘要样板

学术刊物上论文摘要一般 300 字左右,需要较高的综合能力。而学生毕业论文摘要可以写到 1000 字,因此活动空间较大,要好写一些。下面是可行写法之一。

1. 介绍项目意义背景, 100-200 字。

2. 本文作的主要工作, ( 1 ),( 2 ), ( 3 ) ,..... , 400 - 600 字