iwannar0ckcancel中文意思思

中文数字_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&中文数字
以的形式表示,在开具发票、收据的时候经常用到,尤其在金融领域。但数字的中文表示和其它语言有很大的不同,如中文以每4个数字(万)为一个小的分隔。外文名&Chinese numerals拼&&&&音zhong wen shu zi特殊点大小写相关领域票据格式等
壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟、万、亿、元(圆)、角、分、零、整。
先看看以下两个有关大写数字的表格:
1、数码与大、小写数字的对照表:
阿拉伯数字
中文小写数字
中文大写数字
2、进位数码与大、小写数字的对照表
阿拉伯数字
中文小写数字
中文大写数字
通过上面的两个表格可以看出:不管是阿拉伯数字(1、2、3……), 还是所谓汉字小写数码(一、二、三……), 由于笔画简单,容易被涂改伪篡。所以一般文书和商业财务上的数字都要采用汉字数码大写: 壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟(“万、亿”本身笔画已经比较复杂,使用机会也少,没有必要再用别的字代替)。如“ 3564 元”写作“叁仟伍佰陆拾肆圆”。这些汉字的产生是很早的,用作,属于假借。数字的这种繁化写法,早在唐代就已经全面地使用了,后来逐步地规范化成一套“大写数码”。
到了明朝初年,因为当时的一件重大贪污案“”而发布法令,其中明确要求记账的数字必须由“一、二、三、四、五、六、七、八、九、十、百、千”改为“壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、陌、阡”等复杂的汉字,用以增加涂改帐册的难度。后来“陌”和“阡”被改写成“佰、仟”,并一直延用至今。《正确填写和结算凭证的基本规定》
银行、单位和个人填写的各种和结算凭证是办理支付结算和现金收付的重要依据,直接关系到支付结算的准确、及时和安全。票据和结算凭证是银行、单位和个人凭以记载账务的会计凭证,是记载经济业务和明确经济责任的一种书面证明。因此,填写和结算凭证,必须做到标准化、规范化,要要素齐全、数字正确、字迹清晰、不错漏、不潦草,防止涂改。中文金额数字应用正楷或行书填写,如壹(壹)、贰(贰)、叁、肆(肆)、伍(伍)、陆(陆)、柒、捌、玖、拾、佰、仟、万(万)、亿、元、角、分、零、整(正)等字样。不得用一、二(两)、三、四、五、六、七、八、九、十、念、毛、另(或0)填写,不得自造。如果金额数字书写中使用,如贰、陆、亿、万、圆的,也应受理。
一、中文金额数字到&元&为止的,在&元&之后,应写&整&(或&正&)字,在&角&之后,可以不写&整&(或&正&)字。大写金额数字有&分&的,&分&后面不写&整&(或&正&)字。
二、中文大写金额数字前应标明&人民币&字样,大写金额数字有&分&的,&分&后面不写&整&(或&正&)字。
三、中文大写金额数字前应标明&人民币&字样,大写金额数字应紧接&人民币&字样填写,不得留有空白。大写金额数字前未印&人民币&字样的,应加填&人民币&三字。在和结算凭证大写金额栏内不得预印固定的&仟、佰、拾、万、仟、佰、拾、元、角、分&字样。
四、阿拉伯数字小写金额数字中有&0&时,中文应按照汉语语言规律、金额数字构成和防止涂改的要求进行书写。举例如下:
1·阿拉伯数字中间有&0&时,中文大写要写&零&字,如¥1409.50,应写成人民币壹仟肆佰零玖元伍角。
2·阿拉伯数字中间连续有几个&0&时,中文大写金额中间可以只写一个&零&字,如¥6007.14,应写成人民币陆仟零柒元壹角肆分。
3·阿拉伯金额数字万位和元位是&0&,或者数字中间连续有几个&0&,万位、元位也是&0&,但千位、角位不是&0&时,中文金额中可以只写一个零字,也可以不写&零&字。如¥1680.32,应写成人民币壹仟陆佰捌拾元零叁角贰分,或者写成人民币壹仟陆佰捌拾元叁角贰分,又如¥,应写成人民币壹拾万柒仟元零伍角叁分,或者写成人民币壹拾万零柒仟元伍角叁分。
4·阿拉伯金额数字角位是&0&,而分位不是&0&时,中文大写金额&元&后面应写&零&字。如¥16409.02,应写成人民币壹万陆仟肆佰零玖元零贰分;又如¥325.04,应写成人民币叁佰贰拾伍元零肆分。
五、阿拉伯小写金额数字前面,均应填写人民币符号&¥&。阿拉伯小写金额数字要认真填写,不得连写分辨不清。
六、的出票日期必须使用中文大写。为防止变造的出票日期,在填写月、日时,月为壹、贰和壹拾的,日为壹至玖和壹拾、贰拾和叁拾的,应在其前加&零&;日为拾壹至拾玖的,应在其前加&壹&。如1月15日,应写成零壹月壹拾伍日。再如10月20日,应写成零壹拾月零贰拾日。
七、出票日期使用小写填写的,银行不予受理。大写日期未按要求规范填写的,银行可予受理,但由此造成损失的,由出票人自行承担。
也就是说,根据此规定第四第的3小点,你的这个金额有两种写法:
1、人民币壹拾万贰仟伍佰元整
2、人民币壹拾万零贰仟伍佰元整
新手上路我有疑问投诉建议参考资料 查看may i have a look?的中文意思是什么_百度知道
may i have a look?的中文意思是什么
May I have a look at your passport.May I have a look at your pamphlets?我可以看一看吗? 2? 我可以看一下您的护照吗:1?双语对照例句may i have a look? 我可以看看你们的小册子吗
其他类似问题
按默认排序
其他1条回答
我可以看看吗?请采纳。
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁中山大学中文系_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&中山大学中文系本词条缺少信息栏,补充相关内容使词条更完整,还能快速升级,赶紧来吧!
中山大学中文系师资力量雄厚。现有在编教职工67人,其中教授22人,副教授20人,博士生导师18人。我系在学科建设方面取得显著成绩。目前,我系为博士、硕士授权一级学科(现有8个博士点、7个硕士点招生),拥有1个博士后流动站(中国语言文学)以及两个省级重点学科(中国古代文学、汉语言文字学)、1个省级人文社科重点研究基地和1个国家重点研究基地(均为中国非物质文化遗产研究中心)。中国古代文学学科学术传统深厚,学术梯队整齐,是海内外公认的研究中国古代戏曲及文体学的重要基地。
中山大学中文系系徽中国语言文学系是历史悠久的学系之一。1924年广东大学(中山大学的前身)创办之初,便设有中国文学系。1926年广东大学更名为中山大学,中国文学系改称中国语言文学系。1928年1月,文史科成立语言历史研究所,以研究学术、发展文化为宗旨,内设考古、语言、历史、民俗四学会。1935年春,文史研究所(原语言历史研究所)改组为文科研究所,设中国文学部和历史学部,同年9月招收研究生。1939年,中文系又称中国文学系。抗日战争时期,中文系师生迁至云南瀓江和广东坪石、梅县等地,在艰苦条件下继续办学。1946年,语言学系成立。1953年院系调整,中文系又改称中国语言文学系,设汉语言文学专业。中文系与语言历史研究所、文科研究所、语言学系,在教学和科研方面有着密切的联系。1954年,语言学系合并到北京大学,该系部分教师转入中文系。1958年,中文系增设新闻专业,次年,该专业并入暨南大学。1981年,中文系设立汉语培训中心,1992年,该中心并入外国语学院。多年来,中文系本科只设汉语言文学一个专业。目前,在校本科生达500多人。近年来,研究生办学规模迅速扩大,办学水准逐年提高。目前在校研究生已近400人,其中博士生160余人。 89年来,毕业生遍布海内外,在不同领域表现卓越,赢得了较高赞誉。中文系人才荟萃,曾有许多著名学者在此任教。先后在本系任教的著名教授,早年有鲁迅、郭沫若、傅斯年、郁达夫、成仿吾、顾颉刚、、赵元任、罗常培、陆侃如、冯沅君、王力、岑麒祥,晚近有、商承祚、、方孝岳、董每戡、王起、冼玉清、黄海章、等。这些著名学者为中文系的学科建设和人才培养,作出了重要的贡献。本科生的培养目标是:专业基础扎实、知识面宽、实践能力强、思想素质高的汉语言文学专业专门人才。要求学生具有富于进取的创新精神,良好的综合素质,扎实的专业基础、突出的写作能力,较高的外语水平以及一定的电脑应用能力。学生毕业后能从事高等院校或研究部门的教学、研究工作,新闻出版单位的记者编辑工作,各级机关和企事业单位的行政管理、高级秘书等工作。1994年12月,被国家教委批准为国家文科基础学科人才培养和科学研究基地,经过多年的建设,已取得丰硕成果。2002年3月,经教育部专家组评估验收和高教司批准,基地被评为优秀基地。2004年6月,经广东省教育厅专家组评估和教育厅批准,中文系汉语言文学专业被评为广东省名牌专业。2004年,中国古代文学课程被评为国家精品课程。中文系系刊《薪火》采取多项措施,加强本科教学。如加强对基础课教学的投入,改革基础课课程体系;认真编写教材,更新教学内容;切实建设好一批省、校级重点课程。坚持固本培元,加强学生厚实的中国文化基础;同时,开设多种类型的选修课,拓宽专业口径,培养学生扎实的学术基础与开阔的学术视野。我系一贯坚持倡三风(自觉地学习、刻苦地学习、创造性地学习)、抓三文(作文、古文、英文),取得了显著成效。
长期在本科教学中实施“强化写作训练”和“全程导师制”计划,要求一年级学生写作百篇作文,二年级学生写作8篇读书报告,三年级学生写作学年论文和参加教学实习,四年级学生写作毕业论文。学生在学期间,其写作和学习活动,均有导师进行全面指导。这个计划已实施多年,颇有成效。我系的教学成果《强化写作训练,着眼提高素质》获广东省普通高等学校优秀教学成果一等奖获,《抓好教学实习,培养综合才能》、《培养高素质人才的重要举措——全程导师制》分别获广东省高等学校优秀教学成果二等奖。中国戏曲史是本学科最具特色的研究方向,由王起、董每戡在20世纪50年代奠基,迄今已成为全国戏曲研究的中心。近年来,以该学科为主体完成的《全元戏曲》(十二卷),已由人民文学出版社出版,在海内外引起较大反响,2001年获全国古籍整理一等奖,2002年获教育部第三届人文社会科学优秀成果奖一等奖。该学科还出版了一批研究古代戏曲、小说及诗文的专著,在学界有较大影响。古代诗文与诗文理论亦是本学科重要研究方向,近年来在文体学研究方面成果突出,在国内外学术界享有良好声誉。汉语言文字学学科设有三个研究方向:一是古文字研究方向,研究对象包括甲骨文、战国秦汉文字及相关的语言文字、历史文化问题;二是出土文献与汉语史研究方向,研究对象包括古汉语词汇、语法、音韵、训诂等方面;三是现代汉语研究方向。该学科在研究成果、学术队伍、人才培养等方面均有明显优势。该学科出版的《金文编》、《长沙楚帛书文字编》、《著名中年语言学家·卷》等著作,得到学界的高度评价。中国现当代文学学科包括中国现代文学、中国当代文学、民间文学三个研究方向,该学科致力于打通现当代文学的时限、海内外文学的地限,文学和文化的界限,具有创新意义。该学科出版的《中国新文学史编纂史》、《1903——前夜的涌动》等著作,获多项国家级和省部级科研成果奖。文艺学学科包括文艺理论与批评、美学、文艺美学等研究方向,已经取得一批富有特色的成果。语言学与应用语言学主要研究方向是语言学理论和应用语言学。该学科在方言学、汉语语法学、对外汉语教学研究方面,已经取得显著成果。比较文学与世界文学学科主要研究方向是中西文学/文化批评理论比较研究,尤其关注妇女、性别与文化再现方面的研究,已经形成了自己的研究特色,并产生了较大的社会反响。中国古典文献学主要研究方向是元明清文献和岭南文献。该学科在元明清戏曲、小说、诗文的整理与研究方面形成了自己的显著特色。民俗学学科是与人类学系共同建设的博士点学科。该学科继承了中山大学民俗学研究的优良传统而又进行了创新,在学科建设方面作出了新的贡献。该学科整理出版的《中山大学典藏民俗学丛书》,让海内外学界得以重新全面审视中国民俗学最早生成时的勃勃生机。近年来,大力开展对外学术交流活动,已与日本、美国、英国、新加坡和香港多所高校建立了学术交流制度,并与高雄中山大学中文系开展定期的学术交流。
新手上路我有疑问投诉建议参考资料 查看I decline中文是什么意思呢?_百度知道
I decline中文是什么意思呢?
提问者采纳
我拒绝的意思。
提问者评价
其他类似问题
按默认排序
其他1条回答
拒绝I decline to accept the end of man.我不接受人类末日的手法: I declined their offer of help。Decline.我谢绝了他们提出的帮助
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁中文信息处理_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&中文信息处理本词条缺少名片图,补充相关内容使词条更完整,还能快速升级,赶紧来吧!
是指用对中文的音、形、义等信息进行处理和加工。中文信息处理是自然语言信息处理的一个分支,是一门与、语言学、、信息学、等多种学科相关联的综合性学科。信息处理技术在现代有广泛的应用,从1980年代开始,中文信息处理进入了快速发展阶段,并极大地提高了中文社会的信息处理效率。中文信息处理分为汉字信息处理与汉语信息处理两部分,具体内容包括对字、词、句、篇章的输入、、传输、输出、识别、转换、压缩、检索、分析、理解和生成等方面的处理技术。外文名Chinese information processing领&&&&域计算机
基于、国家、等各种问题,所需要处理的文字,有
中文信息处理时不仅包括、繁体汉字,也包括、蒙文、、等大量的文字,周边国家的假名、,还包括古汉语文字、、等各种不同的文字。中文信息处理可以从硬件及两方面去看,以下详述中文信息处理的发展、现况及未来发展等多方面的面貌。基础研究:汉字字频统计、词频统计、汉语自动分词、句法属性研究、
汉字、通用汉字样本库、汉字属性字典、语料库等 输入技术:、中文手写输入、中文语音输入、等
输出技术:汉字字模技术(字型库)、汉字激光照排、汉语等
存储技术:汉字库标准等
转换技术:繁简转换等
信息处理:中文、中文文本校对、机器翻译、、中文人机界面等、、、、心理学、、数理统计、控制论、神经计算、模型论、信息学、形式化理论、等在1946年由IBM发明,当时的电脑主要用于计算。及至1960年代,商用开始普及,电脑被用于处理大规模的数据,当中其一个重要项目是的目录整理。在当时,及多家大学都有不少来自的藏书。为了有效管理这批藏书,必须要有一套有效处理文字的系统。这套系统包括了两方面:其一是如何把文字储存在内;其二是如何在电脑表示出东亚文字。
汉字在过去,每一台都有各自的数据表达方式,使电脑之间不能沟通。及至1960年代(ASCⅡ)的出现,之间才可以互相沟通。不过,ASCⅡ并不能有效处理英文以外的文字。
最早可以处理中文的,可以追溯到1970年。在当年举办的大阪万国博览会上,IBM公司公开了部分汉字处理系统的技术资料,到了1971年正式发表。当时公布的机种包括有「IBM 2345 汉字印刷机」丶「IBM 029 汉字穿孔机」丶「「IBM System/360-System/370 OS/VS」及「DOS/VSE」等。其後,本土公司也争相开发,包括有富士通的JEF(Japanese processing Extended Facility)丶NEC的JIPS(Japanese Information Processing System)及日立的KEIS(Kanji processing Extended Information System)等,全是大型。到了1979年5月,NEC发表了可使用汉字ROM的私人PC-8000系列;到了1982年10月,更开发出有名的16位元的PC-9801私人电脑,能处理汉字的电脑在渐渐普及。在七十年代末期,更出现一种专门用作编辑文件的文书处理器,可看成为一种拥有特定功能的小型,八十年代中後期再演化成手提方式,并可打印出汉字。至於输入方式,由日东芝发售「JW-10」起,「假名汉字变换」成为主流的汉字输入法;即以日文拼音的方式,配合人工智能,输入汉字词汇。在还没有真正的中文前,中国大陆部分学者依靠入口的电脑来处理中文。
1973年,新华社派出考察团到,参观了日本共同社丶日立丶日本电气丶松下及东芝等公司。他们看到共同社采用磁芯技术解决了2000左右汉字和片假名的存储问题,并发现工作人员使用大键盘方式输入稿件。他们回国後,提出了采用技术改善新华社收发编印四方面,并由中国四机部(民用机械丶核工业和核武器丶航空及电子工业)与北京市科技局邀请了富士通等公司到中国进行技术座谈会。後来,四机部提出研制汉字信息处理系统。在1974年8月,中国开始了748工程,包括了用计算机来处理中文字,展开了各种研究工作,后来到1980年公布了汉字编码的国家标准,1983年研究Unix中文化,1985年推出了Unix中文版。
台湾方面,早期美国空军研究部门,曾经与IBM公司合作研发中文,斥资了六千万、历时十年,研究电脑处理中文字的方法,结论是电脑不能处理中文。而当时的开始化,一批中文书有待编入目录。另外,多家公司也开发了式的中文系统,包括有王安丶工技院(中华一号到中华三号)及神通等。这些机器多数采用大键盘的输入方式,有数十至数百个键。到了1976年,中文电脑之父发明了一套形意检字法,并在1978年改进为仓颉输入法,以英文键盘输入中文。在1979年,朱邦复提出以图形功能及从显示器的英文字符产生器入手,研发中文,并由宏碁公司出产。之後,在原有英文操作系统上外挂中文系统的方法大行其道,多套中文相继推出,包括有国乔丶及仲鼎等。
中文信息处理至今经历了两次高潮:1980年代中期到1990年代中期之前,核心内容是汉字的计算机处理问题;经过几年的发展低潮之后,1990年代末,中文信息处理的重点转向、和语义处理方面。
汉字之难——被抛弃的时代:在上半叶,英文打字机的普及极大的提高了文字资料的录入速度。而由于汉字的复杂性,使中文打字机迟迟未能设计出来,再加之基础汉字的学习难度大、时间长,连都喊出“汉字不灭,中国必亡”。之后,虽然设计出,但要配备数千个铅字组成的大字盘,昂贵的机器成本和复杂的使用技术决定它不能普及到大众使用。对此也深感无奈,发出了中文“要走世界共同的拼音文字道路”的慨叹。这些局限于条件所限而做出的言论,在中文信息处理技术发展后期仍然被经常(断章取义的)提及。
朱邦复1984年的有这样的记载:“法新社8月5日电 新华社派了22名记者,4名摄影记者和4名技术人员在奥运会采访和工作。在全世界报道奥运会的7000名记者中,只有中国人用手写他们的报道”……此时只有中国人仍然用手写从事着创作。
汉字成了被打字机抛弃的“落后文明”,直到八十年代PC技术推广下,中文PC系统问世,中文信息输入的问题,才有了初步解决。汉字的拉丁化问题:,是给汉字进行注音的方法,从而易于中西方交流,或者代替汉字。有些人以为将汉字改造为文字,希望以此在短期内大幅增加中国人民的识字率。
缘起:中西方的交流很早就有了,而不同的文化交流需要语言的沟通,可以实现西方人对中国的了解。近代以前,汉字的拉丁化基本由西方人进行。近代中国遭受了一系列的变故,彻底打破了中国固有的文化自豪感。中国近代的一些思想家认为中国古代的一些遗留阻碍了中国的发展,包括思想、等,其中也包括汉字。
汉字由于其字数众多,学习比较费劲,而且由于师承不同,字的具体写法也有不同。近代科学大量引入中国,汉字在这些概念面前变得不够使用,又由于影响,汉字改革遂成为主流的社会思想。其中、鲁迅等提倡尤甚。
过程:最早的的实践来自于中西方的交流,若要介绍中国的一些地名、人名或其他固有名词到西方,必会涉及汉字拉丁化的问题。明清西方传教士为了学习汉字和传教的需要,开始系统用拉丁字母给汉字注音。1605年天主教耶稣会士、意大利人窦(Matteo Ricci)的《西字奇迹》具有开创性的系统化意义。1626年耶稣会士出版的《西儒耳目资》是最早用音素给汉字注音的字汇,所用的拼音方案是利玛窦方案的修正。1867年,在使馆任中文秘书的(Thomas F. Wade)出版了一部《语言自迩集》,创立了一个拉丁化的,使用时间很长,对汉字的拉丁化起了重要作用,以后的方案都有参考。
“国语”繁、简体、拼音化1918年教育部公布第一套法定的37个民族字母形式的注音字母方案,特点是采用符号表示声调,这虽然不是一种直接的拉丁化方案,但用符号表示声调的方法却延续到。
1928年公布第一套法定的拉丁化拼音方案-国语罗马字(简称国罗),特点是用字母的拼法来表示汉语的声调,实际上由于流传时间较短,时间起到的作用不大。1958年,公布的第二套法定的拉丁化汉语拼音方案,使用了26个拉丁字母,用符号表示声调,但是这种符号不易在西式打字机上实现。1980年代,汉语的进入日程,形成“万码奔腾”的局面,汉语拼音方案作为重要的拼音输入方法得到使用,使汉语较能同信息化接轨。
汉字信息处理阶段:
硬件:、、等公司的;、的中文电脑;四通中文打字机;大洋字幕机
巨人M6403汉卡
企业:联想、、四通等一批靠中文处理产品起家的企业。
标准、基础研究:中文信息处理界基本上完成了词频统计、多种显示/打印、汉字显示/打印技术、输入法、标准、标准等与字相关的所有基础工作。倪院士说,到2000年,中国已制定了70个与中文信息处理相关的国家标准。
学术理论:1990年代中期,最为普及的由DOS升级到平台。从中文版开始,在里集成了汉字处理技术,使传统中文信息处理产品迅速失去了市场。中文信息处理进入一个低谷,原先做中文信息处理的公司纷纷转行。及以上版本,无论采用何种文字,均已支持中文处理。
中文、、中文
互联网时代的中文处理:互联网时代对中文信息处理产生了新需求。互联网上的海
注音符号与拼音法量数据为提出了新的课题;其次,外文信息已经多到不能人工完翻译的程度,机器翻译的重要性被提到了空前的高度;第三,手机、PDA等移动设备将信息处理需求变成无处不在,非标准键盘的需要有新的方案。大量新的课题出现,重新启动了中文信息工作的热情。
汉语信息处理阶段
:与此同时,为方便使国内各民族化的步伐加快,政府作出一连串行动去使这些民族的语言更便于“计算机化”。这一连串行动包括以下各项:
取消民族语言中的特殊字符,尽可能以26个标准拉丁字母代替。(参看:壮语) 为还未有文字的民族设立以拉丁字母为本的新文字。方面,在1990年代曾引发“中文电脑化”及“电脑中文化”的争议。
资策会方面的意见:认为的操作空间有限。如果不让中文适应环境,中文就会失去新时代的活动能力而变成死的语言。
学界及业界的意见:操作空间有限的只是短时期的问题。随着发展日新月异,操作空间的限制很快就变得没有意义。政府应该在新时代来临以前,及早制定长远的标准。
结果:资策会未能在ISO 10646开始讨论中日韩文字编码空间之前产生一个前瞻性的编码方案,加上当时政府的阻挠,使繁体字几乎要在世界消失。后来幸得多方面商讨和配合,同意中日韩三国共享编码空间,成为了今时今日的中日韩统一表意文字,而台湾的一万三千多个字亦准以“民间通用标准”为理由成为了统汉码的参考标准之一。对汉字的亲和性增加,而Unicode在统汉码之后,亦不断推出扩展A、扩展B及扩展C计划,以涵盖上所有曾经出现过及使用过的汉字,并为它们编码记录。现时已整理好接近七万个汉字。天汇汉字系统TW213
希望汉字系统UCDOS
零壹中文系统
国乔中文系统
,它还有Windows版本,最后一个版本是倚天2000 for Windows
震汉中文系统,因与高度相似而曾被倚天控告。
这些都是1980年代出产的,随着Windows通行都逐一末落了。编码 (encoding):用数字代替文字
中文:例如Big5
中文交换码:例如CCCⅡ、CNS11643
壮文字集: 要先选择一定数量的字, 如常用字3500,或某本字典收录的八千字
(主要是台湾及用):Big5,,一万三千多字
(主要是中国大陆用):GB,六千多字
繁简混合: GBK (由GB发展而来),二万多字; Unicode2.0(可同时处理日文、韩文等文字),二万多字( font):细明体(不能使用,因错字多)、(符合台湾字体标准)、SimSun(简宋,符合大陆规范)
字型技术(在荧幕及):(bitmap)、向量(vector)、TrueType、OpenType等 输入
键盘:字形输入:、(及因仓颉而衍生的简易等)、快码、九方、纵横等
字音输入:汉语拼音、注音、港式拼音及其他方言拼音
其他:混合字形及字音,使用英文译成中文
倚天中文系统(语音输入)、手写板(手写认字)、扫描器(字符识别 character recognition)这是一项最关键的语言工程,汉字如不能进入计算机,自动化、印刷出版现代化 、办公室事务自动化都将化为空谈。近10年来,汉字信息处理研究得到很大发展。曾设计了 400多种方案(见汉字编码),其中上机通过试验或已被采用作为输入方式的,已达数十种之多。研制了上百种汉字和设备。这些系统主要采用两种类型的键盘:一是笔触式大键盘,另一是。前一种除整体输入外,一般还有利用部件组合的能力;后一种有的可兼容多种编码方案,有的还带有计算机引导的智能。
汉字信息处理除了在方面进行研究外,还制成了若干种输出专用设备,其中有各种类型的汉字输入键盘、汉字字库、汉字显示终端、汉字图形兼容终端、汉字印字机。成套的汉字信息处理系统(包括汉字编码法、通用中外文键盘、通用中外文显示器、汉字打印设备、汉字库和系统等)已研制成功,并安排批量生产。一种最新式的编辑排版系统──计算机激光汉字照排系统也已研制成功。中国的字模生产有良好的基础,1985年 5月国家标准局公布了《信息交换用汉字15×16点阵字模集及数据集》和《信息交换用汉字24×24点阵字模集及数据集》两项标准,为各种设备的设计和推广提供了有利条件。
为了使人们摆脱繁重的编码输入工作,汉字的光电自动识别研究提上了日程。近年来有越来越多的单位从事和印刷体的识别研究。邮电部数据所和提出了象限端点和转动惯量特征识别法,提出了文字线长度识别法,公用事业研究所研制出数字条形识别系统,电子工业部第52研究所设计了提取汉字笔划特征的划分映射法,清华大学研制了有限制性汉字识别系统。
为了使各种系统之间的信息交换有共同性,也为了使各种的设计有统一的根据,1981年国家标准局公布了《信息交换用汉字编码基本集》(简称《汉字标准交换码》)。这个标准是根据汉字使用频度制定的,共分两级,一级3755个字,二级3008个字,共6763个字。为了满足少数用字量超过基本集的用户和台湾、香港等地的需要,正在制定《信息交换用汉字编码字符集辅助集》,辅助集将根据使用频度高低分作第一辅助集和第二辅助集,各收8000余字。计算机和语言的最早结合开始于机器翻译。1956年,机器翻译被列入工作的发展规划。1957年,机器翻译研究工作正式开始进行。这可以说是中文信息处理的第一项工程。首先研究的是俄汉机器翻译,并于1959年成功地进行了试验,译文输出是代码,而不是汉字,因为当时没有汉字输出装置。1958年底至1960年初,又研制了一套英汉机器翻译规则系统。年工作处于停顿状态。近年来,先后上机试验了英汉、俄汉、法汉、日汉和汉外(英、法、德、俄、日)机器翻译系统十余个。有的输出汉字译文。有的输出拼音译文。
语言的对比研究是机器翻译的语言学基础。在外汉系统中调整词序是一个中心任务。词序的调整,首先必须分清层次和确定轴心。为了调整词序,有的系统还建立了一套特殊的成分体系,即。介词、连词和是机器翻译研究中的难点,对它们的正确分析是解决词序调整问题的关键。当发生困难时,需要进行。
影响机器翻译发展的最大因素在于译文的。就已有的成就来看,机译的质量离理想目标仍相差甚远。中国数学家、语言学家教授曾在论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。同时,他还指出:在人类尚未明了人脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能的。[1]为了提供标引和检索蓝本,1979年编辑出版了10卷本的《》。目前,中国已有上百个单位开展情报检索的试验研究,其中十几个单位已进入定题情报服务 (SDI)的应用阶段。不少单位正在建立各种汉字文献数据库,同时还在考虑联机网络问题。
中的关键问题是的建立(见)。除一般的词汇语法问题外,中文情报检索系统中还有一个特殊问题,就是词的切分,因为检索是以词(关键词)为基础的。
④言语统计:中国利用电子计算机进行言语统计是机器翻译工作者开始的。1978年语言研究所和计算技术研究所在合作研究 ECMT-78英汉机器翻译系统的过程中曾编制一个排序统计程序,加工过一些外文资料和汉语拼音资料。1981年等单位开始对人工调查统计的词汇进行计算机处理。1985年完成了《汉语词汇的统计与分析》,在52万多字的汉字语料中统计出18177个不同的词, 这些词出现的总和是374654次,出现最多的单音节词是&的&, 出现最多的双音节词是“我们”。1986年 6月又完成了《现代汉语频率词典》。1982年等单位开始更大规模的汉语统计工作,要在2000万字的语料中进行字频和词频统计。部分字频统计结果已经得出,从年的1200多万字的语料中统计出8969个不同的汉字,并提供了这些汉字根据不同学科分类的26种使用频度表。
由于词的自动切分问题尚未解决,因而现在的词频统计都是在人工调查统计或人工分词的基础上进行的。
另外,和利用计算机对1.6 万多个汉字的部件进行了统计分析,以研究汉字的结构特点。为了研究人名用字的使用情况,中国文字改革委员会和根据人口调查材料对人的姓名分别进行了统计。很多省份“王”为大姓,而“陈”、“林”为大姓。最近几年,随着的进展,语言研究所、心理研究所、自动化研究所和一些大学开展了汉语理解系统(人机对话)的研究。目前只限于书面语言理解,而且主要是问答型的。输入方式采用汉语拼音。上机试验结果表明,有的系统已有识别30多种句型的能力(见汉语书面理解系统)。汉语语音理解系统的研制正在酝酿之中。近年来很多人关心这一课题。现代化教育技术研究所、、等单位已研制出语言教学多种(见)。语音打字的任务早在1958年便已提出。1964年实现了“元音识别机”,1970年前后又实现了10个口呼汉语数字的识别机。但利用电子计算机进行识别研究,则始于 1972年。研究所利用语音图样匹配方法在一定范围内实现了单呼语言的识别,正确率达99.5%以上。哈尔滨工业大学利用音素分析法进行汉语识别,正确率达90%以上。
汉语合成的研究已在一些单位进行,一般尚处于研究实验阶段。自动化系最近试制成功一种会说话的中文计算机,机器里存有声韵母等语言数据,计算机会自动根据拼音规则实现拼接,合成语音。国外有人曾将汉语方言资料输入计算机,让计算机提供各个方言、、的出现,以及鼻化、现象分布的百分比。这些数据不仅有利于方言的共时描写和比较,而且还有利于检验各种构拟假说的正确性。目前,中国已开始利用计算机进行方言研究和绘制方言地图。1980年武汉大学开始语言自动处理工作,主要是编制逐字索引,同时提供汉字统计数据。他们计划编辑《现代汉语语言资料索引》23辑,收录现代著名作家9人的作品共33部,总字数500多万。前 5部作品(、、、和)的逐字索引和统计资料已相继印出。最近,他们又与合作,完成了的语词索引和统计资料。其他一些书籍的索引工作也在进行之中。武汉大学等单位利用现有的语料库开始进行风格学研究,随着语料的扩充和统计方法的改进,将会提供不同作家的风格特点和各种风格对比研究的成果。
利用计算机编制词表、词典也已提上日程。语言研究所正在编制《多语对照语言学词汇(英、法、德、俄、中)》。机编词典除能加快辞书的编辑出版过程外,还可以随时扩充、修改,保持词典的先进性。
中文信息处理研究方兴未艾。随着研究手段的改善和研究工作的深入,还将有更多更新的项目涌现。日文电脑,韩文电脑,其他文字的
加在其他操作系统或硬件上,如Linux,Macintosh,PPC,Palm,手提电话等
搜寻器 (search engine)
语义网 (sementic web)
电子书 (ebook)
电子字典(形式如或硬件形式如快译通)
辅助翻译 (computer aided translation)
的国际化(internationalization)和本土化(globalization)
新手上路我有疑问投诉建议参考资料 查看

我要回帖

更多关于 佛的中文意思是什么 的文章

 

随机推荐