宫颈糜烂用什么药好是UCD

都柏林大学_百度百科
关闭特色百科用户权威合作手机百科
收藏 查看&都柏林大学
都柏林大学位于都柏林市郊南面一片广袤而美丽的土地上,距市中心只有5公里。都柏林大学(UCD)是一所朝气蓬勃的现代大学,也是爱尔兰规模最大的大学,课程设置包括、工商、、、兽医学和自然科学等学士学位课程及研究生课程。都柏林大学致力于提供一流的教学和科研教育。英文名University College Dublin 简称UCD创办时间1851年所属地区爱尔兰 都柏林主要院系人文及凯尔特研究学院;商业和法律学院;工程、数学和物理学院
都柏林大学(University College Dublin 简称UCD)建于1851年,学校与工商界及国际、建立了广泛的合作关系。该校以其高质量的教育水准和开拓性研究课题而世界。该校源于1851年建立的爱尔兰教会大学,以她为主创建国立大学,都柏林大学自治。1908年成立的爱尔兰国立大学(下设四所学院)、和都柏林城大学,是爱独立后首批创建的大学。皇家外科医学院、和公共管理学院,也是公认的爱尔兰国立大学的下属学院。都柏林大学是(大学的国际性协会)的创建成员之一,它在教学和科研方面都享有国际声誉。
爱尔兰的理工学院遍布全国各地,提供商业研究、工业与贸易、工程技术与科学和准医学教育与培训等专业的课程,包括全日制和半日制形式。这些学院包括都柏林理工学院、沃德佛德理工学院和卡罗理工学院等。
该大学课程设置很广泛,从本科学位到博士学位的各种水平和必修课程均有设置。都柏林大学一直是爱尔兰最具力的文化、商业和政治人物的摇篮。著名校友包括现任总理伯蒂·爱亨,商界领导人托尼·欧莱里博士和彼得·萨塞兰。另外还有詹母斯·乔伊斯,电影导演尼尔·乔丹和吉姆·舍里丹这些艺术和文学领域的巨匠。
其连锁教学和研究机构遍步全球。作为欧盟Socrate计划的全职,它与150多所大学建立了联系。它在、、和都设有商务学位的课程,每年吸收1000多名海外学生前往都柏林本部深造。都柏林大学本部设有资料齐备的图书馆、良好的电脑设施、福利保障体系、信息讯服务和完备的体育设施。在校生20000余人,其中留学生1500余人,大学下设10个学院,10多个研究中心,共80多个系。爱尔兰国立都柏林大学
爱尔兰都柏林大学商学院在2006年的英国《》欧洲著名商学院排名中排在第20位,全球著名商学院排名第86位。
爱尔兰都柏林大学都奎恩商学院:
爱尔兰都柏林大学奎恩商学院(本科)是爱尔兰唯一一个同时拥有美国商学院协会(AACSB)和欧洲质量改善系统(EQUIS)认证的商学院。这是美国和欧洲最佳商学院的质量标志。全世界只有20所商学院同时获得两项殊荣。
爱尔兰都柏林大学思摩菲特商学院:
爱尔兰都柏林大学思摩菲特商学院(研究生)是爱尔兰唯一一个同时拥有美国商学院协会(AACSB国际)、欧洲质量改善系统(EQUIS)和英国工商管理硕士协会(AMBA)认证,被誉为三皇冠认证,世界上只有9所商学院获此殊荣。学校的管理学硕士项目(Master in Management)在2014年Financial Times的全球管理学硕士排名中列第45位。[1]泰晤士高等教育2009年世界排名  全球第89,爱尔兰第2。  上海交通大学排名  全球301-400,爱尔兰第2。  金融时报全球工商管理硕士排名2011  全球第78,爱尔兰第1。  金融时报欧洲商学院排名2010  欧洲第30,爱尔兰第1。  经济学人工商管理硕士排名2009  全球第37,爱尔兰第1。大学有5大学院(人文及凯尔特研究学院;商业和学院;工程、数学和物理学院;人类科学学院;生命科学学院。)35个学系组成。其中都柏林大学商学院成立于1908年,下属两个商学院—-提供本科课程的奎恩商学院和硕士商科课程的迈克尔.斯莫菲特,历史悠久,成就卓越,享有良好的国际声誉。奎恩商学院是爱尔兰唯一一个同时拥有美国商学院协会(AACSB国际)和欧洲质量改善系统(EQUIS)认证的商学院,这两个认证是美国和欧洲最佳商学院的质量标志。这些认证很难获得,因为要和美国与欧洲顶尖的商学院逐项衡量对比。全世界只有20所商学院同时获得两项殊荣,这是对商学院优秀水平的国际认可。而研究生商学院更是被称为三皇冠认证的世界顶级优秀商学院,世界上只有9所获此殊荣。
另外,学院在、、、、等专业研究生水平也属于世界领先水平。大学通过科学研究和优秀的教学提高学生的知识和能力,尽可能地发展广阔的国内和国际间的联系。大学的斯墨菲特研究生商学院被公认是全世界最好的50所商学院之一。
1、爱尔兰是纯正的国家。
2、教育制度成熟,文凭形式多种多样,适于不同教育背景的求学者。采用ETS欧洲转学分体系,留学生可以转读欧盟其他国家。
3、爱尔兰毗邻英国,与英国的教育体制基本相同,学校历史悠久,教学及科研水平世界一流,中国与爱尔兰政府已签订了高等学历互相认可协议。
4、签证担保资金低,签证成功率高达95%以上。
5、学习期间可以每周合法打工20小时,节假日可全天打工。打工收入8.6欧元/小时,可以负担生活费及部分学费。
6、经济发达,就业率高,学生毕业后如在当地找到年薪3万欧元的工作可获得2年工作签证,连续工作4年可获得绿卡,享有爱尔兰公民的待遇。
7、爱尔兰拥有完善而系统的教育体系,几乎包括了所有常用的专业,教育质量高,职业倾向性强,其中软件、电信、工程、医学、生物、商科、旅游管理等在世界享有盛誉。
8、爱尔兰的教育费用和生活费用与其他欧洲国家相比较低。生活费大约4000欧元/年;硕士每年花费仅15000欧元(生活费学费)。资金担保需要30-60万RMB.
9、很多学生语言成绩不理想IELTS成绩只有4.5或者5.0分,爱尔兰大学的预科学校为学生提供了方便,实现了学生想尽快出国的梦想。
10、部分学校免雅思成绩,每年有学校的免费成绩测试。
11、奖学金制度。很多学校为学生提供奖学金制度,可以减轻学生的负担。
12、带薪实习机会。大部分学校为学生提供6-8个月的带薪实习机会,一方面让学生有更多的实践机会,另一方面,带薪实习的收入可以解决学生的生活费及部分学费。国务院副总理汪洋会见孙大文院士(Da-Wen Sun)是都柏林大学唯一一位华人终身教授,也是有史以来的第一位华人终身教授。他是(Academia Europaea)院士,(Royal Irish Academy)院士,国际著名的生物系统工程和食品科学与工程方面的学术权威,国际上该领域最活跃、最具创造力、最有影响的学术带头人之一,在国际同行中享有极高的知名度。他的主要研究包括制冷、冷冻及干燥过程和系统、食品质量与安全、生物过程模拟和优化以及计算机视觉识别技术等。孙大文院士和国家副主席李源潮
孙大文院士和杨振宁教授
现任爱尔兰国立都柏林大学(University College Dublin,简称UCD)食品和生物系统工程教授,长期作为项目负责人承担欧盟和爱尔兰政府的一系列重大科研项目。在世界上著名杂志和国际会议上发表了超过700篇高水平论文,出版专著14部,其中超过350篇论文被SCI收录(h指数=54),与国内合作发表SCI论文近一百篇。特别是在计算机视觉、真空冷却和CFD模拟等方面的论文已经成为其他研究者的经典参考文献。根据汤森路透集团出版发行的基本科学指标数据库日有关全球农业科学家排名,全球共有2554名科学家排名进入农业科学专业领域前1%的“被引用次数最多的科学家”,其中孙大文教授名列前茅,列全球前31位。孙大文和中央政治局委员政协常务副主席王刚
2010年,他光荣当选为在爱尔兰被视为最高荣誉与成就巅峰的爱尔兰皇家科学院(Royal Irish Academy)院士。时任中共中央政治局委员、中央书记处书记、中央组织部部长现任中华人民共和国副主席李源潮同志特委托中组部发去贺信表示祝贺,盛赞孙大文“为中华儿女争了光”,“为推动中国食品技术的发展,培养年轻人才,付出了大量心血,做出了重要贡献。”国务院侨务办公室主任李海峰也发去贺信表示祝贺,称“这不仅孙大文和政协副主席科技部长万钢主持会议仅是您个人的荣誉,也是全体华侨华人的光荣和骄傲!”同年,他又被推选为素有农业工程界的“奥林匹克”之称的(International Commission of Agricultural and Biosystems Engineering,简称CIGR,又译“国际农业工程学会”)即任主席,任期从2011年元月开始,并将于2013年起接任主席,成为自成立八十年来首位出任该重要国际机构主席的华人。2011年,他被增选为欧洲人文和自然科学院(Academia Europaea)院士,这是欧洲华人科学家首次当选该院院士,孙大文也因此成为欧洲历史上首位拥有两院院士的华人。
孙大文和全国人大常委会副委员长韩启德先后于2000年和2006年被授予CIGR杰出奖,2007年被授予印度食品科学家及技术人员协会会士(AFST(I) Fellow Award)荣誉称号,2008年获CIGR成就奖,2010年获CIGR最高奖项CIGR会士荣誉称号(CIGR Fellow Award),并于2004年被英国皇家机械工程师学会授予“食品工程师年度人物(Food Engineer of the Year Award)”大奖。2010年12月底,被全球32个国家的152家中文媒体共同评为“2010年全球海外华人社区十大新闻人物”。2010年12月底,被全球32个国家的152家中文媒体共同评为“2010年全球海外华人社区十大新闻人物”。2013年3月,他获颁由凤凰卫视,中国新闻社等两岸三地富有影响力的十余家华文媒体共同评选的世界因你而美丽——“影响世界华人大奖”,与诺贝尔文学奖得主莫言、神舟九号飞行乘组等获奖个人和团体同台领奖。2013年5月,他又荣获国际食品保护协会(IAFP)颁发的冷冻食品基金会冷冻研究奖(Frozen Food Foundation Freezing Research Award),成为美国本土以外首位获得该著名奖项的科学家。
他是英国皇家农业工程师学会会士(Fellow)和爱尔兰工程师学会会士(Fellow)孙大文和海峡两岸关系协会会长陈云林,同时他还兼任SCI和EI收录、2012年影响因子为4.115的《食品和生物加工技术》(Food and Bioprocess Technology,Springer)国际期刊主编、《现代食品工程》(Contemporary Food Engineering,CRC Press / Taylor & Francis)系列丛书主编和多家SCI收录的国际期刊编委,、哈尔滨工业大学、上海交通大学等十几所高校的顾问教授或客座教授,以及多次应邀出任大型国际学术会议大会主席、重要国际学术大会主旨演讲人和欧盟框架计划、美国自然科学基金、加拿大自然科学和工程研究委员会等特邀项目评委等多项重要国际职务。是爱尔兰共和国的首都以及最大的城市,靠近爱尔兰岛东岸的中心点,位处都柏林郡的丽妃河(River Liffey)河口、都柏林地区的中心。都柏林自中世纪以来一直是爱尔兰首都城市,也是爱尔兰岛上最大的城市。由于很多高技术企业聚集,所以有欧洲的硅谷之称。
概况 都柏林属于爱尔兰的交通系统的中心点。都柏林港(Dublin Port)是全国最重要的。都柏林机场(Dublin Airport)是该共和国最重要的飞机场,大多数的乘客都途经此机场,因为它有定期航行服务到、、、以及的其他机场。都柏林大学Heuston Station和Connolly Station是主要的城市火车站,Heuston连接着该共和国的西部,然而Connolly服务着Sligo,Wexford以及贝尔法斯特(Belfast)等路线。
Busáras是爱尔兰最繁忙的长途客运车站,从这里出发的长途汽车可以到达几乎所有爱尔兰东部的城镇和大部分西部主要。Dublin Bus是城市主要的公共汽车公司,运营将近200条市内路线。都柏林有一条城市重轨电车DART和两条轻轨电车LUAS:DART建于1984年,主要服务环都柏林湾,途径市中心;LUAS开通于2004年,红线从市中心的Connolly Station途径Heuston Station到达城市西南的Tallaght,绿线从圣史蒂芬公园到东南的Sandyford。传染病研究中心
合成化学生物中心
克林顿美国研究院
孔子学院/爱尔兰汉学研究院
康威生物分子与生物医药研究院
吉志义研究院
爱尔兰全球研究院
爱尔兰人文研究院
体育与健康研究机构
运动与健康研究院
爱尔兰城市研究院(全称:都柏林大学国际学习中心,简称:UCD ISC)是爱尔兰直属的预科课程国际学习中心,向全球范围招收国际学生,帮助他们升读都柏林大学。
本科预科课程:
由于各国的教育体制的不同,中国的高中生直接升读都柏林大学的本科学习有一定的困难,可以选择先进入都柏林大学国际学习中心(简称或UCD ISC)就读本科预科课程,继而顺利升读本科。预科课程分三个学期,与众多都柏林大学的本科学位课程衔接(详细的学位课程资料可以浏览ISC的中文网)。本科预科课程有两个方向:
商务、经济与社会研究
生物、工程与生物医学
九月或一月
经济学、商务学、社会学等等
化学、应用数学与计算、生物医学工程等等
  学费平均欧元/年,学制3-4年。
应用环境科学 农业科学
金融学 动物及农产品
动物学 建筑学
经济学 心理学
哲学 都柏林大学商业及法律研究 金融服务
化学工程 市政工程
计算机科学 电子工程
食品科学 护理学
园艺管理 法律
数学科学 医学
建筑结构工程学 兽医学
森林学学费平均1欧元/年,学制一年。
人文及凯尔特文化研究学院
凯尔特文化研究
古典名著研究
文化政策及艺术管理
现代戏剧研究
现代英语和美国文学
健康服务管理
商业及金融分析
市场营销都柏林大学医学院
运动物理疗法
公共卫生学
建筑工程学院
环境资源管理
教育心理学
自然科学院
计算机科学
分子生物学
兽医学 音乐学年龄:入学时需要年满17岁
学历:优秀的高中毕业成绩或同等学历水平
英语:雅思 5.0(写作5.0以上);托福510(机考 180/网考64);培生43
*尚没有以上考试成绩的学生可以参加UCD ISC ()的英语测试。
*假如英语水平没有达到申请要求,学生可以先参加UCD ISC ()的语言课程,然后衔接本科预科。1、参加过的高考,中学毕业成绩达到总成绩的85%(也可提供高考成绩),并达到被国内普通大学录取的分数标准,或在中国正规学完成了至少一年的大学本科教育。或者参加爱尔兰的中学毕业考试,要求与爱尔兰学生等同。
2、文科类本科要求TOEFL100分或IELTS6.5分(小分不低于6.0);
理工类本科要求TOEFL80分或IELTS6.0分(小分不低于6.0);1、具有,是中国重点大学或“211”工程大学本科毕业生。申请 MBA 需提交 GMAT 成绩作参考,并有三年以上工作经验。
2、本科成绩优秀,平均达到80%以上。
3、所申请专业与本科专业相关。
4、雅思6.5分(某些理工科专业6分也可)
开学日期:每一学年分为三个学期:Michaemas学期,Hilary学期和Trinity学期。即从9月的michaemas学期始到第二年4月Trinity学期末为一学年。夏季考试在每年的5月初到6月初之间,秋季考试则在8月中旬到9月中旬之间1、如果你已经在中国的名牌大学读完了大一或大二,那么你可进入本校就读本科一年级。
2、所有学生必须参加英语语言课程,并获得相应证书。研究生入学条件:本校为硕士和博士阶段提供了全方位的学科服务。各学科的具体入学条件是不同的,对语言要求也不尽相同。研究生的申请工作最迟为每年的3月31日。
新手上路我有疑问投诉建议参考资料 查看什么是UI、HCI、UCD、WEB2.0_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
&&¥2.00
喜欢此文档的还喜欢
什么是UI、HCI、UCD、WEB2.0
在​我​的​生​活​中​现​在​最​多​的​几​个​词​应​该​是​:​U​C​D​(​以​用​户​为​中​心​的​设​计​)​、​U​E​(​用​户​体​验​)​、​U​I​(​用​户​界​面​)​、​H​C​I​(​人​机​交​互​)​、​w​e​b.(​还​没​有​人​能​够​给​出​最​准​确​的​定​义​)​、​u​s​a​b​i​l​i​t​y​(​易​用​性​)​.​.​
​
​什​么​是​U​I​?​什​么​是​i​n​t​e​r​a​c​t​i​o​n​?​什​么​是​U​C​D​?​什​么​是​W​E​B.?​.​.​.​ ​对​我​来​说​他​们​都​是​有​着​不​同​的​含​义​。
阅读已结束,如果下载本文需要使用
想免费下载本文?
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢完整的新产品设计流程图
现在一些公司的需求还停留在视觉设计上,随着行业的发展,交互设计、用户研究、用户体验,将越来越受到大家的重视。 我们整理了较为完整的新产品设计流程图,分为六个阶段,每个阶段又有关键的工作内容和要求。我们将在六个阶段根据需要提供产品物。
第一阶段:基础调研
竞争产品分析寻找市场上的竞争产品,挑选若干代表性产品进行解剖分析。整理竞争产品的功能规格,分析规格代表的需求,用户资料和用户目标;分析竞争产品的功能结构和交互设计,从产品设计的角度解释其优缺点及其原因,成为我们产品设计的第一手参考资料。
领域调研结合上述分析基础和资料,纵观领域竞争格局、市场状况,利用网络论坛、关键字搜索、访谈等各种手段获得更多用户反馈、观点、前瞻性需求。
产出物:对比分析文档和领域调研报告  
交互设计工作范围
蓝蓝设计提供竞品分析、交互设计(Axture制作系列页面原型及交互流程)、用户研究、可用性分析等提高用户体验的一系列工作。
蓝蓝与同事一起完成中国移动飞信校园网sns平台100多页的整体的原型设计方案,可用性优化,单独完成整体视觉设计方案。项目周期 :三个月。更多案例及资料由于保密性问题不便放在网上。
用户使用页面原型并进行体验。 通过可用性测试,我们发现用户在注册页面停留过长时间。
为了让用户快速进入到后面的页面,对原型进行了优化。
用户在注册填写信息视线的浏览顺序是逐行扫描的,而且喜欢使用tab键上下切换。所以将信息项的名称统一归到左列,填写区域统一归到右列,提高填写效率。 密码改成随机生成,用户随机可以进入后面的页面,密码之后再自行修改。
这是一款MMORPG的游戏登录后首页面“新手村”。
在可用性测试开始之前,这款网页游戏产品主要存在的问题是新手玩家的流失率高,留存率低。玩家较多只能玩到20级。
很多的新手玩家之由于前没有接触过网页游戏,出于好奇被吸引到游戏里,但是由于不适应游戏玩法及页面设计,而不能很好地体验到后续的精彩游戏内容,并导致最终流失。
通过可用性测试的方法,我们了解到:新手玩家在“小地图”、“任务”、“场景”、“包裹”、“技能”等页面,都存在困难。
对于一些关键的文字描述,不明白什么意思。 对于关键的视觉符号,很容易忽略,使得游戏中的流畅性降低。
游戏开始阶段缺乏玩法指引。流程复杂,不知道怎么玩。
基于上述结论,我们改进了游戏的页面设计,降低了游戏门槛,提高了游戏产品的可用性和易玩性。
上一项服务: & & & & & & & & & &下一项服务: & & & & & & & & & &
400-608-6026
本栏目收录蓝蓝个人书写关于设计的文章、读书笔记。
随笔写随想,最近对界面设计、交互设计的理解。(2009)
设计是一种解决问题的过程和手段,在得到解决方案之前,首先要关注问题,用户为何为提出这个问题,挖掘深层次的需求.(例:比如用户想要在手机上快速查找到电话号码,作为交互设计师,可以考虑在手机上加几个快捷键。当探究用户为何为提出这个问题时,发现:原来是因为在开车时,用户需要打许多电话。这个时候可以换种交互方式,用语言识别,直接让用户叫出名字,拨打电话)挖掘深层次的需求,可以更好的总体考虑,多角度的帮助用户解决问题....
设计每日一贴
在设计领域没有一成不变的规范。看到各位设计师如此热忱地投入极简化用户界面的设计令人欢欣鼓舞。但是,探索扁平化设计是否就意味着绝不使用渐变和阴影?当然不是。事实上,我近期看到的几个很有意思的作品一方面以巧妙的方式呈现出了内容,另一方面也保证了交互的直观易懂,从而实现了扁平化和尺寸直接的平衡。
&&&&&&&&在这个互联互通、信息丰裕、功能丰富的数字时代,最简化设计广泛的复兴让人眼前一亮。这自然不会是无所不能的解决方案(没有任何一种风格能做到无所不能),但只要经过深思熟虑和恰当的应用,其能够实现既好用,有舒适的数字体验。
中福在线连环夺宝是一款适合亚洲人玩的宝石消除类小游戏,现中福在线连环夺宝网络版全新上线,24小时娱乐不打烊!
中福在线网络版游戏连接:
Copy right
北京兰亭妙微科技有限公司版权所有 北京丰台区六里桥南里华源一里1号楼1303/9号楼1710 全国统一客服热线:400-608-6026 邮箱:浅谈文字编码和Unicode(下) - fmddlmyy的专栏
- 博客频道 - CSDN.NET
15593人阅读
浅谈文字编码和Unicode(下)
3 字符编码模型
程序员经常会面对复杂的问题,而降低复杂性的最简单的方法就是分而治之。Peter Constable在他的文章中描述了字符编码的四层模型。我觉得这种说法确实可以更清晰地展现字符编码中发生的事情,所以在这里也介绍一下。
3.1 字符的范围(Abstract character repertoire)
设计字符编码的第一层就是确定字符的范围,即要支持哪些字符。有些编码方案的字符范围是固定的,例如ASCII、ISO 8859 系列。有些编码方案的字符范围是开放的,例如Unicode的字符范围就是世界上所有的字符。
3.2 用数字表示字符(Coded character set)
设计字符编码的第二层是将字符和数字对应起来。可以将这个层次理解成数学家(即从数学角度)看到的字符编码。数学家看到的字符编码是一个正整数。例如在Unicode中:汉字&字&对应的数字是23383。汉字&&对应的数字是134192。
在写html文件时,可以通过输入&字&来插入字符&字&。不过在设计字符编码时,我们还是习惯用16进制表示数字。即将23383写成0x5BD7,将134192写成0x20C30。
3.3 用基本数据类型表示字符(Character encoding form)
设计字符编码的第三层是用编程语言中的基本数据类型来表示字符。可以将这个层次理解成程序员看到的字符编码。在Unicode中,我们有很多方式将数字23383表示成程序中的数据,包括:UTF-8、UTF-16、UTF-32。UTF是&UCS Transformation Format&的缩写,可以翻译成Unicode字符集转换格式,即怎样将Unicode定义的数字转换成程序数据。例如,&汉字&对应的数字是0x6c49和0x5b57,而编码的程序数据是:
BYTE data_utf8[]={0xE6,0xB1,0x89,0xE5,0xAD,0x97}; // UTF-8编码WORD data_utf16[]={0x6c49,0x5b57};&&&&&&&&&&&&&&&&&&&&&&&&&&& // UTF-16编码DWORD data_utf32[]={0x6c49,0x5b57};&&&&&&&&&&&&&&&&&&&&&&&& // UTF-32编码
这里用BYTE、WORD、DWORD分别表示无符号8位整数,无符号16位整数和无符号32位整数。UTF-8、UTF-16、UTF-32分别以BYTE、WORD、DWORD作为编码单位。
&汉字&的UTF-8编码需要6个字节。&汉字&的UTF-16编码需要两个WORD,大小是4个字节。&汉字&的UTF-32编码需要两个DWORD,大小是8个字节。4.2节会介绍将数字映射到UTF编码的规则。
3.4 作为字节流的字符(Character encoding scheme)
字符编码的第四层是计算机看到的字符,即在文件或内存中的字节流。例如,&字&的UTF-32编码是0x5b57,如果用little endian表示,字节流是&57 5b 00 00&。如果用big endian表示,字节流是&00 00 5b 57&。
字符编码的第三层规定了一个字符由哪些编码单位按什么顺序表示。字符编码的第四层在第三层的基础上又考虑了编码单位内部的字节序。UTF-8的编码单位是字节,不受字节序的影响。UTF-16、UTF-32根据字节序的不同,又衍生出UTF-16LE、UTF-16BE、UTF-32LE、UTF-32BE四种编码方案。LE和BE分别是Little Endian和Big Endian的缩写。
通过四层模型,我们又把字符编码中发生的这些事情梳理了一遍。其实大多数代码页都不需要完整的四层模型,例如GB18030以字节为编码单位,直接规定了字节序列和字符的映射关系,跳过了第二层,也不需要第四层。
4 再谈Unicode
Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。Unicode用数字0-0x10FFFF来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。
Unicode字符集可以简写为UCS(Unicode Character Set)。早期的Unicode标准有UCS-2、UCS-4的说法。UCS-2用两个字节编码,UCS-4用4个字节编码。UCS-4根据最高位为0的最高字节分成2^7=128个group。每个group再根据次高字节分为256个平面(plane)。每个平面根据第3个字节分为256行 (row),每行有256个码位(cell)。group 0的平面0被称作BMP(Basic Multilingual Plane)。将UCS-4的BMP去掉前面的两个零字节就得到了UCS-2。
Unicode标准计划使用group 0 的17个平面: 从BMP(平面0)到平面16,即数字0-0x10FFFF。《谈谈Unicode编码》主要介绍了BMP的编码,本文将介绍完整的Unicode编码,并从多个角度浏览Unicode。本文的介绍基于Unicode 5.0.0版本。
4.1 浏览Unicode
先看一些数字:每个平面有2^16=65536个码位。Unicode计划使用了17个平面,一共有17*2个码位。其实,现在已定义的码位只有238605个,分布在平面0、平面1、平面2、平面14、平面15、平面16。其中平面15和平面16上只是定义了两个各占65534个码位的专用区(Private Use Area),分别是0xF0000-0xFFFFD和0xx10FFFD。所谓专用区,就是保留给大家放自定义字符的区域,可以简写为PUA。
平面0也有一个专用区:0xE000-0xF8FF,有6400个码位。平面0的0xD800-0xDFFF,共2048个码位,是一个被称作代理区(Surrogate)的特殊区域。它的用途将在4.2节介绍。
34*2-089。余下的99089个已定义码位分布在平面0、平面1、平面2和平面14上,它们对应着Unicode目前定义的99089个字符,其中包括71226个汉字。平面0、平面1、平面2和平面14上分别定义了5、4个字符。平面2的43253个字符都是汉字。平面0上定义了27973个汉字。
在更深入地了解Unicode字符前,我们先了解一下UCD。
4.1.1 什么是UCD
UCD是Unicode字符数据库(Unicode Character Database)的缩写。UCD由一些描述Unicode字符属性和内部关系的纯文本或html文件组成。大家可以在Unicode组织的网站看到UCD的。
UCD中的文本文件大都是适合于程序分析的Unicode相关数据。其中的html文件解释了数据库的组织,数据的格式和含义。UCD中最庞大的文件无疑就是描述汉字属性的文件Unihan.txt。在UCD 5.0,0中,Unihan.txt文件大小有28,221K字节。Unihan.txt中包含了很多有参考价值的索引,例如汉字部首、笔划、拼音、使用频度、四角号码排序等。这些索引都是基于一些比较权威的辞典,但大多数索引只能检索部分汉字。
我介绍UCD的目的主要是为了使用其中的两个概念:Block和Script。
4.1.2 Block
UCD中的Blocks.txt将Unicode的码位分割成一些连续的Block,并描述了每个Block的用途:
Block名称(英文)
Block名称(中文)
Basic Latin
基本拉丁字母
Latin-1 Supplement
拉丁字母补充-1
Latin Extended-A
拉丁字母扩充-A
Latin Extended-B
拉丁字母扩充-B
IPA Extensions
国际音标扩充
Spacing Modifier Letters
进格修饰字符
Combining Diacritical Marks
组合附加符号
Greek and Coptic
希腊文和哥普特文
Cyrillic Supplement
西里尔文补充
亚美尼亚文
基本阿拉伯文
Arabic Supplement
阿拉伯文补充
N'Ko字母表
Devanagari
天成文书(梵文)
古吉拉特文
德拉维族文
格鲁吉亚文
Hangul Jamo
埃塞俄比亚文
Ethiopic Supplement
埃塞俄比亚文补充
Unified Canadian Aboriginal Syllabics
加拿大印第安方言
Tagbanwa文
New Tai Lue
Khmer Symbols
Phonetic Extensions
拉丁字母音标扩充
Phonetic Extensions Supplement
拉丁字母音标扩充增补
Combining Diacritical Marks Supplement
组合附加符号补充
Latin Extended Additional
拉丁字母扩充附加
Greek Extended
希腊文扩充
General Punctuation
一般标点符号
Superscripts and Subscripts
上标和下标
Currency Symbols
Combining Diacritical Marks for Symbols
符号用组合附加符号
Letterlike Symbols
似字母符号
Number Forms
Mathematical Operators
数学运算符号
Miscellaneous Technical
零杂技术用符号
Control Pictures
Optical Character Recognition
光学字符识别
Enclosed Alphanumerics
带括号的字母数字
Box Drawing
Block Elements
Geometric Shapes
Miscellaneous Symbols
Miscellaneous Mathematical Symbols-A
零杂数学符号-A
Supplemental Arrows-A
箭头符号补充-A
Braille Patterns
Supplemental Arrows-B
箭头符号补充-B
Miscellaneous Mathematical Symbols-B
零杂数学符号-B
Supplemental Mathematical Operators
数学运算符号
Miscellaneous Symbols and Arrows
零杂符号和箭头
Glagolitic
格拉哥里字母表
Latin Extended-C
拉丁字母扩充-C
Georgian Supplement
格鲁吉亚文补充
提非纳字母
Ethiopic Extended
埃塞俄比亚文扩充
Supplemental Punctuation
标点符号补充
CJK Radicals Supplement
中日韩部首补充
Kangxi Radicals
康熙字典部首
Ideographic Description Characters
汉字结构描述字符
CJK Symbols and Punctuation
中日韩符号和标点
Hangul Compatibility Jamo
朝鲜文兼容字母
日文的汉字批注
Bopomofo Extended
注音符号扩充
CJK Strokes
中日韩笔划
Katakana Phonetic Extensions
片假名音标扩充
Enclosed CJK Letters and Months
带括号的中日韩字母及月份
CJK Compatibility
中日韩兼容字符
CJK Unified Ideographs Extension A
中日韩统一表意文字扩充A
Yijing Hexagram Symbols
易经六十四卦象
CJK Unified Ideographs
中日韩统一表意文字
Yi Syllables
Yi Radicals
Modifier Tone Letters
声调修饰字母
Latin Extended-D
拉丁字母扩充-D
Syloti Nagri
Syloti Nagri字母表
Phags-pa字母表
Hangul Syllables
朝鲜文音节
High Surrogates
High Private Use Surrogates
高位专用替代
Low Surrogates
Private Use Area
CJK Compatibility Ideographs
中日韩兼容表意文字
Alphabetic Presentation Forms
字母变体显现形式
Arabic Presentation Forms-A
阿拉伯文变体显现形式-A
Variation Selectors
字型变换选取器
Vertical Forms
竖排标点符号
Combining Half Marks
组合半角标示
CJK Compatibility Forms
中日韩兼容形式
Small Form Variants
小型变体形式
Arabic Presentation Forms-B
阿拉伯文变体显现形式-B
Halfwidth and Fullwidth Forms
半角及全角字符
Linear B Syllabary
线形文字B音节文字
Linear B Ideograms
线形文字B表意文字
Aegean Numbers
爱琴海数字
Ancient Greek Numbers
古希腊数字
Old Italic
古意大利文
乌加里特楔形文字
Old Persian
德塞雷特大学音标
肃伯纳速记符号
Osmanya字母表
Cypriot Syllabary
塞浦路斯音节文字
Phoenician
Kharoshthi
迦娄士悌文
Cuneiform Numbers and Punctuation
楔形文字数字和标点
Byzantine Musical Symbols
东正教音乐符号
Musical Symbols
Ancient Greek Musical Notation
古希腊音乐符号
Tai Xuan Jing Symbols
太玄经符号
Counting Rod Numerals
Mathematical Alphanumeric Symbols
数学用字母数字符号
CJK Unified Ideographs Extension B
中日韩统一表意文字扩充 B
CJK Compatibility Ideographs Supplement
中日韩兼容表意文字补充
Variation Selectors Supplement
字型变换选取器补充
Supplementary Private Use Area-A
补充专用区-A
Supplementary Private Use Area-B
补充专用区-B
Block是Unicode字符的一个属性。属于同一个Block的字符有着相近的用途。Block表中的开始码位、结束码位只是用来划分出一块区域,在开始码位和结束码位之间可能还有很多未定义的码位。使用UniToy,大家可以按照Block浏览Unicode字符,既可以按列表显示:
也可以显示每个字符的详细信息:
4.1.3 Script
Unicode中每个字符都有一个Script属性,这个属性表明字符所属的文字系统。Unicode目前支持以下Script:
Script名称(英文)
Script名称(中文)
Script包含的字符数
亚美尼亚文
汉语注音符号
Canadian Aboriginal
加拿大印第安方言
塞浦路斯音节文字
德塞雷特大学音标
Devanagari
天成文书(梵文)
埃塞俄比亚文
格鲁吉亚文
Glagolitic
格拉哥里字母表
古吉拉特文
韩文书写系统
Kharoshthi
迦娄士悌文
林布文(尼泊尔东部)
德拉维族文(印度)
New Tai Lue
N'Ko字母表
Old Italic
古意大利文
Old Persian
Osmanya字母表
Phags Pa字母表(蒙古)
Phoenician
古代北欧文
肃伯纳速记符号
Syloti Nagri
Syloti Nagri字母表(印度)
塔加路文(菲律宾)
Tagbanwa文(菲律宾)
泰卢固文(印度)
马尔代夫书写体
提非纳字母表
乌加里特楔形文字
其中,有两个Script值有着特殊的含义:
Common:Script属性为Common的字符可能在多个文字系统中使用,不是某个文字系统特有的。例如:空格、数字等。
Inherited:Script属性为Inherited的字符会继承前一个字符的Script属性。主要是一些组合用符号,例如:在&组合附加符号&区(0x300-0x36f),字符的Script属性都是Inherited。
UCD中的Script.txt列出了每个字符的Script属性。使用UniToy可以按照Script属性查看字符。例如:
左侧Script窗口中,第一层节点是按英文字母顺序排列的Script属性。第二层节点是包含该Script文字的行(row),点击后显示该行内属于这个Script的字符。这样,就可以集中查看属于同一文字系统的字符。
4.1.4 Unicode中的汉字
前面提过,在Unicode已定义的99089个字符中,有71226个字符是汉字。它们的分布如下:
中日韩统一表意文字扩充A
中日韩统一表意文字
中日韩兼容表意文字
中日韩兼容表意文字
中日韩兼容表意文字
中日韩统一表意文字扩充B
中日韩兼容表意文字补充
UCD的Unihan.txt中的部首偏旁索引(kRSUnicode)可以检索全部71226个汉字。kRSUnicode的部首是按照康熙字典定义的,共214个部首。简体字按照简体部首对应的繁体部首检索。UniToy整理了康熙字典部首对应的简体部首,提供了按照部首检索汉字的功能:
4.2 UTF编码
在字符编码的四个层次中,第一层的范围和第二层的编码在4.1节已经详细讨论过了。本节讨论第三层的UTF编码和第四层的字节序,主要谈谈第三层的UTF编码,即怎样将Unicode定义的编码转换成程序数据。
4.2.1 UTF-8
UTF-8以字节为单位对Unicode进行编码。从Unicode到UTF-8的编码方式如下:
Unicode编码(16进制)
UTF-8 字节流(二进制)
000000 - 00007F
000080 - 0007FF
110xxxxx 10xxxxxx
000800 - 00FFFF
1110xxxx 10xxxxxx 10xxxxxx
010000 - 10FFFF
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
UTF-8的特点是对不同范围的字符使用不同长度的编码。对于0x00-0x7F之间的字符,UTF-8编码与ASCII编码完全相同。UTF-8编码的最大长度是4个字节。从上表可以看出,4字节模板有21个x,即可以容纳21位二进制数字。Unicode的最大码位0x10FFFF也只有21位。
例1:&汉&字的Unicode编码是0x6C49。0x6C49在0x0800-0xFFFF之间,使用用3字节模板了:1110xxxx 10xxxxxx 10xxxxxx。将0x6C49写成二进制是:00 1001, 用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。
例2:&&字的Unicode编码是0x20C30。0x20C30在0xx10FFFF之间,使用用4字节模板了:11110xxx 10xxxxxx 10xxxxxx 10xxxxxx。将0x20C30写成21位二进制数字(不足21位就在前面补0):0 00 ,用这个比特流依次代替模板中的x,得到:11110000 10100000 10110000 10110000,即F0 A0 B0 B0。
4.2.2 UTF-16
UniToy有个&输出编码&功能,可以输出当前选择的文本编码。因为UniToy内部采用UTF-16编码,所以输出的编码就是文本的UTF-16编码。例如:如果我们输出&汉&字的UTF-16编码,可以看到0x6C49,这与&汉&字的Unicode编码是一致的。如果我们输出&&字的UTF-16编码,可以看到0xD843, 0xDC30。&&字的Unicode编码是0x20C30,它的UTF-16编码是怎样得到的呢?
4.2.2.1 编码规则
UTF-16编码以16位无符号整数为单位。我们把Unicode编码记作U。编码规则如下:
如果U&0x10000,U的UTF-16编码就是U对应的16位无符号整数(为书写简便,下文将16位无符号整数记作WORD)。
如果U&0x10000,我们先计算U'=U-0x10000,然后将U'写成二进制形式:yyyy yyyy yyxx xxxx xxxx,U的UTF-16编码(二进制)就是:110110yyyyyyyyyy 110111xxxxxxxxxx。
为什么U'可以被写成20个二进制位?Unicode的最大码位是0x10ffff,减去0x10000后,U'的最大值是0xfffff,所以肯定可以用20个二进制位表示。例如:&&字的Unicode编码是0x20C30,减去0x10000后,得到0x10C30,写成二进制是:00 。用前10位依次替代模板中的y,用后10位依次替代模板中的x,就得到:110110 110111,即0xD843 0xDC30。
4.2.2.2 代理区(Surrogate)
按照上述规则,Unicode编码0xFFFF的UTF-16编码有两个WORD,第一个WORD的高6位是110110,第二个WORD的高6位是110111。可见,第一个WORD的取值范围(二进制)是11011000 到11011011 ,即0xD800-0xDBFF。第二个WORD的取值范围(二进制)是11011100 到11011111 ,即0xDC00-0xDFFF。
为了将一个WORD的UTF-16编码与两个WORD的UTF-16编码区分开来,Unicode编码的设计者将0xD800-0xDFFF保留下来,并称为代理区(Surrogate):
High Surrogates
High Private Use Surrogates
高位专用替代
Low Surrogates
高位替代就是指这个范围的码位是两个WORD的UTF-16编码的第一个WORD。低位替代就是指这个范围的码位是两个WORD的UTF-16编码的第二个WORD。那么,高位专用替代是什么意思?我们来解答这个问题,顺便看看怎么由UTF-16编码推导Unicode编码。
解:如果一个字符的UTF-16编码的第一个WORD在0xDB80到0xDBFF之间,那么它的Unicode编码在什么范围内?我们知道第二个WORD的取值范围是0xDC00-0xDFFF,所以这个字符的UTF-16编码范围应该是0xDB80 0xDC00到0xDBFF 0xDFFF。我们将这个范围写成二进制:
110110 11011100
- 110110 110111
按照编码的相反步骤,取出高低WORD的后10位,并拼在一起,得到
即0xe0000-0xfffff,按照编码的相反步骤再加上0x10000,得到0xfffff。这就是UTF-16编码的第一个WORD在0xdb80到0xdbff之间的Unicode编码范围,即平面15和平面16。因为Unicode标准将平面15和平面16都作为专用区,所以0xDB80到0xDBFF之间的保留码位被称作高位专用替代。
4.2.3 UTF-32
UTF-32编码以32位无符号整数为单位。Unicode的UTF-32编码就是其对应的32位无符号整数。
4.2.4 字节序
根据字节序的不同,UTF-16可以被实现为UTF-16LE或UTF-16BE,UTF-32可以被实现为UTF-32LE或UTF-32BE。例如:
Unicode编码
49 6C 00 00
00 00 6C 49
43 D8 30 DC
D8 43 DC 30
30 0C 02 00
00 02 0C 30
那么,怎么判断字节流的字节序呢?
Unicode标准建议用BOM(Byte Order Mark)来区分字节序,即在传输字节流前,先传输被作为BOM的字符&零宽无中断空格&。这个字符的编码是FEFF,而反过来的FFFE(UTF-16)和FFFE0000(UTF-32)在Unicode中都是未定义的码位,不应该出现在实际传输中。下表是各种UTF编码的BOM:
Byte Order Mark
FF FE 00 00
00 00 FE FF
程序员的工作就是将复杂的世界简单地表达出来,希望这篇文章也能做到这一点。本文的初稿完成于日。我会在我的个人主页维护这篇文章的最新版本。&
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:601110次
积分:6599
积分:6599
排名:第1340名
原创:121篇
评论:661条
(1)(1)(12)(17)(9)(2)(3)(1)(1)(2)(1)(1)(4)(3)(6)(7)(7)(2)(1)(6)(1)(4)(1)(2)(2)(1)(3)(2)(2)(3)(1)(5)(1)(1)(2)(3)

我要回帖

更多关于 宫颈糜烂用什么药好 的文章

 

随机推荐