汉字的unicode码范围是多少

Unicode 编码范围_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
Unicode 编码范围
上传于|0|0|文档简介
&&Unicode 编码范围
你可能喜欢34824人阅读
文字处理(41)
若对您有所启发
古典小说网
致力于打造极致阅读体验
首创卡拉OK读书方式
首创,桌面大屏幕TXT阅读方式
承接软件定制
联系方式:&
:gudianxiaoshuo
QQ群:& (刚建 欢迎加入)
以前写过一篇贴子是写中文在unicode中的编码范围,但写的不是很详细,今天再次研究了下unicode,并给出详细的unicode取值范围。
本次研究的unicode对象是unicode 5.2.0版本。现在最新的是6.0版
对于这次研究的unicode把编码分为以下几个平面(英文中是plane,可以认为就是不同的区位)
Unicode可以逻辑分为17平面(Plane),每个平面拥有65536( = 216)个代码点,虽然目前只有少数平面被使用。
平面0 (0000–FFFF): 基本多文种平面(Basic Multilingual Plane, BMP).
平面1 (10000–1FFFF): 多文种补充平面(Supplementary Multilingual Plane, SMP).
平面2 (20000–2FFFF): 表意文字补充平面(Supplementary Ideographic Plane, SIP).
平面3 (30000–3FFFF): 表意文字第三平面(Tertiary Ideographic Plane, TIP).
平面4 to 13 (40000–DFFFF)尚未使用
平面14 (E0000–EFFFF): 特别用途补充平面(Supplementary Special-purpose Plane, SSP)
平面15 (F0000–FFFFF)保留作为私人使用区(Private Use Area, PUA)
平面16 (FFFF),保留作为私人使用区(Private Use Area, PUA)
最有用的当然就是BMP平面0了编码从U+0000至U+FFFF。那里包含了几乎全部的常用字符。
为鉴于Unicode原有的16位空间不足以应用,于是从Unicode 3.1版本开始,设立了16个扩展字码空间,称为辅助平面,
使 Unicode 的可使用空间由6万多字增至约100万字。辅助平面字符要用上4字节来存储。
最后小结下:
1、现在网上大多数用于判断中文字符的是 U+4E00..U+9FA5 这个范围是只是“中日韩统一表意文字”这个区间,但这不是全部,如果要全部包含,则还要他们的扩展集、部首、象形字、注间字母等等;
2E80-A4CF 加上 F900-FAFF 加上 FE30-FE4F
2E80-A4CF 
包含了中日朝部首补充、康熙部首、表意文字描述符、中日朝符号和标点、日文平假名、日文片假名、注音字母、谚文兼容字母、象形字注释标志、注音字母扩展、中日朝笔画、日文片假名语音扩展、带圈中日朝字母和月份、中日朝兼容、中日朝统一表意文字扩展A、易经六十四卦符号、中日韩统一表意文字、彝文音节、彝文字根
&F900-FAFF
中日朝兼容表意文字
中日朝兼容形式
所以,一般用4E00-9FA5已经可以,如果要更广,则用2E80-A4CF &||& &F900-FAFF || FE30-FE4F
2、全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF
3、不要太关心简繁中文的区别,如果要明确非要简体中文可参考
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:1884977次
积分:22023
积分:22023
排名:第269名
原创:402篇
转载:238篇
译文:39篇
评论:253条
(3)(2)(2)(4)(7)(1)(3)(5)(2)(5)(11)(2)(1)(3)(3)(9)(5)(23)(5)(2)(1)(4)(2)(10)(21)(1)(19)(1)(6)(2)(2)(3)(6)(4)(5)(14)(14)(7)(11)(13)(16)(11)(25)(13)(12)(12)(2)(13)(9)(15)(25)(16)(24)(1)(3)(4)(7)(1)(8)(44)(18)(25)(21)(9)(2)(4)(6)(3)(35)(24)(3)(2)(1)(2)(5)(11)(3)温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
汉字:[0x4e00,0x9fa5](或十进制[])数字:[0x30,0x39](或十进制[48, 57])小写字母:[0x61,0x7a](或十进制[97, 122])大写字母:[0x41,0x5a](或十进制[65, 90])一个相关的JavaScript即时编码Web页面(若修改charArray[i].c = String.fromCharCode((Math.random()*95 + 12448) | 0);中的“12448为”汉字范围可显示汉字)
阅读(659)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
在LOFTER的更多文章
loftPermalink:'',
id:'fks_',
blogTitle:'汉字、英文字母、数字的unicode范围',
blogAbstract:'unicode编码范围:汉字:[0x4e00,0x9fa5](或十进制[])数字:[0x30,0x39](或十进制[48, 57])小写字母:[0x61,0x7a](或十进制[97, 122])大写字母:[0x41,0x5a](或十进制[65, 90])一个相关的JavaScript即时编码Web页面'
{list a as x}
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}unicode_unicode编码_unicode编码查询_词典网
输入汉字或拼音查询汉字Unicode
&&Unicode Unicode编码查询
其它查询: 
汉字Unicode编码查询

我要回帖

 

随机推荐