首页 | 邮件资讯 | 技术教程 | 解决方案 | 产品评测 | 邮件人才 | 邮件博客 | 邮件系统论坛 | 软件下载 | 邮件周刊 | 热点专题 | 工具
网络技术 | 操作系统 | 邮件系统 | 客户端 | 电子邮箱 | 反垃圾邮件 | 邮件安全 | 邮件营销 | 移动电邮 | 邮件软件下载 | 电子书下载

网络技术

邮件原理 | 硬件设备 | CISCO | 网络协议 | 网络管理 | 传输介质 | 线路接入 | 路由接口 | 邮件存储 | 华为3Com |
首页 > 网络技术 > 电子邮件原理及协议 > 乱码大全(16)──Unicode(3; UTF-8、Unicode与汉字乱码) > 正文

乱码大全(16)──Unicode(3; UTF-8、Unicode与汉字乱码)

出处:BBS 水木清华站 作者:bluesea (蓝海) 时间:2006-3-2 22:30:00
 UTF-8, A Transformation Format of Unicode and ISO 10646 (See:ISO/ IEC 10646-1:1993 AMENDMENT 2 (1996). UCS Transformation Format 8(UTF-8). Also See RFC-2044)。

  很多应用程序不能直接处理 Unicode 或 UCS-4/UCS-2 中的 16(32) 位字符。如 Unicode 中含有的 x0、等字符将不能直接用于文件名或 C 字符串等等。 UTF-8 编码进行了这样的处理:它保持 US-ASCII 字符为 US-ASCII,而其他编码要保证高位是 1,在编码序列中还包含了码长信息。UTF-8 是一个不定长度的编码。这样编码的结果是在编码序列中,所有的 US-ASCII 码原来也一定是 US- ASCII 码。(具体意义和方法详见上述资料)

  例如下面的邮件将在不支持 UTF-8 编码的邮件程序中显示成乱码:

1: From: "bluesea" <bluesea@163.net>
2: Subject: =?utf-8?B?5rWL6K+V?=
3:
4: 鈥滀贡鐮佸ぇ鍏ㄢ濓紝浣滆咃細bluesea锛屾按鏈ㄦ竻鍗?
5: BBS鎴愬憳銆傛杩庡湪 BBS涓浆杞姐傛湰鏂囧師杞戒簬姘存湪
6: 娓呭崕 BBS 鐨? Internet璁ㄨ鍖恒?

除了编码中夹带零星的英语单词可以帮助我们判别以外,没有更明显的标志帮助我们识别它是 UTF-8 编码。只能通过猜测和试验来进行。假如我们猜测它属于 UTF-8,那么我们需要在原信头添加下面的信息:

MIME-Version: 1.0
Content-Type: text/plain; charset="utf-8"

注意,上面两行加在原信的第三行处,与原信头不要留空行。然后将被编辑的信件另存为 *.eml 文件,用双击它启动 OutLook Express 即可获得原信的内容。同时这里也提醒一下,如果你拥有支持 UTF-8 编码能力的邮件程序,在用它发信的时候,尽量不要使用这个编码,以免使对方不知所措。

  一个不错的汉字代码转换软件: MView Convert 可以把转换 UTF-8 编码的文件转换为 GB 或其他编码的文件。它的下载地址参见 UTF-7 文。

  无论 UTF-7、UTF-8 还是我们前面提到的 MIME 或其他什么编码造成的乱码,乱码明文提供的信息未必都是完整的。其实信件的全部内容并没有完整地显示在邮件程序的信体显示窗口中。不同的邮件程序可以通过不同的方法 (如 OutLook Express 是通过选择“属性”/“详细资料”/“邮件的源文件”) 获得的邮件的完整信头,那么我们需要的编码信息往往就在信头中。

  上面我们先后解决了 UTF-7、UTF-8 这两种转换码的解码。最后,我们再解决 Unicode 与 GB、BIG5 的相互转换。上面例子提供的信息用 Unicode 表示将是这样的(实际上不应该有换行,只是为观察方便而加上):

  .Nqx.Y'Qh .?.O..?. b l u e s e a?.l4g(n.SN . . B B Sb.TX0.k" 徫W( B B SN-弆弣0.g,e嘢煆}N巐4g( . .n.SN B B S v? I n t e r n e t嫧嫼S:0.

  可以看到,Unicode 中,所有的字符都是 16 位的,包括所有的 7位 ASCII 码都被扩充为 16 位。(注意,高位扩充的是零 x0,上面显示成空格)。这样的代码不再属于传统意义上的文本文件。这些代码可以使用我们介绍的 MView Convert 软件转换成为 GB、BIG5 或其他汉字编码。注意区分转换选择中 UTF-7、 UTF-8 和 Unicode。
相关文章 热门文章
  • 乱码大全(24)──多国语言与字典翻译
  • 乱码大全(23)──XXEncode 和 Btoa
  • 乱码大全(22)──其它汉字乱码
  • 乱码大全(21)──高位清零、HZ、EHZ汉字(2)
  • 乱码大全(20)──高位清零、HZ、EHZ汉字(1)
  • 乱码大全(19)──日文和韩文的汉字编码(2)
  • 乱码大全(18)──日文和韩文的汉字编码(1)
  • 乱码大全(17)──Unicode(4; HTML与Unicode)
  • 乱码大全(15)──Unicode(2; UTF-7与汉字乱码)
  • 乱码大全(14)──Unicode(1; 简介)
  • 乱码大全(13)──BinHex
  • 乱码大全(12)──数据加密
  • 中文RFC文档目录
  • 手把手教你玩转免费顶级域名
  • 浅谈Base64编码
  • 手把手教你如何免费注册国际顶级域名
  • 电子邮件原理
  • 邮件-域名-DNS相关知识
  • 全面剖析E-mail收发失败的原因(一)
  • SMTP结构及原理
  • 关于邮件系统域名(DNS)设置的小常识
  • 电子邮件的工作原理
  • 邮件原文详细介绍(一)--神奇的MIME
  • 发送邮件常见出错代码
  • 自由广告区
     
    最新软件下载
  • SharePoint Server 2010 部署文档
  • Exchange 2010 RTM升级至SP1 教程
  • Exchange 2010 OWA下RBAC实现的组功能...
  • Lync Server 2010 Standard Edition 标..
  • Lync Server 2010 Enterprise Edition...
  • Forefront Endpoint Protection 2010 ...
  • Lync Server 2010 Edge 服务器部署文档
  • 《Exchange 2003专家指南》
  • Mastering Hyper-V Deployment
  • Windows Server 2008 R2 Hyper-V
  • Microsoft Lync Server 2010 Unleashed
  • Windows Server 2008 R2 Unleashed
  • 今日邮件技术文章
  • 腾讯,在创新中演绎互联网“进化论”
  • 华科人 张小龙 (中国第二代程序员 QQ...
  • 微软推出新功能 提高Hotmail密码安全性
  • 快压技巧分享:秒传邮件超大附件
  • 不容忽视的邮件营销数据分析过程中的算..
  • 国内手机邮箱的现状与未来发展——访尚..
  • 易观数据:2011Q2中国手机邮箱市场收入..
  • 穿越时空的爱恋 QQ邮箱音视频及贺卡邮件
  • Hotmail新功能:“我的朋友可能被黑了”
  • 入侵邻居网络发骚扰邮件 美国男子被重..
  • 网易邮箱莫子睿:《非你莫属》招聘多过..
  • 中国电信推广189邮箱绿色账单
  • 最新专题
  • 鸟哥的Linux私房菜之Mail服务器
  • Exchange Server 2010技术专题
  • Windows 7 技术专题
  • Sendmail 邮件系统配置
  • 组建Exchange 2003邮件系统
  • Windows Server 2008 专题
  • ORF 反垃圾邮件系统
  • Exchange Server 2007 专题
  • ISA Server 2006 教程专题
  • Windows Vista 技术专题
  • “黑莓”(BlackBerry)专题
  • Apache James 专题
  • 分类导航
    邮件新闻资讯:
    IT业界 | 邮件服务器 | 邮件趣闻 | 移动电邮
    电子邮箱 | 反垃圾邮件|邮件客户端|网络安全
    行业数据 | 邮件人物 | 网站公告 | 行业法规
    网络技术:
    邮件原理 | 网络协议 | 网络管理 | 传输介质
    线路接入 | 路由接口 | 邮件存储 | 华为3Com
    CISCO技术 | 网络与服务器硬件
    操作系统:
    Windows 9X | Linux&Uinx | Windows NT
    Windows Vista | FreeBSD | 其它操作系统
    邮件服务器:
    程序与开发 | Exchange | Qmail | Postfix
    Sendmail | MDaemon | Domino | Foxmail
    KerioMail | JavaMail | Winwebmail |James
    Merak&VisNetic | CMailServer | WinMail
    金笛邮件系统 | 其它 |
    反垃圾邮件:
    综述| 客户端反垃圾邮件|服务器端反垃圾邮件
    邮件客户端软件:
    Outlook | Foxmail | DreamMail| KooMail
    The bat | 雷鸟 | Eudora |Becky! |Pegasus
    IncrediMail |其它
    电子邮箱: 个人邮箱 | 企业邮箱 |Gmail
    移动电子邮件:服务器 | 客户端 | 技术前沿
    邮件网络安全:
    软件漏洞 | 安全知识 | 病毒公告 |防火墙
    攻防技术 | 病毒查杀| ISA | 数字签名
    邮件营销:
    Email营销 | 网络营销 | 营销技巧 |营销案例
    邮件人才:招聘 | 职场 | 培训 | 指南 | 职场
    解决方案:
    邮件系统|反垃圾邮件 |安全 |移动电邮 |招标
    产品评测:
    邮件系统 |反垃圾邮件 |邮箱 |安全 |客户端
    广告联系 | 合作联系 | 关于我们 | 联系我们 | 繁體中文
    版权所有:邮件技术资讯网©2003-2010 www.5dmail.net, All Rights Reserved
    www.5Dmail.net Web Team   粤ICP备05009143号