Saga

早已不信上帝,可每当听到钟声,我知道还有个地方叫天国

 
 
 
 
 
 
博友列表加载中...
 
 
 
 
 

天气

 
 
模块内容加载中...
 
 
 
 
 
 
 
圈子列表加载中...
 
 
 
 
 
 
 
 

[转]Python的ASCII, GB2312, Unicode , UTF-8

2007-12-13 10:50:47 阅读(486) 评论(0)

ASCII 是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,范围是 0-127

Unicode分为UTF-8和UTF-16。UTF-8变长度的,最多 6 个字节,小于 127 的字符用一个字节表示,与 ASCII 字符集的结果一样,ASCII 编码下的英语文本不需要修改就可以当作 UTF-8 编码进行处理。

Python 从 2.2 开始支持 Unicode ,函数 decode( char_set )可以实现 其它编码到 Unicode 的转换函数 encode( char_set )实现 Unicode 到其它编码方式的转换

比如 ("你好").decode( "GB2312") 将得到 u'\u4f60\u597d',即 "你"和“好"的 Unicode 码分别是 0x4f60 和 0x597d

阅读(486) | 评论(0) | 阅读全文>>

年轻时的侠客行

2007-11-4 19:24:56 阅读(40) 评论(4)

─侠客行个人档案 GB ────────────────────────┐
│                                                                     │
│姓  名:弦灵风                        臂力: 29/ 17   悟性: 39/ 29  │
│英文ID:Info                      

阅读(40) | 评论(4) | 阅读全文>>

使用codecs模块,在Python中完成字符编码

2007-8-14 10:52:54 阅读(119) 评论(0)

字符的编码是按照某种规则在单字节字符和多字节字符之间进行转换的某种方法。从单字节到多字节叫做decoding,从多字节到单字节叫做encoding。在这些规则中经常用到的无非是UTF-8和GB2312两种。
 
在Python中,codecs模块提供了实现这些规则的方法,通过模块公开的方法我们能够方便地获取某种编码方式的Encoder和Decoder工厂函数(Factory function),以及StreamReader、StreamWriter和StreamReaderWriter类。
 
使用“import codecs”导入codecs模块。
 
codecs模块中重要的函数之一是lookup,它只有一个参数encoding,指的是编码方式的名称,即utf-8或者gb2312等等。如下示例:

阅读(119) | 评论(0) | 阅读全文>>

WINZIP及WINRAR命令

2007-3-21 14:06:24 阅读(113) 评论(0)

压缩目录test及其子目录的文件内容
Wzzip test.zip test –r -P
WINRAR A test.rar test –r
删除压缩包中的*.txt文件
Wzzip test.zip *.txt -d
WinRAR d test.rar *.txt 

刷新压缩包中的文件,即添加已经存在于压缩包中但更新的文件
Wzzip test.zip test –f
Winrar f test.rar test 

更新压缩包中的文件,即添加已经存在于压缩包中但更新的文件以及新文件

阅读(113) | 评论(0) | 阅读全文>>

[转载]常用的正则表达式及符号诠释

2007-3-14 10:07:00 阅读(108) 评论(2)

这位兄弟确实细心,在此借用一下```#89

"^\d+$" //非负整数(正整数 + 0) 

"^[0-9]*[1-9][0-9]*$" //正整数 

"^((-\d+)|(0+))$" //非正整数(负整数 + 0) 

"^-[0-9]*[1-9][0-9]*$" //负整数 

"^-?\d+$" //整数 

阅读(108) | 评论(2) | 阅读全文>>

查看所有日志>>

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2009