ruby中字符串的转码 使用方法以及注意事项

作者: tech.cap
发布时间:2015-07-13 11:31:41

不同于java, ruby内部并不支持unicode(据说到2.0会支持, 但是没有确认)
在字符编码处理上ruby是借助于Open Group的iconv库, 这个库在Linux上似乎默认就有,  Windows上没有这个库, 解决方案在末尾

使用iconv很简单, 下面是把iso8859-1编码转换到GBK编码的例子

require 'iconv'
conv 
= Iconv.new("GBK""ISO-8859-1")
result 
= conv.iconv("hello")
result 
<< conv.iconv(nil)
conv.close

需要注意的是转换以后还需要调用一下iconv(nil)来刷新未输出的数据 , 最后记得关闭conv

以上方式可以用block来简化

Iconv.open(toencoding, fromencoding) do |cd|
  input.each {
|s| output << cd.iconv(s)}
  output 
<< cd.iconv(nil)
end

当然,还有一种更简单的方式

Iconv.conv(toendocing, fromencoding, str)

最后还要提醒一下, iconv接受编码是toencoding在前, fromencoding在后, 不要记错了.偶就是因为这个问题被郁闷了半天


题外话:  ruby中很多功能都依赖于各种库, 比如这个iconv, 真是胶水语言的典型范例.

--------------------------------------------------------------------
补充:  windows下面iconv 的安装

这里下载iconv安装包,  按照如下方式放置包中的文件就OK了

iconv.so ->    ruby\lib\ruby\1.8\i386-mswin32\
iconv.dll ->   windows\system32\
charset.dll -> windows\system32\

更详细的说明见安装包中的README



标签: Ruby
来源:http://www.cnblogs.com/baoz/archive/2005/11/28/2269883.html

推荐: