码迷,mamicode.com
首页 > 其他好文 > 详细

perl输出中文有乱码

时间:2016-11-03 18:39:52      阅读:242      评论:0      收藏:0      [点我收藏+]

标签:encode   code   序列   学习   中文   字符串   字符   哲学   perl   

测试文件的时候发现输出中文有乱码,所以学习了一下perl的Encode原理。现做一下总结:
perl的基础知识:在Perl看来, 字符串只有两种形式。一种是octets, 即8位序列, 也就是我们通常说的字节数组。另一种utf8编码的字符串, perl管它叫string。 也就是说: Perl只认识两种编码: Ascii(octets)和utf8(string)。

所以输出时候出现乱码,应该把utf8编码转为用户能够接受的形式。例如中文用gb2312.

my $s=":<中文关键词>=英国皇家学会;;《哲学汇刊》;;物理科学;;科学传播.";

$a=$s=~/>=(.+)$/;

print encode(‘gb2312‘,$1)."\n"; #输出英国皇家学会;;《哲学汇刊》;;物理科学;;科学传播.

perl输出中文有乱码

标签:encode   code   序列   学习   中文   字符串   字符   哲学   perl   

原文地址:http://www.cnblogs.com/363546828/p/6027361.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!