Ubuntu里中文txt文件打开问题如何解决

本篇内容介绍了“Ubuntu里中文txt文件打开问题如何解决”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

前言

大家都知道,ubuntu系统对中文的支持还是比较友好,除了对text文件编码的识别有点问题以外。

Ubuntu里中文txt文件打开问题如何解决  ubuntu 第1张

gedit直接打开中文txt文件

出现这种问题的原因是txt文件是在windows环境下生成,ubuntu下文本阅读器如vim和gedit对文件编码格式不能自动识别。

这里给出几种可能的解决方案。

文件格式转换

利用 dos2unix unix2dos unix2mac 等命令将txt文件从源操作系统转换到目标操作系统。

如果这几个命令不存在,请使用下面的命令进行安装。

sudo apt install dos2unix 
sudo apt install unix2dos

使用如下命令进行格式转换:

dos2unix [options] [file ...] [-n infile outfile ...] 
unix2dos [options] [file ...] [-n infile outfile ...]

这种转换会改变原来文件的一些属性如生成时间等。如果文件需要从两个不同操作系统进行访问时,这个解决方案是不合适的。

.vimrc设置缺省编码格式

这个解决方案适合我这样的vim爱好者。

Ubuntu里中文txt文件打开问题如何解决  ubuntu 第2张
vim打开乱码

解决问题的方法是按照下图修改 /etc/vim/vimrc 或者是 /etc/vim/vimrc.local 文件。

/etc/vim/vimrc中会调用/etc/vim/vimrc.local。修改两者中任一个都行。推荐修改/etc/vim/vimrc.local。

Ubuntu里中文txt文件打开问题如何解决  ubuntu 第3张
vimrc修改

然后再次使用vim打开同样的文件,bingo,搞定。

Ubuntu里中文txt文件打开问题如何解决  ubuntu 第4张
vim正常打开文件

gedit强制限定编码打开

gedit是ubuntu下强大的文本编辑软件。直接使用gedit来打开中文txt文件是最有吸引力的解决方案。

其实这个解决方案更简单。

首先使用 chardet3 来检测文件的编码格式。

chardet3 常用的正则表达式总结.txt

运行的结果显示该文件的编码格式是gb2312:

常用的正则表达式总结.txt: gb2312 with confidence 0.99

知道了编码格式后可以在运行gedit时加入encoding选项,如下

gedit --encoding gb2312 常用的正则表达式总结.txt

同样可以正常打开该txt文件,如下图所示。

Ubuntu里中文txt文件打开问题如何解决  ubuntu 第5张
gedit打开文件

“Ubuntu里中文txt文件打开问题如何解决”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注蜗牛博客网站,小编将为大家输出更多高质量的实用文章!

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:niceseo99@gmail.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

评论

有免费节点资源,我们会通知你!加入纸飞机订阅群

×
天气预报查看日历分享网页手机扫码留言评论电报频道链接