Windows平台之所以强调避免中文乱码,就是因为遇到过对中文名字的html文件的乱码问题。批量操作就需要软件执行,如果你的数据过大,并且含有中文名字的文件,内页URL必然也包含中文,批量操作很难修改中文字段。其实就算是中文的文件名,导致URL有部分中文也没有特别大的关系,仅仅是需要上传到Linux服务器上时,解压缩方式需要注意。之前使用的几款压缩软件,压缩格式是比较常见的zip格式,在Windows上压缩后上传到Linux服务器解压后中文文件名乱码。经过一顿了解,听说7z格式对中文兼容,所以选择了7-zip这个Windows软件,压缩比高,推荐大家使用,亲测不乱码,但必须是7z格式的压缩包才行。压缩比高,压缩包小,上传能节省一些时间,毕竟上传是最费时间的。百度“7-zip”去官网即可下载。Linux平台大量数据如果是本地电脑进行的7z格式压缩的,上传后用p7zip进行解压,它是Linux版本的命令行移植版本。因为是开源软件,GitHub上有一个活跃的fork,可以下载安装这个包,但是我没用过。简单说下CentOS系统安装p7zip新的服务器,拿到手先试一下这个命令自动安装:yum install -y p7zip*安装成功就可以使用7z命令或者是7za命令。如果安装不上,说明没有软件包版本库,也不用麻烦搞什么epel源解决软件包的问题。直接用下一个办法,源码编译安装:这里我选择使用经常用的低版本p7zip下载地址,上面github里最新的包你们可以尝试。CentOS7安装7-zip:
cd home //进入home目录下载,默认root目录也行,随意
下载解压命令:
wget https://nchc.dl.sourceforge.net/project/p7zip/p7zip/16.02/p7zip_16.02_src_all.tar.bz2
tar -xjvf p7zip_16.02_src_all.tar.bz2
安装命令:
cd p7zip_16.02
./configure && make && make install
解压命令:(先解压,没有程序再进行安装7zip)
7za x test.7z7za命令的其它参数,需要可以百度查一下。有必要说明一点:这个软件包是7za命令,有的包可能是7z命令或者其它命令,这可能是版本的原因。没有说明文档就试试这两个命令,基本是二者之一。
本文出自快速备案,转载时请注明出处及相应链接。