现在的位置: 首页Java技术 > 正文
Java编译UTF-8文件提示乱码
关键词:无 ┊ 来源: 原创收藏

在CMD中编译类出现错误

windows自带记事本保存成utf-8格式是无法编译的。因为windows记事本保存为UTF-8会自作聪明的加上BOM标志位的(这点你用eclipse把编译设置为UTF-8就能编译了)。

如果你的代码里再有中文,那么必须给javac强制定义字符集:javac -encoding utf-8

附:用一个python脚本可以批量替换BOM标志位

#!/usr/bin/python
#coding=utf-8
import os
import sys
import codecs
class RemoveBom:  
    basePath = ''
    fileList = []
    trimExtList = []
    
    def showMessages(self):
	print 'the Path is [',self.basePath,']'
	n = ''
	for ext in self.trimExtList:
	    n+=ext
	    n+=' '
	print 'the Exts is [' ,n,']'
    def trimFile(self,name):
	file = open(name,'rb')
	content = file.read(3)
	if content != '\xEF\xBB\xBF':
	    return False
	content = file.read()
	file.close()
	file = open(name,'wb')
	file.write(content)
	file.close
	print 'convert ',name,' finish'
	return True
    def getFileList(self,path):
	if not path:
	    return False
	for root,dirs,files in os.walk(path):
	    for filename in files:
		if filename.split('.')[-1] in self.trimExtList:
			filepath=os.path.join(root,filename)
			self.trimFile(filepath)
			#print filepath
    def run(self,argv):
	self.basePath = os.path.normpath(argv[1])
        if len(argv) < 3:
            self.trimExtList.append('java')
        else:
	    for i in range(len(argv)-2):
                self.trimExtList.append(argv[2+i])
	self.showMessages()
	self.getFileList(argv[1])
if __name__ == '__main__':
	if len(sys.argv) < 2:
            print 'USEAGE:python %s dirName [ext eg:java php cpp]' % __file__
            sys.exit(0)
	
	tObj = RemoveBom()
	tObj.run(sys.argv)
相关文章
    暂无相关文章
本文由 jack 发布于 2381天 19小时 46分钟前,目前已有 4143 人浏览
欢迎大家转载分享,请注明来源及链接;商业媒体转载请获得授权,谢谢合作!
 

添加评论