소스 검색

added toUnicode script

Ivan Arkhipov 6 년 전
부모
커밋
6ec7f61b87
1개의 변경된 파일17개의 추가작업 그리고 0개의 파일을 삭제
  1. 17 0
      assets/toUnicode.py

+ 17 - 0
assets/toUnicode.py

@@ -0,0 +1,17 @@
+import glob
+import os
+import sys
+import codecs 
+
+rootdir = "./"
+
+source_encoding = "us-ascii"
+target_encoding = "utf-8"
+
+for root, subdirs, files in os.walk(rootdir):
+	for filename in files:
+		if filename[-4:] == ".txt":
+			print(os.path.join(root, filename))
+			source = codecs.open(os.path.join(root, filename), 'r', source_encoding).read()
+			print(source)
+