Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Скриптовые языки администрирования Windows (http://forum.oszone.net/forumdisplay.php?f=102)
-   -   ANSI<->ASCII (http://forum.oszone.net/showthread.php?t=97689)

akrav 09-01-2008 16:46 712575

ANSI<->ASCII
 
Подскажите, пожалуйста, как можно командной строкой конвертировать текстовой файл из dos кодировки в windows?

hasherfrog 11-01-2008 13:56 714148

UPDATE: решение найдено, см. ниже.
К сожалению, командной строкой я не смог. Никак*. Проблема в том, что даже смена кодовой страницы (командами mode con cp select=XXX или chcp XXX) не может повлиять на результаты команд type или echo**, поскольку они внутри себя явно заточены на использование дефолтной 866-й страницы (и весь вывод пропускают через CharToOem()-функцию). Это можете проверить, можете поверить на слово.

Вариантами решения могут быть:
1. Использование сторонних перекодировщиков (я использовал recode), есть масса других консольных утилит.
2. Написание своего перекодировщика (см. тут что-то вроде образца).

___
* В принципе, может кто и сможет это сделать. Но тогда как объяснить вот такое поведение cmd.exe:
Код:

Microsoft Windows XP [Версия 5.1.2600]
(С) Корпорация Майкрософт, 1985-2001.

C:\Documents and Settings\hasherfrog>chcp 866
Текущая кодовая страница: 866

C:\Documents and Settings\hasherfrog>echo йцукен > 1.txt

C:\Documents and Settings\hasherfrog>chcp 1251
╥хъє∙р  ъюфютр  ёЄЁрэшЎр: 1251

C:\Documents and Settings\hasherfrog>type 1.txt
йцукен <- ??? должны быть кракозябли

C:\Documents and Settings\hasherfrog>for /f %i in (1.txt) do echo %i

C:\Documents and Settings\hasherfrog>echo йцукен
йцукен <- ???

__
** Сначала я ляпнул про echo, но вообще-то она тут не при чём, конечно (ей что дали, то она и вывела). Другое дело, что её использовать тоже не получится. Пример:
Файл 1.bat, кодировка ДОСа:
Код:

chcp 1251
@echo йцукен
chcp 866
@echo йцукен

Результат выполнения:
Код:

C:\Documents and Settings\hasherfrog>1.bat

C:\Documents and Settings\hasherfrog>chcp 1251
╥хъє∙р  ъюфютр  ёЄЁрэшЎр: 1251
йцукен

C:\Documents and Settings\hasherfrog>chcp 866
Текущая кодовая страница: 866
йцукен


ven00m 11-01-2008 22:05 714511

Неуверен но можт так:

text.bat
Код:

type text1.txt>>text2.txt
run.bat
Код:

cmd.exe /u /c text.bat
Если запустить run то

Получается на входе text1.txt:
Код:

йцукен
На выходе text2.txt:
Код:

щЎєъхэ
если надо наоборот то вместо /u написать /a

hasherfrog 14-01-2008 11:57 716300

ven00m, не совсем так (/u даст юникод, а не window-кодировку), но идея правильная.

Решение вот такое, текст файла typea.bat
Код:

@if "%1"=="" goto error
@if "%2"=="" goto error
@if not exist %2 goto error

@if "%1"=="/a" (
@chcp 866 >nul
@goto print
)
@if "%1"=="/w" (
@chcp 1251 >nul
@goto print
)
@goto error

:print
@type %2 >> ___tmptxt
@type ___tmptxt
@del ___tmptxt
@chcp 866 >nul
@goto exithere

:error
@echo Usage:
@echo typea /a filename.txt  - Print filename.txt as dos-866
@echo typea /w filename.txt  - Print filename.txt as win-1251

:exithere


akrav 14-01-2008 13:35 716431

Спасибо, hasherfrog!
только вот что-то под xp не работает из дос в win кодировку. перенаправил вывод в файл, а он как был, так и остался...

hasherfrog 15-01-2008 14:50 717417

akrav, вот с перенаправлением нужно подумать. Вы обратите внимание на код. Мне кажется, в виде конвейера или перенаправления не получится использовать отдельный (приведённый выше) батник, вместо этого Вам надо его код переделать (встроиться туда, где @type ___tmptxt).

akrav 16-01-2008 11:22 718193

Очень интересно! Однако пока с полезным результатом напряженка. Ни туда, ни обратно конвертации не происходит, что можно пронаблюдать в файле ___tmptxt, который насколько я понял создается перенаправление вывода.


Время: 06:11.

Время: 06:11.
© OSzone.net 2001-