Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » [решено] ANSI->UTF-8 конвертер

Ответить
Настройки темы
[решено] ANSI->UTF-8 конвертер

Ветеран


Сообщения: 1639
Благодарности: 50

Профиль | Отправить PM | Цитировать


Ребят, подскажите, пожалуйста, нормальный конвертер из ANSI в UTF-8.
Есть множество xml-файлов с кодировкой ANSI.
Принимающая же программа распознает только UTF-8

Гуглил, гуглил, но так и не нагуглил нормального решения.


Благодарю!

Отправлено: 17:20, 06-05-2013

 

Аватара для lxa85

Необычный


Contributor


Сообщения: 4463
Благодарности: 994

Профиль | Сайт | Отправить PM | Цитировать


The_Immortal, NotePad++
Множество - это сколько и как часто?

-------
- Я не разрешаю тебе быть плохой! Потому что плохие люди совершают плохие поступки. А это нехорошо!
(Из наставлений 5 летней девочки своей младшей сестре)

Это сообщение посчитали полезным следующие участники:

Отправлено: 17:31, 06-05-2013 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


PC Master


Сообщения: 4238
Благодарности: 1604

Профиль | Отправить PM | Цитировать


Цитата The_Immortal:
Гуглил, гуглил, но так и не нагуглил нормального решения. »
Плохо "гуглили"

Цитата The_Immortal:
конвертер из ANSI в UTF-8. »
Можно еще ANSI/UTF-8 Конвертер v.1.1

-------
Характеристики процессора и ОП-CPU-Z.Характеристики видеокарты-GPU-Z.Разгон видеокарты-MSI Afterburner.Аппаратный мониторинг-HWMonitor.Аппаратная информация ПК и анализ/тест комплектующих-PC-Wizard.
>>Спасибо можно выразить, нажав на ссылку"Полезное сообщение"

Это сообщение посчитали полезным следующие участники:

Отправлено: 17:46, 06-05-2013 | #3


Ветеран


Сообщения: 1639
Благодарности: 50

Профиль | Отправить PM | Цитировать


lxa85,
Цитата lxa85:
NotePad++ »
Вот он как раз и хреновенько с этой задачей справляется. Хотя, возможно, я что-то не так делаю:
Файл 98463

Далее выбираю: "Кодировки - Кодировать в UTF-8".

Вот результат:
Файл 98464


Цитата lxa85:
Множество - это сколько и как часто? »
В районе нескольких сотен, раскиданных по разным каталогам. Как часто - периодически

Последний раз редактировалось The_Immortal, 02-10-2015 в 16:50.


Отправлено: 17:46, 06-05-2013 | #4


Ветеран


Сообщения: 1639
Благодарности: 50

Профиль | Отправить PM | Цитировать


Mr.Benq, Цитата Mr.Benq:
Можно еще ANSI/UTF-8 Конвертер v.1.1 »
Недостатки:

1) видит только содержимое каталога, в котором находится сам исполняемый файл. Т.к. каталогов у меня куча - это очень неудобно;
2) конвертирует нормальным образом только txt (по крайней мере не xml) - приходится менять расширение на txt, конвертировать, а потом расширение возвращать опять на xml, что также неудобно.

Отправлено: 19:19, 06-05-2013 | #5


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


PowerShell: windows - Batch-convert files for encoding - Super User.
Это сообщение посчитали полезным следующие участники:

Отправлено: 20:04, 06-05-2013 | #6


Аватара для lxa85

Необычный


Contributor


Сообщения: 4463
Благодарности: 994

Профиль | Сайт | Отправить PM | Цитировать


The_Immortal, надо выбирать "Преобразовать в UTF-8".
Для Notepad++ возможно придется писать скрипт или макрос.
Развивая тему текстовых процессоров, можно попробовать посмотреть в сторону "sublime text 2". Этот редактор платный, но имеет достаточно широкие возможности.
----
Можно продолжить вариант предложенный Iska, что будет более правильно.
(я вот хоть убейся сходу не могу найти нормальной документации про -encoding, хотя вроде правильные вопросы гуглу задаю, про msdn все дела )
Нашел! Через справку оболочки
PowerShell ISE, по Out-File, третий пример. И то, про ASCII.

-Кодирование <string>
Задает тип кодировки, используемой в файле. Допустимые значения: "Unicode", "UTF7", "UTF8", "UTF32", "ASCII", "BigEndianUnicode", "Default" и "OEM". По умолчанию используется кодировка "Unicode".

Значение "Default" соответствует кодировке текущей кодовой страницы ANSI.

"OEM" соответствует идентификатору кодовой страницы текущего производителя оригинального оборудования для операционной системы.

Пример 3
C:\PS>$a = get-process

C:\PS> out-file -filepath C:\Test1\process.txt -inputobject $a -encoding ASCII -width 50

Описание
-----------
Эти команды отправляют список процессов, выполняемых на компьютере, в файл Process.txt. Текст имеет кодировку ASCII, чтобы его могли обрабатывать программы поиска, такие как Findstr и Grep. По умолчанию командлет Out-File использует формат Unicode.

Первая команда получает список процессов и сохраняет его в переменной $a. Вторая команда с помощью командлета Out-File отправляет список процессов в файл Process.txt.

Параметр InputObject указывает, что ввод хранится в переменной $a. Параметр Encoding используется для преобразования вывода в формат ASCII. Параметр Width ограничивает длину каждой строки в файле 50 знаками. Так как строки вывода после 50 знаков усекаются, самый правый столбец таблицы процессов не выводится.

Поубивал бы!
---
В качестве альтернативы можно предложить использовать Python. В ряде случаев (проблема вывода информации) он мне понятней. stackoverflow how-do-i-convert-a-files-format-from-unicode-to-ascii-using-python
Рекурсивную "Шагалку по директориям" могу прислать.

-------
- Я не разрешаю тебе быть плохой! Потому что плохие люди совершают плохие поступки. А это нехорошо!
(Из наставлений 5 летней девочки своей младшей сестре)

Это сообщение посчитали полезным следующие участники:

Отправлено: 21:00, 06-05-2013 | #7


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Хорошо бы ещё пару-тройку образцов пользуемых xml, дабы пощупать. Как там внутри с encoding.

Отправлено: 07:19, 07-05-2013 | #8



Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » [решено] ANSI->UTF-8 конвертер

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
Разное - Notepad++, utf-8(\uXXXX) -> кириллица dmit.medv Хочу все знать 5 26-12-2012 02:47
VBS/WSH/JS - [решено] ansi в utf-8 aggressor_ Скриптовые языки администрирования Windows 3 19-10-2012 06:46
CMD/BAT - [решено] Изменение кодировки txt файла из ANSI в UTF-16 LE crashtuak Скриптовые языки администрирования Windows 11 20-08-2009 11:57
CMD/BAT - ANSI<->ASCII akrav Скриптовые языки администрирования Windows 6 16-01-2008 11:22




 
Переход