shmel_sv@vk |
21-10-2014 12:41 2418272 |
проверка кодировки текстовых файлов
Доброго времени суток
Появилась нужда в проверке кодировки текстовых файлов. Тоесть есть куча текстовых файлов. Нужно создавать отсчет в какой кодировке каждый файл
Спасибо
|
В ряде случаев — никак нельзя определить.
Цитата:
Цитата shmel_sv@vk
Нужно создавать отсчет в какой кодировке каждый файл »
|
Чем вызвана именно такая задача?
|
shmel_sv@vk |
21-10-2014 14:55 2418350 |
есть куча тхт файлов (и они прибавляются) которые комбинирую в один большой тхт
иногда попадаются инные кодировки и оно либо не комбинирует в один тхт либо делает это неправильно
|
Тогда только «ручками». Даже детектор Far Manager'а нет-нет да и ошибается.
|
shmel_sv@vk, перечислите все кодировки этих текстовых файлов.
Цитата:
Цитата Iska
Даже детектор Far Manager'а нет-нет да и ошибается. »
|
И другие программы также могут ошибаться. Думаю, что алгоритм определения кодировок построен на частоте встречаемости характерных символов в тексте.
|
Цитата:
Цитата Georgio
Думаю, что алгоритм определения кодировок построен на частоте встречаемости характерных символов в тексте. »
|
Угу. Код Far Manager'а открыт, желающие могут использовать тамошний алгоритм.
|
shmel_sv@vk |
21-10-2014 19:13 2418476 |
Georgio, ну мне важно чтоб все кодировки были ansi. в основном так. но попадаются кирилические. поэтому батник иногда не справляется
|
Цитата:
Цитата shmel_sv@vk
чтоб все кодировки были ansi »
|
ANSI много. В том числе и кириллическая ANSI-1251. Потому Вас и просят перечислить их. Если затрудняетесь — выложите по нескольку штук во всех кодировках, упаковав их в архив, и укажите целевую кодировку.
|
Цитата:
Цитата shmel_sv@vk
поэтому батник иногда не справляется »
|
Примерчик вашего Батника, плиз.
Только точно задачу нарисуйте.
|
Время: 15:46.
© OSzone.net 2001-