|
Компьютерный форум OSzone.net » Linux и FreeBSD » Общий по Linux » Debian/Ubuntu - Перекодировать файл с двумя кодировками |
|
Debian/Ubuntu - Перекодировать файл с двумя кодировками
|
Старожил Сообщения: 150 |
Профиль | Отправить PM | Цитировать
Добрый день!
Есть файл лога от базы данных, лог этот пишется в двух кодировках, UTF-8 и CP1251. В итоге на Debian 9 сообщения которые записаны в CP1251 не читабельны. Пытаюсь конвертировать его в кодировку UTF-8, но безрезультатно - на выходе снова кракозябры, но уже другие. Утилита enca определяет этот файл ISO 8859-5 standard; ISO Cyrillic Пытался такими способами: iconv -f ISO8859-5 pg.log -t UTF-8 -o out.log enconv -L russian -x UTF-8 pg.log Все равно остаются кракозябры. Относительно успешно было в виндовом Notepad++, там если менять кодировку я вижу часть сообщений в CP1251, а часть в UTF-8. Как "приравнять" файл к одной кодировке? Заранее спасибо. Файл с примером лога приложил. |
|
Отправлено: 15:38, 24-03-2023 |
fascinating rhythm Сообщения: 6577
|
Профиль | Отправить PM | Цитировать from='/home/user/pg.log' to='/home/user/pg-new.log' while read p; do if echo "$p" |grep -q --binary-files=text -v '[а-я]'; then echo "$p" |iconv -f WINDOWS-1251 -t UTF-8 >> $to else echo "$p" >> $to fi done <$from https://stackoverflow.com/questions/...a-file-in-bash https://unix.stackexchange.com/quest...native-methods |
------- Последний раз редактировалось DJ Mogarych, 24-03-2023 в 16:32. Причина: универсальное решение Отправлено: 15:55, 24-03-2023 | #2 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
Старожил Сообщения: 150
|
Профиль | Отправить PM | Цитировать DJ Mogarych, спасибо, попробую.
|
Отправлено: 16:45, 24-03-2023 | #3 |
Участник сейчас на форуме | Участник вне форума | Автор темы | Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Анонсирован смартфон LG V10 с двумя дисплеями и двумя передними камерами | OSZone News | Новости железа | 0 | 01-10-2015 19:30 | |
CMD/BAT - Помогите разобраться с кодировками в BAT | qter | Скриптовые языки администрирования Windows | 4 | 29-10-2012 00:30 | |
CMD/BAT - Проблема с кодировками в cmd. | zvezduk | Скриптовые языки администрирования Windows | 15 | 08-02-2009 13:15 | |
Delphi - Delphi 7, проблема с кодировками | drGreen | Программирование и базы данных | 2 | 12-03-2004 02:51 | |
Редактор с разными кодировками | ualin | Общий по Linux | 9 | 15-04-2003 05:04 |
|