Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Linux и FreeBSD » Общий по Linux » Debian/Ubuntu - Перекодировать файл с двумя кодировками

Ответить
Настройки темы
Debian/Ubuntu - Перекодировать файл с двумя кодировками

Аватара для Swit0

Старожил


Сообщения: 150
Благодарности: 4


Конфигурация

Профиль | Отправить PM | Цитировать


Вложения
Тип файла: log pg.log
(2.7 Kb, 1 просмотров)
Добрый день!
Есть файл лога от базы данных, лог этот пишется в двух кодировках, UTF-8 и CP1251.
В итоге на Debian 9 сообщения которые записаны в CP1251 не читабельны.
Пытаюсь конвертировать его в кодировку UTF-8, но безрезультатно - на выходе снова кракозябры, но уже другие.

Утилита enca определяет этот файл ISO 8859-5 standard; ISO Cyrillic

Пытался такими способами:
iconv -f ISO8859-5 pg.log -t UTF-8 -o out.log
enconv -L russian -x UTF-8 pg.log

Все равно остаются кракозябры. Относительно успешно было в виндовом Notepad++, там если менять кодировку я вижу часть сообщений в CP1251, а часть в UTF-8.

Как "приравнять" файл к одной кодировке? Заранее спасибо.
Файл с примером лога приложил.

Отправлено: 15:38, 24-03-2023

 

Аватара для DJ Mogarych

fascinating rhythm


Moderator


Сообщения: 6577
Благодарности: 1508

Профиль | Отправить PM | Цитировать


Код: Выделить весь код
from='/home/user/pg.log'
to='/home/user/pg-new.log'

while read p; do
  if echo "$p" |grep -q --binary-files=text -v '[а-я]'; then
    echo "$p" |iconv -f WINDOWS-1251 -t UTF-8 >> $to
  else
    echo "$p" >> $to
  fi
done <$from
Литература:
https://stackoverflow.com/questions/...a-file-in-bash
https://unix.stackexchange.com/quest...native-methods

-------
Powershell 7.x | Powershell 5.1 | ffmpeg (docs)


Последний раз редактировалось DJ Mogarych, 24-03-2023 в 16:32. Причина: универсальное решение

Это сообщение посчитали полезным следующие участники:

Отправлено: 15:55, 24-03-2023 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Аватара для Swit0

Старожил


Сообщения: 150
Благодарности: 4

Профиль | Отправить PM | Цитировать


DJ Mogarych, спасибо, попробую.

Отправлено: 16:45, 24-03-2023 | #3



Компьютерный форум OSzone.net » Linux и FreeBSD » Общий по Linux » Debian/Ubuntu - Перекодировать файл с двумя кодировками

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
Анонсирован смартфон LG V10 с двумя дисплеями и двумя передними камерами OSZone News Новости железа 0 01-10-2015 19:30
CMD/BAT - Помогите разобраться с кодировками в BAT qter Скриптовые языки администрирования Windows 4 29-10-2012 00:30
CMD/BAT - Проблема с кодировками в cmd. zvezduk Скриптовые языки администрирования Windows 15 08-02-2009 13:15
Delphi - Delphi 7, проблема с кодировками drGreen Программирование и базы данных 2 12-03-2004 02:51
Редактор с разными кодировками ualin Общий по Linux 9 15-04-2003 05:04




 
Переход