|
Компьютерный форум OSzone.net » Linux и FreeBSD » Общий по Linux » Прочее - grep - вытянуть телефоны |
|
Прочее - grep - вытянуть телефоны
|
Новый участник Сообщения: 3 |
Профиль | Отправить PM | Цитировать день добрый
кто может помочь? есть текстовый файл, в нем куча объявлений и номера телефонов в формате: т. 8-999-999-99-99 как сделать так - чтобы все телефоны записались в отдельный файл? |
|
Отправлено: 20:47, 17-08-2012 |
Забанен Сообщения: 6158
|
grep -ohw 'т. 8-[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]' sourcefile > result
Ну и если нужно убрать "т. " то так: grep -ohw 'т. 8-[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]' sourcefile | sed 's/т. //g' > result |
Последний раз редактировалось vadblm, 17-08-2012 в 21:08. Отправлено: 21:00, 17-08-2012 | #2 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
Новый участник Сообщения: 3
|
Профиль | Отправить PM | Цитировать пустой файл выходит почемуто
|
Отправлено: 23:47, 17-08-2012 | #3 |
Забанен Сообщения: 6158
|
Значит, некорректно поставлена задача. Дайте что ли кусочек исходного файла.
|
Отправлено: 23:58, 17-08-2012 | #4 |
Новый участник Сообщения: 3
|
Профиль | Отправить PM | Цитировать Есть газета. В ней много текста - к примеру
продается машина москвич 2140. т. 8-000-000-00-00. нужно вытянуть тел и записать его в файл |
|
Отправлено: 09:49, 18-08-2012 | #5 |
Забанен Сообщения: 6158
|
Короче, формулирую за вас: телефонный номер всегда начинается с символов "т. 8-", дальше идут 10 цифр, могущие быть в диапазоне от 0 до 9, сгруппированные в 4 группы по 3,3,2,2, разделённые символом "-". Я дал выражение для этой формулировки, но вы говорите ,что оно не срабатывает, значит формулировка неверна. Может между "т." и "8-" не один пробел, а два, или вообще нет, может исходный файл в другой кодировке (CP866, CP1251, KOI8-R), а в линуксе UTF-8. Дефисы бывают разные, может такой "-", а может такой "—", да и пробелов в типографском деле целый пучок, а с точки зрения системы они все разные символы. Они даже порой в разных кодировках по разному кодируются, например, неразрывный пробел (nbsp) в KOI8-R имеет код 0x9A, а в других — 0xA0.
|
Отправлено: 10:58, 18-08-2012 | #6 |
Участник сейчас на форуме | Участник вне форума | Автор темы | Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Debian/Ubuntu - grep регулярное выражение | Forpost | Общий по Linux | 3 | 25-05-2012 00:50 | |
Вытянуть ссылку с документа MS Word в IE | sniper_super | AutoIt | 3 | 20-04-2011 00:49 | |
[решено] Как вытянуть Alkid SE из Zver | CrOsP | Автоматическая установка Windows 2000/XP/2003 | 12 | 03-02-2010 02:58 | |
Прочее - grep регулярные выражения | dogidogi | Общий по Linux | 8 | 28-05-2009 22:54 | |
Как вытянуть Флеш память из | kiro | Мобильные ОС, смартфоны и планшеты | 5 | 21-02-2004 18:14 |
|