|
Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » Любой язык - [решено] Помогите создать скрипт удаления лишних строк |
|
Любой язык - [решено] Помогите создать скрипт удаления лишних строк
|
Новый участник Сообщения: 12 |
Существует текстовый файл. В нем много мусорных строк содержащих
1 всего один символ(букву) . 2 Только цифры. 3 Два символа вместе или через пробелы 4 Три символа один из которых не относится ни кирилице, ни цифрам, ни к латинице, символы вместе или через пробелы Эти строки надо удалить. Объясню зачем. После разных распознавалок типа FineReader и CuneiForm в тексте остается много мусора, и ни какие пост-OCR обработчики в автомате такие строки не вычищают. Заранее благодарен! |
|
Отправлено: 00:02, 24-03-2016 |
Ветеран Сообщения: 27449
|
Профиль | Отправить PM | Цитировать Цитата namin78:
|
|
Отправлено: 04:01, 24-03-2016 | #2 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
Новый участник Сообщения: 12
|
Профиль | Отправить PM | Цитировать |
Отправлено: 05:10, 24-03-2016 | #3 |
Ветеран Сообщения: 27449
|
Профиль | Отправить PM | Цитировать namin78, посмотрел. Там в любом случае нужна будет вычитка и правка «ручками». Иначе такие абзацы как «"пал ьч и ка.», должные превратиться после вычитки в «пальчика», уйдут в небытие.
|
Отправлено: 06:16, 24-03-2016 | #4 |
Новый участник Сообщения: 12
|
Профиль | Отправить PM | Цитировать Цитата Iska:
|
||
Отправлено: 07:41, 24-03-2016 | #5 |
Ветеран Сообщения: 1758
|
Четвертый пункт сомнительный (возможен неправильный результат), powershell:
<# 1 всего один символ(букву) . 2 Только цифры. 3 Два символа вместе или через пробелы 4 Три символа один из которых не относится ни кирилице, ни цифрам, ни к латинице, символы вместе или через пробелы #> (get-content file.txt) -replace '^(.|\d+|.(\s+)?.|\W\s?.\s?.|.\s?\W\s?.|.\s?.\s?\W)$' | set-content file.1.txt -encoding default |
Отправлено: 08:55, 24-03-2016 | #6 |
Новый участник Сообщения: 12
|
Профиль | Отправить PM | Цитировать |
Отправлено: 09:23, 24-03-2016 | #7 |
Забанен Сообщения: 793
|
|
Отправлено: 10:18, 24-03-2016 | #8 |
Новый участник Сообщения: 12
|
Профиль | Отправить PM | Цитировать Цитата greg zakharov:
|
|
Отправлено: 16:04, 24-03-2016 | #9 |
Новый участник Сообщения: 12
|
Профиль | Отправить PM | Цитировать Foreigner, добавив к вашему коду еще чуть-чуть, я добился желаемого результата. Спасибо.
|
Отправлено: 18:35, 24-03-2016 | #10 |
![]() |
Участник сейчас на форуме |
![]() |
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
CMD/BAT - [решено] Помогите найти скрипт для удаленного удаления програм | magwolf | Скриптовые языки администрирования Windows | 20 | 01-02-2016 23:35 | |
CMD/BAT - [решено] Как переделать скрипт удаления папок, на скрипт удаления файлов | ufooo | Скриптовые языки администрирования Windows | 2 | 02-06-2015 12:22 | |
7 / 2008 R2 - Make_PE3 как создать Windows 7 PE без лишних программ | mseregax100 | Автоматическая установка Windows 11 / 10 / 8 / 7 / Vista | 0 | 16-09-2013 10:06 | |
VBS/WSH/JS - Помогите улучшить скрипт для поиска и удаления файлов | UpDaTe | Скриптовые языки администрирования Windows | 4 | 23-03-2011 04:33 | |
CMD/BAT - [решено] Создание CMD/BAT файла для удаления лишних папок | Vsirf | Скриптовые языки администрирования Windows | 4 | 04-06-2009 20:37 |
|