Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  

Показать сообщение отдельно

Аватара для YuS_2

Crazy


Contributor


Сообщения: 1218
Благодарности: 509

Профиль | Отправить PM | Цитировать


Цитата rango13:
Уже второй день бьюсь с задачей »
Задача разовая или периодическая, которая требует автоматизации? Лучше от этого отталкиваться...
Цитата rango13:
Можете подтолкнуть в правильном направлении? »
Если говорить о правильном направлении, то лучше декодировать текст, чтобы получить валидный html текст и его уже парсить на предмет необходимых тегов таблицы.
Код: Выделить весь код
gc test.txt -enc utf8|%{[net.webutility]::htmldecode($_)}
и далее, либо воспользоваться встроенным парсером html, либо (что лучше и будет работать, в том числе и в версиях powershell core) воспользоваться внешним модулем PowerHTML
Код: Выделить весь код
#---Эту секцию можно удалить после однократного запуска скрипта от имени админа ------------------
# Установка дополнительного модуля PowerHTML, для независимого парсинга HTML
# Может потребоваться ручное подтверждение установки. 
if (!(get-module -list powerhtml)) {
	write-verbose "Installing PowerHTML module for the current user..."
	install-module powerhtml #-scope currentuser
}
#-----------------------------------------------------------------------------------------

-------
scio me nihil scire. Ѫ

Это сообщение посчитали полезным следующие участники:

Отправлено: 19:32, 18-07-2020 | #7