![]() |
Извлечение ключевых сущностей используя VBA
Тело текста - это названия продуктов из чека (GOODS_NAME)
Я хочу сгруппировать любые похожие слова. суть в том, что некоторые фразы имеют однокоренные слова и как бы ключевые слова. Например вот документе слово Макаронные изделия Макфа улитки флоу-пак 450 г. и подобное ему Я нашел 7 строк с Макароны макфа Макароны макфа Макароны макфа Макароны макфа Макароны макфа Макароны макфа Макароны макфа (иногда транслит makfa, pechenie) Я вручную нашел слова, у который похожие корни если я делаю так, т.е. вложенный цикл для проверки уникальных / дублированных элементов., то получаю ошибку компиляции Код:
for lRow = 1 to lLastRow При этом я понимаю, что идеального кода тут и быть не может, т.е. как Я он не сделает, ну хотя бы приблизительно. |
Цитата:
Цитата:
Цитата:
А решения, обсуждавшиеся на форуме раньше, под вашу задачу не подходят? |
a_axe,
Код:
Option Explicit Цитата:
1. А можно ли сделать в алгоритме сличение, например, говоря бытовым языком, не является ли транслит в данном случае MAKFA МАКФОЙ 2. Макар и Макароны, ну тут по корню, Цитата:
Цитата:
твор деревен творог дер твор дереве итак далее тво + дер тут ключевое твор а также колбаса деревен колб деревен колб дер колбас дере и так далее т.е. для таких фраз надо увидеть ключевое колб+дер это можно сделать? Цитата:
Цитата:
исходные данные миллионы строк в txt C:/чек.txt он оттуда должен брать, т.е. я создам эксель файл, помещу туда код макроса, а он уже будет работать с текстовым файлом там (текстовый)и должна появится колонка тип товара , а сам файл, уже буду в sql импортировать при том, безупречного определения я не жду. |
r-studio, опция
Цитата:
lastrow у вас не описана (вместо этого - похожая переменная Dim lLastRow As Long), sstring1 и sstring2 тоже (должны быть - as string, у вас похожая переменная почему-то Dim sString As Long). На это и ругается excel. |
a_axe, Как мне правильно составть код исходя из тех требований, что я описал постом выше? Сможете помочь?
|
r-studio, перед тем как составлять код, правильно или неправильно, попробуйте сформулировать алгоритм. Я его тут не вижу.
|
Время: 13:07. |
Время: 13:07.
© OSzone.net 2001-