Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » [решено] Программа для поиска дублей с кириллическими именами

Ответить
Настройки темы
[решено] Программа для поиска дублей с кириллическими именами

Ветеран


Сообщения: 725
Благодарности: 30

Профиль | Отправить PM | Цитировать


В хранилище (8 Гб размером) имеется большое количество файлов (средний размер файла 500 Кб) с расширениями doc, fb2, rtf. Задача: Подсказать программу, способную найти дубли (которые точно там имеются). Утилиты, перечисленные здесь http://www.oszone.net/5896/, а также соответствующий модуль Auslogics практически бесполезны, т.к. имена всех файлов на русском и они их не воспринимают. Единственно DupKiller через пень-колоду нашел отдельные дубли (ручная проверка тогда еще объема в 1 Гб показала, что найдено всего около 30% дублей, включая и ложные срабатывания).

Отправлено: 20:15, 14-08-2012

 

Аватара для apozlevich

Ветеран


Автор проектов


Сообщения: 1025
Благодарности: 180

Профиль | Отправить PM | Цитировать


gorill, странно, что те программы не работают. Могу написать свой велосипед - обращайтесь в скайп apozlevich.

-------
echo 127.0.0.1 google.ru >> %systemroot%\system32\drivers\etc\hosts && ipconfig /flushdns && echo Я ничего не трогал, оно само!

Это сообщение посчитали полезным следующие участники:

Отправлено: 22:24, 14-08-2012 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Ветеран


Сообщения: 865
Благодарности: 129

Профиль | Цитировать


Цитата gorill:
т.к. имена всех файлов на русском и они их не воспринимают. »
Аж не вытерпел, попоробовал.


Отправлено: 22:58, 14-08-2012 | #3


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Угу. Сам пользую CloneSpy. Либо у автора особое представление о дубликатах, либо что-то с настройками.

Отправлено: 01:52, 15-08-2012 | #4


Ветеран


Сообщения: 725
Благодарности: 30

Профиль | Отправить PM | Цитировать


Цитата Iska:
Либо у автора особое представление о дубликатах »
Как Вы себе видите это самое "особое представление"? Есть два или более файла с одинаковым именем в 99% и в 90% случаев с одинаковым размером и однозначно с одинаковым расширением. Это не дубликаты? А что это тогда? Разъясните подробнее такой грамотный такому бестолковому.
Цитата Iska:
что-то с настройками »
И по умолчанию и по расширению и по слову в имени, да как угодно.
Цитата rover_61eg:
попоробовал »
А уж сколько я пробовал...
Если кто-то думает, что я создал тему от нечего делать, тот может пойти покурить, ибо эта проблема достала по самое немогу- место в хранилище ограничено, поэтому вопрос дублей стоит остро. Как происходит : Работаю с файлами, вот случайно обнаруживаю два дубля, и еще два другого файла и т.д. Запускаю утилиты НЕ УДАЛЯЯ случайно найденных и получаю в ответ, что дублей не найдено. Даже тех, что я вижу перед собой.

Отправлено: 06:27, 15-08-2012 | #5


Модератор


Moderator


Сообщения: 8282
Благодарности: 2856

Профиль | Отправить PM | Цитировать


тотал командер/поиск:
Это сообщение посчитали полезным следующие участники:

Отправлено: 07:14, 15-08-2012 | #6


Аватара для K.A.V.

Ленивый кусок мяса


Contributor


Сообщения: 1986
Благодарности: 723

Профиль | Сайт | Отправить PM | Цитировать


Цитата gorill:
Как Вы себе видите это самое "особое представление"? »
Цитата gorill:
Есть два или более файла с одинаковым именем в 99% и в 90% случаев с одинаковым размером и однозначно с одинаковым расширением. Это не дубликаты? »
Если я правильно понимаю назначение данных программ, то "дубликатом" являются файлы, которые на 100% идентичны по содержимому (а не по "внешности"), у файлов подсчитывается контрольная сумма файла, если файл с идентичной контрольной суммой уже был при поиске, то выводятся данные, что найден дубликат

-------
[Справочник по командам Windows] -- [Справочник по NSIS] -- [SFX Creator - для создания SFX архивов]


Отправлено: 10:46, 15-08-2012 | #7


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата gorill:
вот случайно обнаруживаю два дубля, и еще два другого файла и т.д. »
1. Наименьший размер дублей каков?
2. Каким образом Вы сами определяете, что это дубликаты?

Отправлено: 14:46, 15-08-2012 | #8


Ветеран


Сообщения: 725
Благодарности: 30

Профиль | Отправить PM | Цитировать


Цитата Iska:
1. Наименьший размер дублей каков? »
Не менее 200 Кб
Цитата Iska:
2. Каким образом Вы сами определяете, что это дубликаты? »
Эти файлы представляют собой методические и педагогические материалы, художественные книги, инструкции к приборам, датчикам и т.д. И я сам и другие пользователи частенько скидывают одинаковые материалы и Вы не поверите, но я читать обучен и могу, прочитав имя и содержимое файлов, понять, что они ОДИНАКОВЫЕ. Я не пойму, чего Вы добиваетесь, повторно ставя под сомнение мои умственные способности? Не хотите помогать- промолчите.
Цитата Amigos:
тотал командер »
О нем я и не подумал...Спасибо. Испытаю

Последний раз редактировалось gorill, 15-08-2012 в 20:57.


Отправлено: 20:46, 15-08-2012 | #9


Ветеран


Сообщения: 865
Благодарности: 129

Профиль | Цитировать


Цитата gorill:
прочитав имя и содержимое файлов, понять, что они ОДИНАКОВЫЕ. »
Пример1
Если есть два файла один в djvu, а другой в пдфе и оба содержат одинаковый скан одного и того же документа.
Пример 2
Допустим имеем 2 документа отсканенные в разном разрешении в пдф, но названные одинаково и положенные в разные папки.
С точки зрения человека - информация в этих фалах одинаковая. С точки зрения "компьютера" - нет.

Просто фраза про
Цитата:
Есть два или более файла с одинаковым именем в 99% и в 90% случаев с одинаковым размером и однозначно с одинаковым расширением. Это не дубликаты?
трактуется не однозначно.
10 % файлов с неодинаковым размером не дубликаты. Одинаковое имя - вообще не признак.

Отправлено: 21:20, 15-08-2012 | #10



Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » [решено] Программа для поиска дублей с кириллическими именами

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
CMD/BAT - [решено] скопировать несколько файлов с длинными кириллическими именами Nun-Nun Скриптовые языки администрирования Windows 3 31-08-2010 21:00
Программа для поиска (mp3, avi & etc) файлов Sidelong Программное обеспечение Windows 2 25-01-2007 08:51
Если программа не дружит с русскими именами файлов - что делать? Igor_I Программное обеспечение Linux и FreeBSD 6 24-11-2006 23:19
программа для поиска сертификатов + Kasper Программное обеспечение Windows 9 12-05-2004 00:37
Файлы с кириллическими именами в НЕрусской Windows Guest Microsoft Windows 95/98/Me (архив) 25 07-10-2003 08:13




 
Переход