|
Компьютерный форум OSzone.net » Железо » Накопители (SSD, HDD, USB Flash) » Разное - Нужно выбрать лучшее решение по скорости мелких файлов |
|
Разное - Нужно выбрать лучшее решение по скорости мелких файлов
|
Новый участник Сообщения: 19 |
Профиль | Отправить PM | Цитировать
Может быть не в том разделе пишу, просьба тогда перенести тему.
В общем, нужно подобрать лучшее решение которое существует на момент сентября 2022. Задача заключается в следующем: есть очень много мелких файлов в разных папках. более 1 миллиона текстовых файлов, весом от 1 до 500 КБ. Эти файлы в разных папках находятся. Нужно найти решение, которое способно максимально быстро, насколько это возможно, архивировать эти файлы, разархивировать, копировать из всех папок, и переносить в одну. Короче обычная простая работа с файлами, казалось бы, на первый взгляд. Но нет. Скорости этих операций очень низкие. Времени очень много уходит на все эти сортировки. Все тесты по возможности могу предоставить. Сразу скажу, что обыденные потребительские SSD/HDD тут не особо выкручивают ситуацию по скоростям. Нужно что-то другое выбирать. Я могу ещё больше мыслей предложить на счёт этой темы, но мне хотелось бы услышать сначала экспертов/энтузиастов/инженеров/сис.админов серверов и т.д. Прежде чем отвечать, прочитайте весь топик! А также, отвечайте развёрнуто, а не просто "Попробуй что-то". |
|
Отправлено: 09:54, 30-09-2022 |
Ветеран Сообщения: 20095
|
Профиль | Отправить PM | Цитировать Цитата quesd:
Ну или в принципе все варианты рабочие. Другого решения у меня нет. Может кто и подскажет. Быстрое решение я вам предложил. Цитата quesd:
|
||
------- Отправлено: 00:09, 01-10-2022 | #11 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
Ветеран Сообщения: 2715
|
Профиль | Отправить PM | Цитировать Цитата quesd:
Если имеет значение только содержание, то алгоритм такой: открывается файл, строки из него переносятся в базу, последняя - закрывается, открывается следующий и т.д. Насрать, если будут дубли. Просто в базе сортируете значения (напр, по возрастанию, не суть), далее простейший цикл "если строка №+1 = строке №, удалить строку №+1". Профит. Далее играйтесь с этим как угодно. Цитата quesd:
Положить водопровод, а не искать сапоги скороходы, чтоб быстрее носить воду вёдрами. |
||
------- Отправлено: 03:01, 01-10-2022 | #12 |
Новый участник Сообщения: 19
|
Профиль | Отправить PM | Цитировать @bredych Вы мне сейчас рассказали работу как сделать свой антипаблик с помощью базы данных. Меня такой вариант не устраивает. У меня уже есть самописный софт для таких задач.
Мне просто нужно решение, которое как можно быстрее разархивирует архив, находит файлы, удаляет дубликатные файлы, копирует миллион файлов в другую одну папку, объединяет всё в 1 файл. И уже этот 1 файл у меня воспринимает и парсит определённые данные. Если что, я создам новую тему, какие ещё есть методы чтобы быстрее парсить данные. Это тоже мне нужно. Но на данный момент, в приоритете у меня скорее это Цитата bredych:
|
|
Отправлено: 17:31, 01-10-2022 | #13 |
Ветеран Сообщения: 7244
|
Профиль | Отправить PM | Цитировать Цитата quesd:
|
|
------- Отправлено: 18:27, 01-10-2022 | #14 |
Crazy Сообщения: 1187
|
Профиль | Отправить PM | Цитировать Цитата dmitryst:
Цитата quesd:
Ну и собственно, судя по Вашему запросу, задача одноразовая? Тут проще таки воспользоваться какими-то готовыми решениями, пусть даже с немаленькими временными затратами... |
||
------- Отправлено: 20:40, 01-10-2022 | #15 |
Новый участник Сообщения: 19
|
Профиль | Отправить PM | Цитировать Цитата YuS_2:
Если же в плане, закинуть архив, распаковать, отсортировать файлы и удалить архив и все эти файлы - то ответ да. Здесь не нужно хранить будет файлы, т.к я один отсортированный файл скачаю к себе на комп. Цитата YuS_2:
Цитата YuS_2:
Цитата dmitryst:
Если же речь идёт про архивирование/копирование/перетаскивание - то тут наоборот всё. Один большой файл займёт на все эти операции очень мало времени, по сравнению с миллионами мелких файлов, которые могут растянуться на очень много часов. Ну по крайней мере, это так работает на NTFS. В других ФС я не тестил. Но очень хотелось бы протестировать! Но не знаю с какой ФС начать, и какую выбрать, чтобы гарантированно были максимальные скорости на мелкие файлы!!! Как раз по этому вы и видите этот топик - чтобы ответить на этот вопрос. Ну точнее, один из моих вопросов. Цитата dmitryst:
|
|||||
Отправлено: 01:58, 02-10-2022 | #16 |
Crazy Сообщения: 1187
|
Профиль | Отправить PM | Цитировать Цитата quesd:
Цитата quesd:
Цитата quesd:
|
|||
------- Отправлено: 15:10, 02-10-2022 | #17 |
Ветеран Сообщения: 2715
|
Профиль | Отправить PM | Цитировать Цитата quesd:
Цитата quesd:
Или однократная задача, или регулярная. И то и другое сразу - не бывает. |
||
------- Отправлено: 10:09, 05-10-2022 | #18 |
Забанен Сообщения: 6345
|
Цитата quesd:
Цитата quesd:
|
||
Отправлено: 17:46, 05-10-2022 | #19 |
Ветеран Сообщения: 3810
|
Профиль | Отправить PM | Цитировать Цитата quesd:
|
|
------- Отправлено: 18:50, 05-10-2022 | #20 |
Участник сейчас на форуме | Участник вне форума | Автор темы | Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Android - выбрать лучшее приложение для блокировки смс спама | гест | Мобильные ОС, смартфоны и планшеты | 2 | 21-12-2017 22:03 | |
HDD - Файловая система для мелких и средних файлов | klever | Накопители (SSD, HDD, USB Flash) | 13 | 01-12-2012 21:47 | |
Звук - Помогите выбрать решение по колонкам | Work700 | Прочее железо | 3 | 21-04-2009 01:34 | |
USB под Windows XP - медленное удаление мелких файлов | rkw | Накопители (SSD, HDD, USB Flash) | 4 | 09-04-2009 22:58 | |
Лучшее решение для P IV 2.8 HT | alibaster | Видеокарты | 11 | 26-12-2007 12:48 |
|