сравнение двух файлов txt / C++

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / C++ [игнор отключен] [закрыт для гостей] / сравнение двух файлов txt

17 сообщений из 17, страница 1 из 1

сравнение двух файлов txt

#34873637

deffss

Гость

файлы содержат текстовые строки (5000-150000 шт.). Задача: сравнить 2 файла. на выходе получить результат -строки которые есть в первом файле, но нет во втором и наоборот.
Подскажите, пожалуйста, есть ли какие быстрые алгоритмы сравнения для данной задачи? Важна скорость выполнения операции.

...

Рейтинг:

0 / 0

17.10.2007, 09:34:09

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34873704

Tubrik

Участник

Сообщения: 799

Рейтинг: 0 / 0

deffssфайлы содержат текстовые строки (5000-150000 шт.). Задача: сравнить 2 файла. на выходе получить результат -строки которые есть в первом файле, но нет во втором и наоборот.
Подскажите, пожалуйста, есть ли какие быстрые алгоритмы сравнения для данной задачи? Важна скорость выполнения операции.

какой алгоритм вы опробовали и он вас не устроил по скорости? и пример кода пожайлуста

...

Рейтинг:

0 / 0

17.10.2007, 09:52:43

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34873711

Akh

Участник

Откуда: берутся баги?

Сообщения: 4 561

Рейтинг: 0 / 0

Исходники diff изучить? :)

...

Рейтинг:

0 / 0

17.10.2007, 09:55:05

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34873730

blinded

Участник

Откуда: Жуковский

Сообщения: 2 205

Рейтинг: 0 / 0

А зачем изучать? просто использовать

...

Рейтинг:

0 / 0

17.10.2007, 09:59:55

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34873762

Akh

Участник

Откуда: берутся баги?

Сообщения: 4 561

Рейтинг: 0 / 0

blindedА зачем изучать? просто использовать

Могёт это курсовик? :)

...

Рейтинг:

0 / 0

17.10.2007, 10:07:16

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34873837

deffss

Гость

Akh blindedА зачем изучать? просто использовать

Могёт это курсовик? :)

Не курсовик :) Можно поподробнее про diff, вроде это утилита Линукса.

...

Рейтинг:

0 / 0

17.10.2007, 10:30:11

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34873874

blinded

Участник

Откуда: Жуковский

Сообщения: 2 205

Рейтинг: 0 / 0

diff

...

Рейтинг:

0 / 0

17.10.2007, 10:38:58

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34874069

Akh

Участник

Откуда: берутся баги?

Сообщения: 4 561

Рейтинг: 0 / 0

Похоже это под винды: DiffUtils for Windows

...

Рейтинг:

0 / 0

17.10.2007, 11:10:16

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34874137

teras

Гость

deffss wrote:
> файлы содержат текстовые строки (5000-150000 шт.). Задача: сравнить 2
> файла. на выходе получить результат -строки которые есть в первом файле,
> но нет во втором и наоборот.
> Подскажите, пожалуйста, есть ли какие быстрые алгоритмы сравнения для
> данной задачи? Важна скорость выполнения операции.

На мой взгляд, недостаточно информации о задаче. Упорядоченны ли строки
в файлах, или нет? Как быть с одинаковыми строками? Что считать
совпадающими строками? В каком виде интересует результат - содержимое
строк или номера строк?
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

17.10.2007, 11:25:38

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34874494

deffss

Гость

teras
На мой взгляд, недостаточно информации о задаче. Упорядоченны ли строки
в файлах, или нет? Как быть с одинаковыми строками? Что считать
совпадающими строками? В каком виде интересует результат - содержимое
строк или номера строк?
Posted via ActualForum NNTP Server 1.4

Результат 2 файла. В первом файле строки, которых нет во втором. Во втором файле наоборот.
Строки не упорядочены, т.е. позиция строки в первом файле может не совпадать с позицией этой же строки во втором. Совпадающие строки - две одинаковых строки. Одинаковые строки в выходных файлах не нужны.

...

Рейтинг:

0 / 0

17.10.2007, 12:31:49

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34874622

Paradoxx

Участник

Сообщения: 530

Рейтинг: 0 / 0

source

...

Рейтинг:

0 / 0

17.10.2007, 12:52:02

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34875151

teras

Гость

deffss wrote:
> Автор: "deffss"
> teras
>
> На мой взгляд, недостаточно информации о задаче. Упорядоченны ли строки
> в файлах, или нет? Как быть с одинаковыми строками? Что считать
> совпадающими строками? В каком виде интересует результат - содержимое
> строк или номера строк?
> Posted via ActualForum NNTP Server 1.4
>
>
>
> Результат 2 файла. В первом файле строки, которых нет во втором. Во
> втором файле наоборот.
> Строки не упорядочены, т.е. позиция строки в первом файле может не
> совпадать с позицией этой же строки во втором. Совпадающие строки - две
> одинаковых строки. Одинаковые строки в выходных файлах не нужны.

Тогда два варианта: отсортировать оба файла, удалив совпадающий строки,
затем, выполняем слияние отсортированных последовательностей с
небольшими модификациями относительно выхода: из файлов считываем по
одной строке. равны - значит строка присутствует в обоих файлах,
считываем следующие строки из ОБОИХ файлов. Не нервны - если строка из
первого файла меньше второй - значит она отсутствует во втором
(сохраняем ее). Затем считываем строку из того файла, в котором строка
была меньше.
Второй вариант - создать хеш-таблицу из второго файла, затем - проход по
первому и проверка совпадения. Для уменьшения объема памяти - можно
хешировать не сами строки а их контрольные суммы (например - CRC, SHA,
MD4) в этом случае придется подчитывать строки для сравнения из файла.
для реализации второго подхода можно использовать готовые библиотеки
типа dbm, gdbm, etc...
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

17.10.2007, 14:37:47

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34876590

AndreiNz

Участник

Сообщения: 469

Рейтинг: 0 / 0

А не проще ли создать два листа и загрузить в каждый строки из соответствующих файлов. Затем бежим по первому листу, берем первую строку и ищем ее во втором листе простым перебором. Если находим, та удаляем строку из обоих листов. Затем делаем тоже самое со второй строкой из первого листа и так пока не переберем весь первый лист. Все, что осталось выплевываем в два файла. Для ускорения можно заменить второй лист на мап. Еще более интересный вариант - создать два сета и получть пересечение.

...

Рейтинг:

0 / 0

17.10.2007, 22:36:30

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34876591

AndreiNz

Участник

Сообщения: 469

Рейтинг: 0 / 0

Тоесть не пересечение, а то, что останется в сетах, если пересечение из них удалить.

...

Рейтинг:

0 / 0

17.10.2007, 22:38:35

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34876603

ErV

Участник

Сообщения: 1 702

Рейтинг: 0 / 0

AndreiNz wrote:

> А не проще ли создать два листа и загрузить в каждый строки из
> соответствующих файлов. Затем бежим по первому листу, берем первую
> строку и ищем ее во втором листе простым перебором.
Можно сразу отсортировать оба "листа" (qsort, hashsort, и т.д.), и потом
поисков придется производить намного меньше (просто надо будет
перебрать одновременно оба списка от начала до конца).
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

17.10.2007, 22:50:45

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34876855

teras

Гость

> AndreiNz wrote:
>
> А не проще ли создать два листа и загрузить в каждый строки из
> соответствующих файлов. Затем бежим по первому листу, берем первую
> строку и ищем ее во втором листе простым перебором.

Вообще-то это зависит от перспектив. Тут строк немного, поэтому все
пойдет. Если файлы будут расти, то разница во времени станет заметнее, и
чем дальше - тем больше.

Линейные поиски по несортированному списку - O(n^2),
сортировки и слияние - O(2*log(n)+n),
хеширование - O(n).
Где n - количество строк в обоих файлах.
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

18.10.2007, 08:07:01

| Ответить | Цитировать | Написать

сравнение двух файлов txt

#34878097

deffss

Гость

Спасибо за советы, воспользовался STL. Скорость работы вполне подходит.

...

Рейтинг:

0 / 0

18.10.2007, 14:24:58

| Ответить | Цитировать | Написать

17 сообщений из 17, страница 1 из 1

Форумы / C++ [игнор отключен] [закрыт для гостей] / сравнение двух файлов txt

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=57&msg=34874494&tid=2027995]:	0ms
get settings:	10ms
get forum list:	16ms
check forum access:	2ms
check topic access:	2ms
track hit:	437ms
get topic data:	10ms
get forum data:	3ms
get page messages:	55ms
get tp. blocked users:	1ms
others:	250ms

total:	786ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы