|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
miltorg Victor Ichalov, Повторил у себя ---- ОХРЕНЕТЬ!!! Это чудо какое то. Спасибо огромнейшее. Сейчас подсуну туда настоящий файл. Он у меня уже просчитан для 10 С ходу - не сработало :-( Что-ж мне так не везёт, блин. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2021, 21:31 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Victor Ichalov, Когда будет презентация-конференция ваших запросов? У меня вопрос. Ваши запросы подойдут для любых аналогичных входящих данных или это какой то частный случай? - я в коде вижу, что вы используете конкретную строку - или это для проверки? ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2021, 21:36 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
miltorg Когда будет презентация-конференция ваших запросов? Я не знаю, пока хотелось бы этого избежать. miltorg Ваши запросы подойдут для любых аналогичных входящих данных или это какой то частный случай? - я в коде вижу, что вы используете конкретную строку - или это для проверки? Должны подходить для любых аналогичных, запросы с датой просто для контроля. Единственное что приходит в голову это то что во втором поле должно быть 19 пробелов: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
Может там подчёркивания, а не пробелы? Вообще сложно что-то ответить по предложенной диагностической информации. Возвращается пустая выборка или какая-то ошибка? ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2021, 22:17 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Даже скорее какой-то такой проверочный запрос: Код: sql 1. 2.
... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2021, 22:25 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Можно задачу в лоб решить, но итоговый селект с перестановками нужно динамически формировать Пример для 10 чисел в итоговой выборке. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26.
... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 00:04 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Подфиксил у себя баг. Связан с этим чортовым символом табуляции который в оригинальном txt/csv используется. Вобщем я проглатывал 1 символ хромосомы. Из за этого многие единички не попадали в репорт. Теперь 60 тысяч потенциальных кластеров есть. Вот шапка отчота сортированного по размеру измерений в кластере. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21.
Вот хвост. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 03:24 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
И тоже самое. Отсортировано по количеству хромосом к властере. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.
Андрон. Устинов. Н5N1. Смотрите. Ищите несоответсвия. Исходник и бинарь я предоставлю. Просто во мне сидит воинстующий эстет и я не хочу его отдавать в виде рваной салфетки где я писал каракули и все прочее. Привык... знаетели к clean code. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 03:28 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
mayton, там на входе уже другой файл - miltbase1.txt )) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 04:32 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
mayton Андрон. Устинов. Н5N1. Смотрите. Ищите несоответсвия. Исходник и бинарь я предоставлю. Просто во мне сидит воинстующий эстет и я не хочу его отдавать в виде рваной салфетки где я писал каракули и все прочее. Привык... знаетели к clean code. clean code предполагает наличие итегрейшен теста, напишите интегрейшен тест уже, в ваших салфетках лажа. я же написал, в верном ответе на miltbase.txt должны быть 66 строк "clusterDimenstions : 10, chromosomesInCluster : 5" вход для теста Код: plaintext 1. 2. 3. 4. 5.
выход: https://filebin.net/eg5q9277xuqpqvtw/integration_test_out.txt?t=rp9s0q41 ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 11:06 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Victor Ichalov, Спасибо. Возвращается недовыборка Если у вас так строго с пробелами - я сейчас гляну нетестовый исходный ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 11:33 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
miltorg Возвращается недовыборка Другой причиной может быть то что мои запросы только сравнивают непрерывные подпоследовательности. Т.е. они не засчитывают такое как совпадение: Код: plaintext 1.
Просто может в miltbase1 такого нет, поэтому результат совпадает. Ну можно написать SQL чтобы все упорядоченные комбинации сравнивал. Но это будет: 1. Медленнее 2. Видимо прогрессивно медленнее с уменьшением длины подпоследовательности 3. Сложно определить в процессе сколько процентов уже сделано (в perl полегче) 4. Вызывать необходимость следить за памятью, т.к. если она кончится в процессе то результата не дождёшься ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 13:05 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
H5N1 clean code предполагает наличие итегрейшен теста, напишите интегрейшен тест уже, в ваших салфетках лажа. я же написал, в верном ответе на miltbase.txt должны быть 66 строк "clusterDimenstions : 10, chromosomesInCluster : 5" Ну .. интеграционные мы пока отложим. Они предполагают минимум несколько взаимодействующих модулей системы. У меня - просто процедура main. И интегрироваться там несчем. По поводу архивов. Код: sql 1. 2. 3. 4. 5. 6.
У меня последний файлик с контольной суммой 91ba78c4. Дайте линку на более актуальный. Не могу найти по треду. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 14:05 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
mayton, 22276243 советую обработать в текстовом редакторе, заменив ТАВ после даты на ЗПТ у меня это первая обязательная обработка данных дом-2 жив, однако... ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 14:10 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Alex_Ustinov, спасибо. Чет не заметил. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 14:12 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Victor Ichalov miltorg Возвращается недовыборка Другой причиной может быть то что мои запросы только сравнивают непрерывные подпоследовательности. Т.е. они не засчитывают такое как совпадение: Код: plaintext 1.
Просто может в miltbase1 такого нет, поэтому результат совпадает. Ну можно написать SQL чтобы все упорядоченные комбинации сравнивал. Но это будет: 1. Медленнее 2. Видимо прогрессивно медленнее с уменьшением длины подпоследовательности 3. Сложно определить в процессе сколько процентов уже сделано (в perl полегче) 4. Вызывать необходимость следить за памятью, т.к. если она кончится в процессе то результата не дождёшься То есть вы делали задание под себя, а не по заданию? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 14:29 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
miltorg, Пошёл 2 месяц "простенького задания". Но у меня есть хоть долгие, но решения. У вас? - Нет ничего? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 14:58 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
mayton Ну .. интеграционные мы пока отложим. Они предполагают минимум несколько взаимодействующих модулей системы. У меня - просто процедура main. И интегрироваться там несчем. странновастые мягко говоря у вас представления. ладно, я утомился. топик в какой-то чат малолеток превратился. я говорю на этот вход должно быть 66 строк выхода, ноль внимания. вот мой джарник, собранный на java 15 и фолдер с заглушкой от хадупа. как запустить видно в bat файле. вывод параметризован - или в вашем стиле или тот что хотел miltorg. https://filebin.net/tngol6xocmvfzm7l/app1.zip?t=k7k0oin1 по мне так надо нормальный пример генерить, где и 19 совпадений встретиться могут, ну и инпут побольше, хотя бы 10к, ведь если пару раз в день строка добавляется ... ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:00 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:07 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Alex_Ustinov по мне так это халтура базирующаяся на знании как был сгенерирован тестсет. на miltorg1.txt оно уже кривой ответ даст ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:09 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
H5N1 mayton Ну .. интеграционные мы пока отложим. Они предполагают минимум несколько взаимодействующих модулей системы. У меня - просто процедура main. И интегрироваться там несчем. странновастые мягко говоря у вас представления. ладно, я утомился. топик в какой-то чат малолеток превратился. я говорю на этот вход должно быть 66 строк выхода, ноль внимания. вот мой джарник, собранный на java 15 и фолдер с заглушкой от хадупа. как запустить видно в bat файле. вывод параметризован - или в вашем стиле или тот что хотел miltorg. https://filebin.net/tngol6xocmvfzm7l/app1.zip?t=k7k0oin1 по мне так надо нормальный пример генерить, где и 19 совпадений встретиться могут, ну и инпут побольше, хотя бы 10к, ведь если пару раз в день строка добавляется ... Я не против хадупа. Я его использовал в AWS. Просто решение для Андрея надо упростить так чтобы он мог хотя-бы это standalone запустить на любой тачке где установлена JRE. Скопировать и запустить шелл или бат-скриптик. По поводу кластера 1 2 3 4 5 6 7 8 9 10 11 12. Он был найден. И классифицирован дважды как подкластер более точного 1 2 3 4 5 6 7 8 9 10 11 12 13. И три хромосомы в разных сочетаниях туда зашли. Это отфильтровано из отчота. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Код: sql 1. 2. 3.
Почему должно быть 66 ? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:18 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
H5N1, какая халтура не понял это по miltorg1.txt и есть, хотите проверьте поиск вхождения наборов через битовые ф-ии находим пары вхождения и группируем по набору вхождения . Все. Та как эта тема висит уже месяц - для меня это уже просто комедийный сериал Т.к. автор выуживает конечный код под ключ для передачи заказчику - поэтому такой странный топик, и это уже второй первый здесь Как отсортировать 1 миллиард записей? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:21 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
Victor Ichalov miltorg Когда будет презентация-конференция ваших запросов? Я не знаю, пока хотелось бы этого избежать. miltorg Ваши запросы подойдут для любых аналогичных входящих данных или это какой то частный случай? - я в коде вижу, что вы используете конкретную строку - или это для проверки? Должны подходить для любых аналогичных, запросы с датой просто для контроля. Единственное что приходит в голову это то что во втором поле должно быть 19 пробелов: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
Может там подчёркивания, а не пробелы? Вообще сложно что-то ответить по предложенной диагностической информации. Возвращается пустая выборка или какая-то ошибка? Вот первые 20 строк нетестового файла: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19.
... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:22 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
miltorg То есть вы делали задание под себя, а не по заданию? Вообще, я отвечал на вопрос "Как оптимизировать скорость?": "Вам лучше всего будет переписать perl скрипт ... Но это сложно написать без рабочего тестового стенда." (т.е. без реалистичных данных которые разложены в таблицы со структурой, требуемой скриптом) Что касается "Могу предложить решение чисто на MySQL ...", то я его сделал для кросс-проверки что из тестовых данных действительно получается требуемое, оно выглядело подходящим, поэтому я его опубликовал именно чтобы можно было свериться с другими решениями, найти причины расхождений, если они есть. Я тут вижу проблему скорее в том что по тестовым примерам не очевидно что требуется найти также совпадения подпоследовательностей с разрывами и в общей массе написанного также сложно найти где это требование явно указано. (Кстати, оно точно нужно заказчику? Я в биоинформатике не очень разбираюсь, но уже оптимизировал что-то подобное и там вроде нужно было сравнивать только непрерывные последовательности.) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:24 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
mayton, комбинации по 10 из 12 = 12!/(12-10)!*10! = 66 и там 5 строк совпадений 3333-3334-3335-3336-3337 5 1 2 3 4 5 6 7 8 9 10 11 12 нумерация у меня с 1 по файлу miltorg.txt ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:26 |
|
Считает слишком долго. Уже 2 сутки. Как оптимизировать скорость?
|
|||
---|---|---|---|
#18+
mayton Код: sql 1. 2. 3.
Почему должно быть 66 ? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2021, 15:33 |
|
|
start [/forum/topic.php?fid=47&msg=40042794&tid=1828188]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
173ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
59ms |
get tp. blocked users: |
1ms |
others: | 13ms |
total: | 291ms |
0 / 0 |