|
|
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
TopSpaceЕсть просто факт: на западе исследование таких малоизученных областей как телепатия, возможность влияния сознания на распределение случайных величин, применение газоразрядной визуализации и т.п. - там это имеет намного большую поддержку (сужу по конкретным примерам). Не скажу что всегда поддержку государства, нет. Многие ученые там вынуждены проводить "альтернативные" исследования в свободное от "основной" деятельности время (как и у нас). Но в целом оно как-то более лояльно обществом принимается, финансируется. К некоторым темам уже и государство начало присматриваться.Ключевое слово тут - "финансируется". Если "оператор" сам словами запишет что он "напринимал", сравнивать будет тривиально и бабок на это не выбить. А вот он нарисует какую-нибудь хрень , тут конечно бесконечное поле для освоения средств. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.04.2012, 14:42 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
mayton Этот метод? Еще брошу пару помидорчиков в сторону персептивного хеша. Подумал на досуге и пришел к следующему. Метод не учитывает цвет. В частности похожие по форме но разные по цветам фигуры (пример - национальные флаги) могут быть классифицированы как одно и то-же изображение хотя это грубейшая ошибка. Метод не годится для текстур, особенно стороны которых кратны 8x pixels. Мы будем получать тождественный белый либо чёрный квадрат (в зависимости от точности вычисленного среднего (или медианы)). Метод боиться линейных аффинных преобразований. Здесь как-бы всё ясно. Просто хочу напомнить что человеческий глаз превосходно детектирует перевёрнутые, зеркально отображённые и скошенные (skew) изображения. В данном методе потери от такой операции - чудовищны. В теории неокогнитрон способен быть толерантным к вращениям но по теме больше ничего не смогу добавить ибо это суровая теория НС и по сабжу неосилю ничего добавить. В целом этот метод неплох. Особенно в соотношении эффективность/цена реализации. Если мои кривые ручищи дойдут до "каталогизатора", которым я хвастался уже давно, то обязательно добавлю этот тип графического хеша как базовый. По поводу функции pHash - ничего не готов сказать т.к. еще не разобрался. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.04.2012, 16:28 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
он принимает еще и другие сигналы, которые по заключению ученых-лингвистов четко относятся к древним (и оператору конечно же не известным) культурам, источник передачи которых пока не установлен. О, а круто написать прогу, которая семантически расшифрует эту древнюю хрень? и заодно установит источник! и все на вбскрипте)))) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.04.2012, 17:32 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
Как мне кажется правильное направление для движения - декомпозировать картинку в систему уравнений. Потом сравнивать уравнения заменой и подбором похожих элементраных частей( графиков функций) уравнения. Если начинать с простого , думаю достаточно легко будет выделить эйфилеву башню на любом пейзаже , хоть даже развернутую на 90 или 180 градусов относительно фона , или сравнивать эмоциональное состояние человека на фото со смайликами, или даже найти что то общее в звездочке и букве "Ж". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 14:40 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
Частично это уже используется но не для сличения а для сжатия картинок. И не всей а фрагментов 8х8. Для JPEG-это суперпозиция колебательных 2-D функций. Для LuraWave/JPEG2k это еще какой-то хитрый метод. Пусть математики докурят я уж постою в сторонке и послушаю. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 14:59 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
mayton, Это всё мило... для случая, когда на картинке один и тот же объект. Скажем, можно сворачивать картинку не в прямоугольной с.к., а в полярной - поворот картинки вокруг центра превратится в фазовый сдвиг, можно будет сравнивать по низким частотам повёрнутые изображения одного и того же. Но для задачи из этой темы... в кривых коньячный бокал на столе может быть похож на мост с вантами, но не на бутылку коньяка. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 15:14 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
Abstractionmayton, Это всё мило... для случая, когда на картинке один и тот же объект. Скажем, можно сворачивать картинку не в прямоугольной с.к., а в полярной - поворот картинки вокруг центра превратится в фазовый сдвиг, можно будет сравнивать по низким частотам повёрнутые изображения одного и того же. Но для задачи из этой темы... в кривых коньячный бокал на столе может быть похож на мост с вантами, но не на бутылку коньяка. Для того что бы сделать много начать нужно с малого. Важно правильно начать. А дальше пробирки, бокалы, бутылки и цистерны по фото с суппер разрешением и эскизам в категории причислять. Там уже база знаний нужна будет , оптимизация поиска маршрутов в графах. Она в принципе сразу пригодится, как только декомпозиция начнется. Как тут уже говорили, многие знают как все должно быть , но не могут обьяснить почему, вот и у меня так. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 15:35 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
ДохтаРКак тут уже говорили, многие знают как все должно быть , но не могут обьяснить почему, вот и у меня так. Хорошее качество для ребёнка. Нормальное для эксперта (если "не могу объяснить" = "могу, но чёрта с два поймёте"). Плохое для программиста. А уж соответствие между смайликами и эмоциями на человеческом лице - это пять. Вы хотя бы лицо устойчиво "прочитайте", эта задача не из лёгких."Диалоги" Гордона, "Два мозга"Будучи очень изобретательной, Зайдел демонстрировала испытуемым странные, так называемые гетеротопические, картины. Это картины, где предметы соединяются в неправильных и смещенных комбинациях. Например, она использовала картину Рене Магритта «Изнасилование». Это контур лица женщины, но вместо самого лица — торс женщины, глаза — это грудь, пупок — это нос, лобковая область — рот. Она показывала эту картину правому и левому полушарию двух больных, которые исследовались в это время в лаборатории. Оказалось, что когда это изображение видит правое полушарие, то гештальт головы, волос, верхней части туловища практически не позволяет ему увидеть части туловища на местах реальных частей лица. И когда пациентов просили показать где глаза, они показывали на грудь, нос — они показывали на пупок. Когда им говорили, покажите, где лоб — они показывали туда, где должен быть лоб, волооы — они правильно описывали волосы, окаймляющие «лицо». Когда их спрашивали где находится грудь, они выносили свое указание вовне картины — несколько ниже, туда, где должна была бы быть грудь. Когда спрашивали, где здесь пупок, они показывали еще ниже под картиной, где уже ничего нет, но где должен был быть пупок. А левое полушарие опознавало всё абсолютно точно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 15:51 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
maytonЧастично это уже используется но не для сличения а для сжатия картинок. И не всей а фрагментов 8х8. Для JPEG-это суперпозиция колебательных 2-D функций. Для LuraWave/JPEG2k это еще какой-то хитрый метод. Пусть математики докурят я уж постою в сторонке и послушаю. Для последующей классификации сферических коней в вакуме , хранить нужно 3 , и обрабатывать точку наблюдения и источник света. По сути нужен обратный рендеринг. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:03 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
ДохтаРДля последующей классификации сферических коней в вакуме , хранить нужно 3 , и обрабатывать точку наблюдения и источник света. По сути нужен обратный рендеринг. Обратный рендеринг не всегда возможен. Если представить себе что у нас эскиз, карандашный набросок или вообще что-то из области нематериальных фантазий укуренного и экзальтированного художника. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:08 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
AbstractionДохтаРКак тут уже говорили, многие знают как все должно быть , но не могут обьяснить почему, вот и у меня так. Хорошее качество для ребёнка. Нормальное для эксперта (если "не могу объяснить" = "могу, но чёрта с два поймёте"). Плохое для программиста. А уж соответствие между смайликами и эмоциями на человеческом лице - это пять. Вы хотя бы лицо устойчиво "прочитайте", эта задача не из лёгких."Диалоги" Гордона, "Два мозга"Будучи очень изобретательной, Зайдел демонстрировала испытуемым странные, так называемые гетеротопические, картины. Это картины, где предметы соединяются в неправильных и смещенных комбинациях. Например, она использовала картину Рене Магритта «Изнасилование». Это контур лица женщины, но вместо самого лица — торс женщины, глаза — это грудь, пупок — это нос, лобковая область — рот. Она показывала эту картину правому и левому полушарию двух больных, которые исследовались в это время в лаборатории. Оказалось, что когда это изображение видит правое полушарие, то гештальт головы, волос, верхней части туловища практически не позволяет ему увидеть части туловища на местах реальных частей лица. И когда пациентов просили показать где глаза, они показывали на грудь, нос — они показывали на пупок. Когда им говорили, покажите, где лоб — они показывали туда, где должен быть лоб, волооы — они правильно описывали волосы, окаймляющие «лицо». Когда их спрашивали где находится грудь, они выносили свое указание вовне картины — несколько ниже, туда, где должна была бы быть грудь. Когда спрашивали, где здесь пупок, они показывали еще ниже под картиной, где уже ничего нет, но где должен был быть пупок. А левое полушарие опознавало всё абсолютно точно. Про смайлики долго рассказывать . При должном подходе это ИМХО просто , Я присутсвовал МЛМ -ом семинаре который проводил Алан Пиз лично Часов 6 рассказывал всякие НЛП-шные кишки . Вспомнил некоторые моменты из презентации, как ассоциативно наш моск все обрабатывает, и как достаточно просто вывести и повторить мат модель по распознаванию черт лица( молодой , старый, мужчина, женщина) и эмоций. Это гуманитарная презентация была. Связь с математикой в моей базе знаний имеет еще множество неоптимальных маршрутов. И поэтому я не могу обьяснить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:16 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
От НЛП-шных формулировок к нейросетям - мост длиной в бесконечность. Вот топик стартер нам задачку поставил. Словесно. Есть кувшин и есть какая-то бочка. А вот как теперь перевести это на формулы математики и формальные языки разработки - вот в чём вопрос. Я думаю это кризис мат метода. Нет у нас еще таких методов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:21 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
maytonОт НЛП-шных формулировок к нейросетям - мост длиной в бесконечность. Вот топик стартер нам задачку поставил. Словесно. Есть кувшин и есть какая-то бочка. А вот как теперь перевести это на формулы математики и формальные языки разработки - вот в чём вопрос. Я думаю это кризис мат метода. Нет у нас еще таких методов. Точный методов нет и быть не может. Компьютер будет ошибаться так же как и человек( вернее ребенок). А приближенные методы ассициативные связи через похожесть графиков элементарных функций даст сложный длиннный но самый предсказуемый с точки зрения человеческой логики результат. Потому, что будет работать по похожим законам , и вероятность угадывания зашумленного изображения у человека и компа будет приблизительно одинакова. Они смогуть видеть приблизительно похожие вещи. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:38 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
ДохтаРПотому, что будет работать по похожим законам , и вероятность угадывания зашумленного изображения у человека и компа будет приблизительно одинакова. Они смогуть видеть приблизительно похожие вещи. Неа. Компу для этого не хватет "творчества" или того что принято называть "божьей искрой". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:42 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
ДохтаРА приближенные методы ассоциативные связи через похожесть графиков элементарных функций даст сложный, длинный, но самый предсказуемый с точки зрения человеческой логики результат. Потому что будет работать по похожим законам, и вероятность угадывания зашумленного изображения у человека и компа будет приблизительно одинакова. Месье, Вы либо троллите, либо бредите. Мозг не строит графики элементарных функций окромя прямых, там сильно другие принципы работы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:45 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
maytonДохтаРПотому, что будет работать по похожим законам , и вероятность угадывания зашумленного изображения у человека и компа будет приблизительно одинакова. Они смогуть видеть приблизительно похожие вещи. Неа. Компу для этого не хватет "творчества" или того что принято называть "божьей искрой". Компу для этого нехватает базы знаний ( многомерного графа) ассоциаций. И алгоритмов быстрого поиска оптимальных маршрутов. Комп более универсальный вычислитель чем мозг, поэтому не всегда оптимально исполузует свою тактовую частоту. Аналоговые ВМ , которые програмируются раз и навсегда в распознавании, например в радиолокации еще 80 годах прошлого века достигли большего в распознавании чем современные компы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:47 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
ДохтаРКомпу для этого нехватает базы знаний ( многомерного графа) ассоциаций. И алгоритмов быстрого поиска оптимальных маршрутов. Комп более универсальный вычислитель чем мозг, поэтому не всегда оптимально исполузует свою тактовую частоту. Понятие базы, алгоритма и тактовой частоты неприменимы к деятельности мозга. Их просто нет как сущностей. Биохимия, очень сложная живая сеть клеток и некие эфемерные поля, которые учёные называют "информационным полем" а богословы более просто, одним словом - вот что имеет место в сложном чуде природы которое называется "человек". Не в количестве дело. Яркий пример - семантические сети. Эксперименты по ним ведуться уже третий десяток лет а результат - нулевой. Терабайтные хранилища инфы тянут максимум на сложную энциклопедию или локальный гугол. Мы научились складывать и индексировать текстовые данные но по прежнему не умеем (абсолютно!) излекать из них новые знания (открытия!). Количественный прорыв не дал нам никакого качественного результата. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:54 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
AbstractionДохтаРА приближенные методы ассоциативные связи через похожесть графиков элементарных функций даст сложный, длинный, но самый предсказуемый с точки зрения человеческой логики результат. Потому что будет работать по похожим законам, и вероятность угадывания зашумленного изображения у человека и компа будет приблизительно одинакова. Месье, Вы либо троллите, либо бредите. Мозг не строит графики элементарных функций окромя прямых, там сильно другие принципы работы. Мозг строит графики и оптимальные маргруты когда учится разговаривать , ходить , ездить на велосипеде или конках и складывет шаблоны в свою ассоциартивную БД. Потом по мере необходимости очень быстро находит системы готовых уравнений и чуть ли не на лету их решает , по заложенному в базе знаний алгоритму. Вы думаете почему люди регулярно на теже грабли наступают, да потому что маршрут на грабли в мозгу оказывается самый оптимальный, а обратная связь по корректировке маршрута со временем атрофировалась. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 16:57 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
mayton, Ну, насчёт "абсолютно", ИМХО, перегиб. Получали же новые доказательства математических теорем с помощью логического программирования (а это чистое манипулирование символами), экспертные системы худо-бедно работают и способны из базы знаний и информации на входе получить (и объяснить) некоторый ответ. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 17:00 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
ДохтаРМозг строит графики и оптимальные маргруты когда учится разговаривать , ходить , ездить на велосипеде или конках и складывет шаблоны в свою ассоциартивную БД. Если-бы мы, препарируя мозг нашли там биты и байты и АЛУ тогда это было-бы верно. Но их там нету. Кроме того сам по себе процесс строительства алгоритмов безсмысленен для мозга. В быту (движения, занятия спортом, готовка еды) человеку вобщем-то никакие алгоритмы не нужны. Он может прожить счастливую и насыщенную жизнь не умея складывать 2+2 а ведь для того чтобы ходить (управлять сотнями мускулов одновременно и еще и с feedback-ом ) нужно каждую секунду решать сотни диф-уравнений из области механики. Но вот в чём штука. Нету решателя этих уравнений. Нету представления чисел в мозге для механики движения и нету единой точки мозга (нейрон, ансамбль нейронов) куда можно было-бы сунуть скальпень и резанув сказать что мы убрали решатель дифуров. Вот так вот. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 17:02 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
Abstractionmayton, Ну, насчёт "абсолютно", ИМХО, перегиб. Получали же новые доказательства математических теорем с помощью логического программирования (а это чистое манипулирование символами), экспертные системы худо-бедно работают и способны из базы знаний и информации на входе получить (и объяснить) некоторый ответ. Я как-то рассуждал по поводу математики и пришёл к парадоксу. Представим себе что есть некий чёрный ящик. У него нет связи с внешним миром. Но он обладает гигантской памятью и производительностью в мегафлопах. В него заложены самые базовые основы математики. Тоесть он знает что такое точка, прямая и число. Далее я желаю мотивировать этот чёрный ящик чтобы он думал над математикой и выдавал мне мат. открытия. Одно за другим. Ну там... сначала гипотезы потом теоремы и т.д. И здесь меня ждёт провал. Я считаю что ничего он не придумает. Не хватает какого-то связующего элемента. Я сейчас не помню ход своих рассуждений как я ка этому пришёл но если всмпомню - отпишу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 17:06 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
mayton, Автомат Гёделя же. Можно хоть впрямую по "Теории множеств" Бурбаки его написать (там аксиомы расписаны в базовых символах), будет он выдавать поток верных теорем в аксиоматике Цермелло. Теорему, скажем, о непротиворечивости исходной аксиоматики не выдаст никогда, а Теорему Ферма вполне может (только будет она в адской формулировке "при присоединении к исходной аксиоматике аксиом (пара сотен аксиом), ..."). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 17:13 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
Я както давно пытался читать научную книгу по теории рендеринга. ТАм математически формулами, которых я доконца не понял доказывался следующий момент. Есть бесформенное пятно , которое в статике никто идентифицировать не может , но заставив это пятно сделать 3-5 кадров трансформировав его на основании элементарной дифиренциальной функции. Челоевек автоматом достаточно точно определяет это пятно как рыбу , лошадь , или дерево колушещееся на ветру. Суть была в том что нефик тратить ресурсы на прорисовку , челевек этого не просто не оценит , он этого даже не увидит , также как как не видит деталей в других быстродвижущихся предметах в силу физиологии зрения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 17:17 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
ДохтаР, И? Да, восприятие человека "заточено" не на определение силуэта по мгновенному образу, поэтому неточный мгновенный образ не приводит к невозможности распознать объект (не говоря уж о том, что объект не воспринимается одномоментно "целиком", взгляд быстро проходит по нему по достаточно сложной траектории). Грубо говоря, если есть весы, которые при измерении фильтруют высокочастотные шумы, они смогут определить вес вибрирующего предмета. Но к построению графиков элементарных функций это не имеет никакого отношения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 17:24 |
|
||
|
Семантическое сравнение изображений
|
|||
|---|---|---|---|
|
#18+
AbstractionДохтаР, И? Да, восприятие человека "заточено" не на определение силуэта по мгновенному образу, поэтому неточный мгновенный образ не приводит к невозможности распознать объект (не говоря уж о том, что объект не воспринимается одномоментно "целиком", взгляд быстро проходит по нему по достаточно сложной траектории). Грубо говоря, если есть весы, которые при измерении фильтруют высокочастотные шумы, они смогут определить вес вибрирующего предмета. Но к построению графиков элементарных функций это не имеет никакого отношения. Задача мозга , по графику востановить функцию , и дальшее прогнать ее по известному ряду для повторения поведения. По поводу книги я еще скажу , что неестественно выгнутые суставы в статичном фотожопе или мулте в глаза бросаются больше чем качество текстур. ( Когнитивный дисонанс относительно оптического обмана зрения получится с большей вероятностью ). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.04.2012, 17:36 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=37753053&tid=1342291]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
58ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
62ms |
get tp. blocked users: |
1ms |
| others: | 251ms |
| total: | 415ms |

| 0 / 0 |
