powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Нечеткая сортировка интервальных данных. Такое возможно?
22 сообщений из 22, страница 1 из 1
Нечеткая сортировка интервальных данных. Такое возможно?
    #35831875
Здравствуйте. Есть таблицы с интервальными данными, где значения заданы в виде От - До. Это результаты измерений технических параметров. Можно ли эти данные как-то отсортировать? Данные могут частично перекрываться: или целиком интервалы или частично. Соответственно, пока что никаких идей кроме нахождения среднего (От + До)/2 и сортировки по этим значениям ничего на ум не пришло. Это будет работать, если разброс значений относительно среднего небольшой, а вот если разброс большой, то не подходит. Кто-нибудь работал с такими вещами?

Пример значений интервального атрибута:
160-180
170-190
190-195
125-140
150-151
170-175
Разброс значений возникает из-за ошибок измерения и просто недостатка информации. Имеет ли смысл упорядочивать такие результаты и какой смысл будет в таком упорядочивании? Мне это нужно, чтобы разбивать данные на группы.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35831999
Kirill Razuvaev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
>> Разброс значений возникает из-за ошибок измерения и просто недостатка
>> информации.
>> Имеет ли смысл упорядочивать такие результаты и какой смысл будет в
>> таком упорядочивании? Мне это нужно, чтобы разбивать данные на группы.
Интересно, какой совет Вы хотите получить?
Вы бы хоть задачу описали поставленную.
Может, можно и на группы не разбивать, ну, или неупорядоченный набор
разбить.


Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35832055
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> Разброс значений возникает из-за ошибок измерения и просто недостатка информации.

Задачу полностью опишите. Что Вы измеряете, откуда такие ошибки и что означает "недостаток информации"?

> Мне это нужно, чтобы разбивать данные на группы.

Критерии группирования?
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35832123
Есть измерительная аппаратура, которая меряет с определенной точностью. Разброс получается из-за точности и условий эксперимента, чем хуже условия, тем больше разброс, если вообще что-то получается намерять. Отсюда и недостаток информации, потому что не всегда удается повторить измерения в обозримом будущем. Измерений проводится много (несколько устройств, которые меряют этот параметр у этого же объекта), поэтому данные усредняются и выдаются в виде доверительного интервала с определенной вероятностью. Область применения написать не могу.

Эти данные нужно обрабатывать, все как и в любом эксперименте, нужно объяснять, почему связаны различные физические параметры. Ну и по ходу дела я решил разбить данные на однородные группы, чтобы потом анализировать уже группы в целом, а потом и особенности групп. или наоборот. В общем данные нужно анализировать и я решил, что на этом форуме могло быть что-то подобное. Со шкалированием тоже не понятно. Параметр принимает единственное значение (с поправкой на точность аппаратуры, то есть до меньшего предела, чем в интервале значения), которое укладывается в доверительный интервал. По-другому строить шкалу?

В примере:
160-180
170-190
190-195
125-140
150-151
170-175
Истинными данными будут
168
175
190
132
150,5
171
Но узнать их уже не получится и приходится работать с тем, что есть и искать закономерности в этих данных.

Помог бы кластерный анализ, если бы были методы работы с интервалами, но я таких не нашел. Может быть это вопрос и не про БД. Тогда не знаю, где вообще искать.

Интересно, какой совет Вы хотите получить?
Существуют ли нечеткие сортировки? Кто-нибудь хранит в БД интервальные данные? Кто-нибудь сортирует их? Как работать с неточными данными? Как строить шкалы таких данных? Какова общая методология? Что можно почитать по этому поводу?
Может я не так формулирую вопрос. Ведь наверняка есть много областей, где данные заданы в виде интервальных значений и там либо меняют шкалы либо делают что-то еще. Вот и интересуют мысли по этому поводу.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35832141
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> Есть измерительная аппаратура, которая меряет с определенной точностью.

Условия измерений можно формализовать? Точность измерений всегда заранее известна? Что значит "истинные данные"? Откуда они берутся?

> Ведь наверняка есть много областей, где данные заданы в виде интервальных значений

Конечно. Например, ценовые ряды.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35832390
Условия измерений можно формализовать? Точность измерений всегда заранее известна? Что значит "истинные данные"? Откуда они берутся?

Точность такая:
160-180 95%
170-190 95%
190-195 95%
125-140 90%
150-151 99%
170-175 92%
То есть с каждым интервалом сопоставлено значение вероятности, что в него попадут эти данные. Есть действительное физическое значение переменной, как есть в действительности, физически, а есть то, что удалось измерить, в данном измерении или группе измерений. Точность, как и измерения зависит от условий эксперимента, которые в своем роде уникальны.
Если X - реальное значение параметра (значение которого число с плавающей точкой), то запись 160-180 95% означает, что 160 <= X <= 180 с вероятностью 0,95. Если разброс относительно истинного значения небольшой (и следовательно невелика разница между максимумом и минимумом) и велико значение вероятности (скажем 0,99), то данные можно считать "точными". Тогда наверное можно было бы перейти к какой-то другой шкале. Проблема в том, то истинное значение не известно и хранится лишь приближенная оценка его, причем различной вероятностью этой оценки. Как работать с такого рода данными?
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35832632
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> Как работать с такого рода данными?

Судя по Вашим объяснениями. видимо, никак. Все, что Вы можете получить от случайного процесса, Вы имеете. Любая группировка возможна как результат статистической обработки.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35833122
Понятно. А где можно почитать про упоминаемые ценовые ряды?И вообще про шкалирование?
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35833185
Может быть Вам пойти с другой стороны - откалибровать свои измерительные устройства? Пустить эталонный сигнал (с генератора или смоделировать в цифровом виде) и снять показания. А затем тем или иным методом кабровки получить передаточную или импульсные характеристики приборов. И потом уже корректировать неизветсные данные на эти калибровочные коэффициенты
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35834868
Откалибровать не получится, к сожалению, пока.
А если это
160-180 95%
170-190 95%
190-195 95%
125-140 90%
150-151 99%
170-175 92%
Привести к виду
160-180 90%
170-190 90%
190-195 90%
125-140 90%
150-151 90%
170-175 90%
то есть сознательно понизить вероятность до нижнего из возможных значений?Тут можно что-то сделать со шкалой?И хотелось бы все же почитать что-нибудь про шкалирование или что-то ещё.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35840593
guest_20040621, куда же Вы пропали? По-видимому Вы разбираетесь в теме, дайте, пожалуйста, ссылочку почитать что-нибудь по шкалированию, тем же ценовым рядам или чему-нибудь подобному.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35851887
guest_20040621, где же Вы? Ответьте, пожалуйста, на вопрос. Очень нужно)
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35869197
guest_20040621, где же Вы? Ответьте, пожалуйста, на вопрос. Очень нужно)
UP... все ещё интересует ответ...
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35872510
Переформулирую вопрос. Пусть заданы интервалы, допустим, цен - от и до для каждой товарной позиции. Как сортировать или сравнивать такие данные? Что делать со шкалой?

Товар Минимальная цена в сети магазинов Максимальная цена в сети магазинов
Туфли "такие-то" 4400 4900
Туфли "сякие-то" 5900 6100
.
.
.
.
Туфли "ещё какие-то" 4600 4700
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35873250
Фотография S.G.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Перфоратор Пусть заданы интервалы, допустим, цен - от и до для каждой товарной позиции. Как сортировать или сравнивать такие данные? Что делать со шкалой?
До того, как искать ответ на вопрос "как", надо ответить себе на вопрос "зачем" или "для чего".
Вам надо увидеть разброс цен определенной марки туфель по всем магазинам? Значит, надо сортировать по марке, и там определять - минимальную, маскимальную и/или среднюю.
Вам надо вообще определить какую сумму народ тратит на обувь? Значит, марка не играет роли, и надо усреднять по всем ценам, учитывая продажи.
еще раз- определитесь что вы хотите.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35874710
Нужно, например, отсортировать вышеприведенную таблицу по цене, чтобы вывести все товары в порядке возрастания цены. Как это сделать? Как вообще сравнить первое и последнее значения?
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35875006
egorych
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
среднее арифметическое не спасёт?
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35875117
Среднее арифметическое не учитывает разброс интервального значения относительно среднего. Например, из двух значений 4400-4900, 4600-4700 второе - более точное. Если брать среднее, то
цена1=4650, цена2=4650, то есть эти два значения равны. При этом интуитивно ясно, что второе значение информативнее. А если вспомнить, про что я писал в первом посте (пример с товарами все же несколько надуманный, я хочу найти аналогию, может будут мысли), то ситуация вообще отличается, поскольку там только одно "реальное" значение.

Что по этому поводу говорят книжки. Отыскал книгу "Теория возможностей" ещё прошлого века и там рассматриваются нечеткие базы данных. Насколько я понял из беглого просмотра, предлагается использовать две меры того, что один интервал больше другого: мера необходимости и мера возможности. Кто-нибудь юзал что-то подобное или это все на уровне теории?
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35875377
Фотография S.G.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ну сортируйте по двум признакам- 1.среднее и 2.разница между max и min значением.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35875446
Непонятно соврешенно, зачем вам вооще нечеткая сортировка? она все равно ФАКТИЧЕСКИ будет четкой. Так как если одно значение попадает в оба, а вы хотите выбрать наиболее точный, то вы все равно задаете ПРАВИЛО попадания в ОДИН интервал. Так зачем вообще иметь нечеткое разделение? Если вс еравно вы относите к одному интервалу.
Если в существующий четкий набор интервало вводится новый - пересекающийся, то надо пересчтать заново новые ЧЕТКИЕ интвервалы.
Таким образом всегда надо иметь четкие интервалы. Правило пересчета, как я понимаю, несложное. Правило 1. Если один интеврал полностью попадает внутрь другого, то больший интверавл делим на 3 (границы очевидны). 2. если новый интервал пересекает один и другой, то в первом оставляем один - с уменьшенной верхней границей (нижняя граница нового интвервала), далее новый интервал, далее остаток от второго интврвала. 3. если новый интвервал полностью покрывает один. то - принимайте решение или делить новый, или выбрасывать сатрый.
ну может правила можно упростить -обощить - надо чуть подумать ..
но в реальности вы всегда выбираете ОДИН интервал, поэтому и работать надо с непротиворечивыми и ПОЛНЫМИ интервалам (т.е. когда весь диапазон покрыт интвервалами)
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35880293
Цитата:
------------------------------------------------------------
Таким образом всегда надо иметь четкие интервалы. Правило

пересчета, как я понимаю, несложное. Правило 1. Если один интеврал

полностью попадает внутрь другого, то больший интверавл делим на 3

(границы очевидны). 2. если новый интервал пересекает один и

другой, то в первом оставляем один - с уменьшенной верхней границей

(нижняя граница нового интвервала), далее новый интервал, далее

остаток от второго интврвала. 3. если новый интвервал полностью

покрывает один. то - принимайте решение или делить новый, или

выбрасывать сатрый.
---------------------------------------------



Я не совсем понял, Вы предлагаете рассматривать пересекающиеся и

непересекающиеся части? И рассматривать их длину, чтобы выбрать

какая из них больше, соответственно по этому определить какой из

интервалов больше?

Думаю, что да, не получится сделать эту сортировку нечеткой. Надо пересмотреть мою задачу. Спасибо всем принявшим участие.
...
Рейтинг: 0 / 0
Нечеткая сортировка интервальных данных. Такое возможно?
    #35881428
Думаю, что да, не получится сделать эту сортировку нечеткой.


Ну что такое нечеткая сортировка не знаю, однако надо просто формализовать свое видение "нечеткой сортировки"
(ну хотя-бы на примерчике из тех-же 6-ти значений, что должно получиться в результате???)
и всё получится :)
...
Рейтинг: 0 / 0
22 сообщений из 22, страница 1 из 1
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Нечеткая сортировка интервальных данных. Такое возможно?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]