powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Загрузка произвольно структурированных данных из Excel
25 сообщений из 28, страница 1 из 2
Загрузка произвольно структурированных данных из Excel
    #32567231
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Часто бывает так, что данные в хранилище нужно загрузить из Excel, причем книги Excel имеют произвольную структуру, но утвержденную на предприятии.
Например, один лист может фактически содержать пять разных отчетов, разной структуры с шапками, колонками, ИТОГО и проч. Другой лист может содержать другие таблицы, которые подчитывают данные из других Excel файлов и т.д.
Потом периодически эти Excel таблицы обновляются. Либо в них добоваляются строчки в отчеты, либо новые листы, либо происходит апдейт, либо еще как-то.
Причем вы не имеете права вносить никаих изменений в структуру Excel таблиц.
С этой проблемой наверное многие сталкивались.
Вопрос, кто как производит периодическую загрузку из таких таблиц?
Самый простой вариант - написать программу, которая "знает" структуру конкретного листа, разбирает его и кладет данные в СУБД.
Но если Excel таблиц десятки и сотни, - это становится проблемой.
Может быть есть другие варианты?
Может есть средства метаописания структуры таких документов для последующей загрузки?
Кто что думает по этому поводу?
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32567400
Фотография Гликоген
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
у DataJunction есть тул для подобных целей для формата TXT.
Наверное должно быть и для Excel.
Если нет у них - идете и перебираете существующие ETL на предмет.
http://datawarehouse.ittoolbox.com/nav/t.asp?t=379&p=379&h1=379
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32567566
Фотография Jimmy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вот, когда то делал так: Считывание информации в БД из документов EXCEL произвольной формы.

------------
"Продается каменный дом на дрова", обращаться к Jimmy
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32567637
Alex_D
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Предложение на уровни идеи и только ...

1. Создать гетерогенный сервис к Excel.
2. Подгрузить весь лист Excel в таблицу Oracle следущей структуры:
id - номер строки в файле.
a - первый столбец
b - втрой столбец
и т.д.
3. Дальше уже средствами SQL и PL/SQL - вытаскивать отттуда данные.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32567855
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Alex_D

Это снимет проблему написания внешнего приложения, но по-моему написать разбрщик проще на VBA или другом средстве, котрое знакомо с OLE, чем на PL/SQL.

В общем проблема с большим количеством софта по разбору, а уж на чем он будет написан - на PL/SQL или VBA - не так важно.

Да и не уверен, что любую Excel таблицу можно закачать через HS.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32567924
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Jimmy

Хорошая идея, правда не всегда работает, особенно в случаях когда нельзя вносить изменения в документы.
Еще часто бывает что сами юзера Excel вносят комментарии. Как быть в этом случае?
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32567979
DimaR
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
to Birkhoff
Ну на PL/SQL тоже можно работать с Excel файлами через ORDCOM
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32568959
Фотография Jimmy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Birkhoff
Еще часто бывает что сами юзера Excel вносят комментарии. Как быть в этом случае?
Конечно, это - не "серебряная пуля", но можно сделать следующее:
1. Закзачику предъявляется документ, регламентирующий форму и состав Excel таблиц, т.е. : "Система будет рабоать в том случае, если будут выполняться наши рекомендации"
2. Защитить лист, причем, только объекты - соответствующая галочка устанавливается в диалоге защиты. В этом случае комментарии добавить нельзя, а менять содержимое ячеек можно.
3. Для идентификации использовать комментарии особого вида, например "№4546464№"



------------
"Продается каменный дом на дрова", обращаться к Jimmy
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569443
Владимир Иванов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Birkhoff
При всем моем уважении, но мне кажется вы ставите вопрос как программист, а не как поставщик решения.
Я не позавидую тем кто будет сопровождать такую систему, где из груды хлама что-то генерируется. Причем недрение отчетности поверх бардака, только усугубит бардак.

Мне довольно часто приходится сталкиваться с такой проблемой. Каждый раз я советую отказаться от использования Excel как средства ввода и быстро создать простейшую БД хоть на Access для основного источника ввода данных. Сначала слышны вопли "да у нас тысячи форм в Excel, мы будем переходить в БД тысячу лет" и т.д. и т.п. Однако практика показывает, что это все разговоры в пользу бедных, точнее людей которые не хотят ни чего менять.
На практие даже технологически сложные объекты, как строительство многосекционного дома, строительство GSM-сети, производство красителей, сахароварение, производство кирпичей, термоблок АЭС используют всего около 100-120 видов учетных форм.

Повторить 100 форм Excel в Access можно проручить группе студентов. Работа муторная, но весьма простая и решает за счет наваливания массой дешевых девелоперов. Причем при реализации такой простенькой БД как правильно число форм падает до 40, т.к. уходит дубляж.
По моей практике такой проект перевода форм в Access под MS SQL заканчивается быстрее проекта создания самой BI-системы.

Данные за старые периоды можно импортировать также используя группу студентов. Это низкоквалифцированная и дешевая работа. Главное сделать ее один раз. Опятьже проект импорта Командой 2 завершается быстрее проекта BI-системы.

Иногда клиент боится пойти данным путем. Сравнивая оба подхода, могу сказать что система которую оставили на Excel представляет собой в сопровождении ночной ужас и главное наследует все маразмы неструктуированной информации. Кроме того, пользователи это люди и делают массу невероятных ошибок во вроде бы стандартных формах.

Чтобы клиента убедить пойти правильным путем иногда нужно привлечение опытного консультанта по управленческому учету. С этого в любом случае надо начать. Могу посоветовать для этой работы E и J, или кого-то из наших консалтеров-партнеров. Например, ПАКК.
Программерский подход ведет в тупик. Это точно.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569543
Bill_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Совершенно согласен по существу с Владимиром Ивановым. Задача эффективной автоматизации при отсутствии обратной связи принципиально не решаема. Первичные данные не должны вводиться в Эксель, поскольку она предназначена для ввода данных в произвольной форме. На развивающемся предприятии структура информации быстро усложняется и ситуация с разбором первичных данных неизбежно выйдет из под контроля.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569598
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Владимир Иванов

Это конечно хороший подход, на предложение подключить к хранилищу еще один (из многих) источников, но, к сожалению сделанный, на Excel, вы говорите, да ну нафиг ваш Excel, давайте реинжиниринг бизнес проецессов проведем в нескольких подразделениях, которые понятия не имеют, что их данные загружаться будут в хранилище.
Тут несколько моментов бывает.
В больших компаниях, бюджеты у различных подразделений разные, (вам ли это не знать), и интересы разные. Часто бывает, что строится хранилище в интересах одного подразделения, а им нужна часть данных из другого. Бюджет проекта тоже локальный для заказывающего подразделения. И вот в этом случае, если им нужны чужие данные, то дать им на почитать свою табличку какие-нибудь "Финансы" может дадут, но переделывать что-то в своей работе не будут, так как им ни смысла ни интереса от этого нет.
То о чем вы говорите, работает в случае высокобюджетного проекта, который захватывает многие подразделения и в котором многие заинтересованы. Но такое бывает далеко не всегда.
Второй вариант - какое нибудь внешнее агентство, или даже забугороное подразделение компании поставляет данные в Excel, а вы хотите их загрузить себе - не будут они для вас переводить их в Access, какой им в этом интерес? Как ради вашего локального хранилища заставить HQ поменять формат данных?
Они и не подозревают о том, что вы существуете вообще.

Третий вариант- данные консолидируются со всей страны, региональные подразделения имеют одно рабочее место, и человека, который умеет вбить данные за неделю в Excel в заранее созданный шаблон и отправить дискету по почте, так как интернета там нет. Как изменить всю технологию ради одного мелкого проекта по построению ХД, переобучить, переоснастить? да еще Access таблица может на дискету не влезет.

Считайте это разговорами в пользу бедных, я же считаю, что иногда изменения будут очень дорогими, несопоставимо с тем, сколько стоит ваше ХД. Либо сделать это политически маловеротяно.
Я прекрасно понимаю, что лучше хранить данные в Access, чем в Excel, и что в длительной перспективе это приведет в тупик.

В любом случае, вопрос, который я задал - чисто технический, программистский, если хотите. Давайте просто исходить из того, что в силу каких то причин, нельзя отказываться от Excel, не важно почему.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569645
Владимир Иванов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Birkhoff
Вы еще раз подтвердили что решение не технологическое, а полическое.
Полическое решение вам не пробить. Однако есть люди, чья работа пробивать правильные политические решения и задачи которые при этом они решаю гораздо сложнее обрисованных вами. Еще раз посоветую позвать таких людей, т.е. проф. упр. консалтеров. И не надо думать, что они "потырят" проект. Они не IT-шники, это не их бизнес.

Технологическое решение если "сказали Excel" снова превращается в полическое. Надо понять что Excel в крупной организации это ворох разных форматов и "серебрянной пули", чтобы эту проблему мог решить один, пусть даже многоопытный разработчик, нет. Эту задачу (интеграция с конкрентными формами в Excel) надо срочно аутсорсить студентам. В противном случае в этом болоте погрязнешь с любой технологией. Опять же решение политическое.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569678
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Владимир Иванов

Ничего я не подтверждаю, я привел несколько абстрактных примеров, хотя и основанных на опыте. Все упирается в цену вопроса, если проект стоит допустим 20 000, а для того чтобы все было "красиво" нужно потратить плюс к этому дополнительно 100 000, никто на это не пойдет, да и ваши "профессионалы"-политики нахаляву редко работают.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569738
Владимир Иванов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вы кажется переоцениваете сложность (стоимость) БД заменяющей Excel. Это просто формы ввода со списками документов. В 80% это просто копии тех же файлов в Excel по форме. Построить нормальный workflow или ERP тут не цель.
Поделюсь оценками бюджетов по сходному проекту (сходная цена $20000)
60% - само BI-решение
15% - БД для замены Excel
25% - разовый импорт данных за прошлые годы из Excel

Следует также учесть, что само BI-решение удешевилось не менее чем на 20%, т.к. упростилось создание DWH и фильтрация грязных данных.
Годичный сапорт системы с некоторыми доработками за границами сапорта составил 40% от ее разработки.

Для сравнения сапорт Excel-based системы составил 150% от первоначального бюджета и это был сплошной workaround, а не новые фичи.

Иными словами разработка БД даже в рамках BI-проекта окупается у клиента за 4-6 месяцев (имеются в виду доп затраты).

Консультанты. Разовая консультация стоит около $1000/день, но $10 тыс/мес.
Однако для принятия решения часто достаточно 2х дневной консультации с заключением на 1 стр. Это доп. $3000. Незначительный расход даже для проекта в 20 тыс, т.к. такие суммы обычно выносят в отдельный бюджет.
Полную постановку и регламенты вам сделают за 1 мес. Конечно это целесообразно в проектах от $50 тыс. В моей практике я полностью скидываю упр. постановку в проектах дороже $100 тыс. У каждого свое дело, не стоить стараться быть лучшим во всем. По таким проектам, я КРАЙНЕ доволен результатами консультантов ПАКК. На моей практике едвали не единственная компания дающая нормальный консалтинг и аудит, а не разводку клиента на деньги под этим соусом.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569814
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А что если Excel используется не просто как форма ввода, но и как форма отчетности?
Лежит себе куча документов Excel, в которые данные собираются из других Excel по сети, каждый лист содержит кучу табличек, графиков трендов и проч. кухни. Проект по переносу этого в Access плавно перетекает в проект по перепостроению системы сбора данных и отчетности, что обычно гораздо дороже чем DWH.

И опять я не получил ответа на вопрос: с какого перепуга, например финансисты которых все устраивает, будут затевать проект по переводу своей системы сбора и обработки информации на новые технологические рельсы ради того, чтобы маркетологам было удобнее грузить данные в свое хранилище?
Ситуация: маркетологи смогли выбить из своего руководства 20000 и не больше для построения хранилища для себя, а тут приходят консультанты все в белом и говорят - это, ребятки, полная фигня и бесперспективщина, что вы тут делаете, - надо перестраивать всю систему, начиная с финансистов и кончая головным офисом в Лондоне, а если вы этого не хотите делать, то мы отказываемся что то делать, так как это противоречит нашим эстетическим воззрениям. Ищите студентов :)

Такое впечатление, Владимир, что вы никогда не внедряли локальных решений в больших бюрократизированных конторах.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569923
Владимир Иванов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Birkhoff
Коллега, конечно я внедрел системы у условиях работы когда за стенкой сидят "чужые люди". Однако раз они такие умные, пусть их IT-отдел и конвертирует в стандартный формат. Сам ты утверждаешь 2-3 стандартных формата и делаешь верификацию. Отклонились - в сад. Нагрузка на сапорт будет все равно большая.

Потом, существенная разница в наших подходах, что я сам решаю инициализировать проект или нет. В ситуации когда я буду способствовать бардаку в компании, я лучше откажусь от денег. Пройдет год и от твоей репутации мало что останется.

Сейчас ко мне со сходной проблемой подкатилась весьма известная строительная компания. Однако когда ситуацию с Excel-хранением они сами охарактеризовали "мы как пауки в банках.. четырехкратных ввод... управляющего меняют 1н раз в год..." я скинул их на консалтинг и не жалею.

Придет и мое время там.

Если касаться вашего подхода, то скинуть формы в Excel обратно из Access очень просто. Можно формулы на лист с RS настроить на той же форме. Можно через MS RS генерить.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32569956
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я понял вашу мысль.
Конечно, лучше быть богатым и здоровым, чем бедным и больным. Но жизнь - штука сложная, и такое происходит не всегда.
Вы приводите примеры, когда все страдают и вы их освобождаете от страданий.
Но иногда бывает что сложилась ситуация, когда более менее всех все устраивает никто особо не страдает, единственный у кого проблемы, это у внедренца, когда нужно связать данные из разных подразделений.

Я только рад за вас, что вы можете выбирать за какие проекты браться а от каких можно отказаться без потерь.

Но мы отклонились от темы вопроса. Видимо все-таки нет внятных средств для решения таких проблем.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32570063
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Birkhoff
Но мы отклонились от темы вопроса. Видимо все-таки нет внятных средств для решения таких проблем.

Лучшее средство от головняка - топор в руках мясника :-)

Во всем поддерживаю Иванова и вынужден в этот раз не согласится с вами.

Я бы сказал тем кто хочет загонять первичку в Excel а потом грузить данные в хранилище:
-если вы такие "бедные и умные", а в действительности жадные и близорукие и хотите дальше тюкать в Excele - тогда стройте и отчетность в Excele.

-а если хотите жить как взрослые дяди с DWH, OLAP и т.п. то заведите OLTP, хоть на аксессе, хоть на фоксе, хоть на DB2.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32570103
Фотография Jimmy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Владимир Иванов и др.
Что меня радует в жизни, так это советы такого плана: "Вас не устраивают "Жигули"? Так купите "Мерседес"!"

Коллеги,
Человек излагает свою проблему и просит помочь в ее решении, а не получить кучу отвлеченных рассуждений на тему: "как было бы хорошо, если бы..."
Я уверен, что Birkhoff, будь у него время и желание, сам бы смог вам рассказать о том, как все хорошо может быть в жизни.

ЗЫ Раздражают бесполезные пикировки.


-------
<Jimmy>
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32570116
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Это вы не со мной не соглашаетесь, а со сложившимися ситуациями :)
По-вашему, я похож на мазохиста?
Проблема то озвученная тут в чем:
Есть сложившаяся инфраструктура (политическая, техническая, экономическая). Вам предлагается сделать частное решение.
У вас выбор либо браться за это, либо нет.

Не всегда правильно начинать обливать грязью все что сделано на предприятии и призывать все менять.
А если данные лежат на старом менйфрейме типа ЕС ЭВМ (или чуть поновее), тоже надо говорить, мол, вы сначала замените это старье, а потом работу предлагайте нам, крутым консалтерам?
Я понял, что г-н Иванов предпочитает отказаться от проекта, если красота решения у него вызывает сомнения. Хотя например если данные автоматом собираются в защищенную таблицу Excel из кучи других защищенных, в эту таблицу никто руками никогда не лезет, не думаю что эта таблица так уж ненадежна. Хотя конечно предпочтительнее использовать хотя бы тот же Access.
К слову, у нас на рынке представлено несколько компаний, которые предлагают свои решения, например бюджетирования, построенные на хитром наборе Excel таблиц. И без заказов не сидят.
А если из этой системы выгрузить данные, получается нужно послать к черту этих разработчиков, сказать вы сначала научитесь делать нормальные системы, а потом мы к ним цепляться будем?

Ладно, я уже понял, что я единственный, кто с такими ситуациями сталкивался, ну может быть Jimmy и Alex_D еще :)
Нормальные пацаны если видят Excel - даже близко к проекту не подходят. :)
Их право, если есть выбор. :)
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32570125
Владимир Иванов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Birkhoff

Критикуя ваш подход, забыл что мы делали проект, опыт которого может быть полезен.

Цель проекта - автоматизация бюджета Cash Flow в плане workflow на электронных подписях и отчетность в OLAP для принятия решений.
Одно из ключевых требований клиента, было сохранить формы заявок в Excel и одной самописной БД. Заявки в Excel имели важные поля для обоснования платежей. Я согласился, т.к. формы в Excel были очень жесткие и их было всего 7 штук.

Собственно решение.
Подключение к Excel и базке делалось через MS InfoPath.
Далее информация грузилась в MS SharePoint Portal.
Чуть позднее между ними поставили MS BizTalk
Отченость строилась прямым доступом в таблицы MS SharePoint Portal.
На MS SharePoint Portal был сделан workflow для электронных подписей и цивилизованное хранилище для Excel-документов.

Дешево и очень сердито, внедрение очень быстрое - 2 мес.
Может пригодится такой подход.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32570142
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Владимир Иванов

О. Это уже кое-что :) Сами не без греха оказывается. :)
Спасибо за идею насчет Infopath, его я не ковырял.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32570244
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть сложившаяся инфраструктура (политическая, техническая, экономическая). Вам предлагается сделать частное решение.
У вас выбор либо браться за это, либо нет.


Для того что бы принять решение надо оперировать конкретными данными, тогда в зависимостои от расклада может быть и стоит тянуть прикуп на себя.

Не всегда правильно начинать обливать грязью все что сделано на предприятии и призывать все менять.

Мы же не застолом переговоров, чтоб распыляться в дипломатических реверансах. Поэтому можно смело называть вещи своими именами.

А если данные лежат на старом менйфрейме типа ЕС ЭВМ (или чуть поновее),

Ну это на порядок проще Excel.

Ладно, я уже понял, что я единственный, кто с такими ситуациями сталкивался, ну может быть Jimmy и Alex_D еще :)
Нормальные пацаны если видят Excel - даже близко к проекту не подходят. :)
Их право, если есть выбор. :)


Грешен, тянул и тяну данные из Excel с помощью DTS - не сахар, но жить можно.
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32570264
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 backfire

Да кто же спорит, жить всегда можно, если помнить о рисках :)
...
Рейтинг: 0 / 0
Загрузка произвольно структурированных данных из Excel
    #32570286
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 backfire

Мы же не застолом переговоров, чтоб распыляться в дипломатических реверансах. Поэтому можно смело называть вещи своими именами.

Сначала-то как раз стол переговоров возникает. Когда узнаешь что надо сделать.
Ну допустим, согласятся они, что все у них неправильно. Что дальше? Менять все равно ничего не будут. А обидеться могут. Особенно если отношения находятся в состоянии становления. Или сами от тебя откажутся или осадок останется, потом будешь объяснять что ничего личного не было :) А всего-то из за ерунды.
Критиковать можно, когда в этом есть смысл. А так, - только заказчика потенциального злить.
...
Рейтинг: 0 / 0
25 сообщений из 28, страница 1 из 2
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Загрузка произвольно структурированных данных из Excel
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]