Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Datastage
|
|||
|---|---|---|---|
|
#18+
utf8. Все основные европейские языки укладываются в два байта. Вся первая половина базовой плоскости - в три. Плюс - байтовый поток полностью совместимый со стандартным CRT. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2014, 23:10 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
HunterikВ администраторе DataStage тоже выставьте MS1251-CS (General->NLS->Client), перезапуск Desinger после этого обязателен. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.07.2014, 12:30 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Про UTF8 - я в курсе. Техническая сторона интересует, т.к. не работаю с Datastage... Я правильно понимаю,нужно поменять в администраторе DataStage General->NLS->Client на UTF8? Кроме того, в Datastage File тоже должен быть установлен UTF8? Спасибо за ваши ответы... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.07.2014, 12:40 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Предположим вы решили перейти на обработку в utf8, для этого: 1. Вы переводите ПРОЕКТЫ DataStage на работу в UTF8 (выбираете проект->NLS->Server Maps+Parallel Maps) 2. Эта настройка автоматически унаследуется на нижних уровнях где оставлены значения по умолчанию (Project Default), там где нзначения менялись пользователем - всё сохранится. Прочитайте, что я писал раньше про переопределение на нижних уровнях... Например, если придёт файл в 1251 - вы сможете его прочитать заданием, работающим в utf8 в проекте с utf8, только надо будет элементу, читающему данный файл указать, что файл в соответствующей кодировке, чтобы чтение прошло корректно. Разберётесь с примером, что я вчера выложил - будет понятнее. 3. Client настраивается так, чтобы бы корректно происходило взаимодействие и отображение символов. У меня 1251 при utf-ных серверах, но я работаю только с русским и английским (без национальных спец.симолов вроде умляутов), у себя - "будете посмотреть", может и utf8 поставите. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.07.2014, 15:05 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Hunterik, cпасибо вам большое. Завтра попробую ваше решение... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.07.2014, 19:27 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Hunterik, попробовали загрузить твой файл в версии 8.0.1. получили ошибку: HCA.dsx does not appear to be a valid DataStage export file or is from an incompatible release. A valid DataStage export file is expected to be in Windows format (i.e. using CRLF line terminators). При попытке поменять настройки клиента (Administrator Client->General->NLS) на UTF8, получили ошибку: Map 'UTF8' is unsuitable for client/server use - Does not map the UniVerse mark character IM to a single byte Завтра будет возможность попробовать на версии 8.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.07.2014, 12:47 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Hunterik, Какая версия Dstage у Вас? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.07.2014, 14:03 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Очень плохо, что вы мечетесь и пробуете всё подряд. Менять один параметр за раз! У меня 8.7 и 9.1, вам делал на 9.1 - что под рукой было, на 8.7 импортируется. Предлагаю вам попробовать следующую последовательность действий: 1. Выставляете Client/Server в Administrator как он у вас был (WIN1252-CS?) - соответствие кодировке Windows. У вас Windows в какой кодировке - 1252? 2. Пробуете импортировать, далее, смотря, что получаете. Если будет крик о несоответствии версий, то можете попробовать открыть dsx и поправить Server version на 8.5. Вообще, официально, переход с даунгрейдом версий не поддерживается, но версий, соответствующих вашим у меня нет. От 8.0.1 отказались - эта версия снимается с поддержки вот-вот, а 8.5 - это промежуточная версия между очень хорошим 8.7 и стареющими 8.0-8.1: Withdrawal from support Program number VRM date Program release name 5724-Q36 8.1.2 04/30/15 IBM InfoSphere Information Server 5724-Q36 8.0.1 09/30/14 IBM InfoSphere Information Server ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.07.2014, 15:01 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
И вообще, давно есть 9.1.2, а неделю назад IBM запилила 11.3! =) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.07.2014, 15:04 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
HunterikПредположим вы решили перейти на обработку в utf8, для этого: 1. Вы переводите ПРОЕКТЫ DataStage на работу в UTF8 (выбираете проект->NLS->Server Maps+Parallel Maps) 2. Эта настройка автоматически унаследуется на нижних уровнях где оставлены значения по умолчанию (Project Default), там где нзначения менялись пользователем - всё сохранится. Прочитайте, что я писал раньше про переопределение на нижних уровнях... Например, если придёт файл в 1251 - вы сможете его прочитать заданием, работающим в utf8 в проекте с utf8, только надо будет элементу, читающему данный файл указать, что файл в соответствующей кодировке, чтобы чтение прошло корректно. Разберётесь с примером, что я вчера выложил - будет понятнее. 3. Client настраивается так, чтобы бы корректно происходило взаимодействие и отображение символов. У меня 1251 при utf-ных серверах, но я работаю только с русским и английским (без национальных спец.симолов вроде умляутов), у себя - "будете посмотреть", может и utf8 поставите. Попытался сделать, все как вы сказали 1. Загрузить Ваш файл 2. Клиента перевести на UTF8 Кодировка Client/Server в Administrator WIN1252-CS. Windows должен быть 1252. Dstage у коллеги проинсталирован. Будем пробовать Ваш файл в 8.5 загрузить. Я их тоже спросил, почему старую версию используют. Говорят, что через пару месяцев будут переходить на 9.1 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.07.2014, 17:52 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Если приложение не юникодное, то принимать windows-1251 при системной windows-1252 оно не обязано. "Язык неюникодных приложений" можно выбирать независимо для системы (пусть остаётся 1252) и для пользователя (отдельная учётка с 1251). Как вариант. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.07.2014, 18:20 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Hunterik, Ваш пример работает на 8.5. Но это немного другое решение проблемы. Вы чиаете всю строку в Stage File, а затем разбиваете ее на 3 поля. Можно ли, без прмежуточных шагом, читать файл в Stage File, состоящий из 3 полей??? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.07.2014, 18:43 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Technote (FAQ) Using IBM InfoSphere DataStage to read in UTF8 data as fixed length Question Can the DataStage sequential file stage be used to read in UTF8 data as fixed length? Answer UTF-8 is not a fixed size character set, characters may be 1, 2 or 3 bytes long. The server sequential file stage is not capable of handling this format as the columns are fixed width at the byte level. So a given column must be n bytes wide. Clearly this will only work with fixed width character sets. Neither a server nor a parallel job sequential file stage can cope with a fixed-width file where the row length is not also a fixed number of bytes. Both of them take "fixed width" to mean that each column is a fixed number of bytes, not characters. Which means that they cannot work with an NLS map where the character length is not the same as the byte length (such as UTF8). This applies when the data has 2-byte UTF8 chars combined with single byte characters. The only way of processing such a file is to change the job to read it as a single variable-length column per row (assuming there is a row delimiter such as newline), using a UTF8 map. Then have a Transformer stage that uses substringing to substring the row into each column. There is also a column import stage that would allow the data to be split into columns after reading it in as UTF8, but this would only be available in a parallel job. Source: http://www-01.ibm.com/support/docview.wss?uid=swg21455000 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.07.2014, 19:54 |
|
||
|
Datastage
|
|||
|---|---|---|---|
|
#18+
Hans Christian Andersen, ну собственно да. Я попробовал читать только с использованием SeqFile - для fixed length полей не пошло, а так как время дорого - сделал, как делаю обычно - прочитал файл строками, а разбираю уже позже в Import Column Stage. =) Кстати, именно такой способ чтения является довольно хорошим по производительности при работе с большими файлами, за счёт распределения процесса чтения и парсинга. Трансформер, кстати, несмотря на то, что его в техноте ставят, как альтернативу, будет работать медленнее, чем Import Column за счёт того, что вы будете делать множество обращений вида column[m,n] - для трёх полей не так критично, для большого количества полей, трансформер существенно проиграет. =) Тема закрыта? =) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.07.2014, 22:06 |
|
||
|
|

start [/forum/topic.php?fid=43&msg=38688496&tid=1601038]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
77ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
53ms |
get tp. blocked users: |
1ms |
| others: | 277ms |
| total: | 452ms |

| 0 / 0 |
