|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Доброго времени суток, коллеги! Есть задача - загрузить информацию из XML (ЕГРЮЛ, если точнее) в базу на PSQL Создана таблица: Код: sql 1. 2. 3. 4. 5. 6.
Есть запрос: Код: sql 1. 2. 3. 4. 5.
Результат запроса: ERROR: ОШИБКА: could not parse XML document DETAIL: line 1: Unsupported encoding windows-1251 <?xml version="1.0" encoding="windows-1251" ?><EGRUL ДатаВыг="2020-01-01"><СвЮЛ ^ SQL-состояние: 2200M В каком направлении копать? для справки: PostgreSQL 12, база, сервер и клиент на WIN1251 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.05.2020, 17:22 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Пересохраните файл в utf8 и пропишите encoding="utf-8" ... |
|||
:
Нравится:
Не нравится:
|
|||
31.05.2020, 17:45 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Guzya, Это было бы хорошее и рабочее решение, но к сожалению таких файлов 11684 штуки, общим весом 121 Гб. Нужно другое решение. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.05.2020, 17:49 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
DETAIL: line 1: Unsupported encoding windows-1251 Это отвечает непосредственно libxml2. Про что сказано : libxml2 has a set of default converters for the following encodings (located in encoding.c): UTF-8 is supported by default (null handlers) UTF-16, both little and big endian ISO-Latin-1 (ISO-8859-1) covering most western languages ASCII, useful mostly for saving HTML, a specific handler for the conversion of UTF-8 to ASCII with HTML predefined entities like © for the Copyright sign. More over when compiled on an Unix platform with iconv support the full set of encodings supported by iconv can be instantly be used by libxml. On a linux machine with glibc-2.1 the list of supported encodings and aliases fill 3 full pages, and include UCS-4, the full set of ISO-Latin encodings, and the various Japanese ones. Видимо, учитывая наблюдаемую ошибку, на вашей платформе libxml2 не поддерживает такую кодировку. Что, конечно, не является ошибкой: парсеры XML обязаны поддерживать UTF8 и UTF16, а всякое прочее - если захотят. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.05.2020, 18:32 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Melkij, Спасибо, за разъяснение Может есть рабочее решение этого вопроса? Авторство файлов у Налоговой, так что какие есть с такими и придется работать Конвертировать при загрузке? Но тогда как? Каким инструментом пользоваться? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.05.2020, 18:39 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Напишите скриптик, который будет делать, то, что я описал выше. Вы на какой ОС работаете? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.05.2020, 20:47 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Guzya, На Win10 Подумываю на SQL Server от мелкомягких переползти, хотя ох как не хочется Postgre роднее что-ли ... |
|||
:
Нравится:
Не нравится:
|
|||
01.06.2020, 13:45 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Можете дать файлик для экспериментов? ... |
|||
:
Нравится:
Не нравится:
|
|||
01.06.2020, 15:11 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Guzya, держите на удивление нашел до 150Кб остальные в среднем от 8 до 12 МБ ... |
|||
:
Нравится:
Не нравится:
|
|||
01.06.2020, 15:56 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Guzya, Вот это дело Вот что значит, когда руки растут из нужного места!) Огромейнейшее спасибо!!! ... |
|||
:
Нравится:
Не нравится:
|
|||
01.06.2020, 20:24 |
|
Проблема с кодировкой WIN1251
|
|||
---|---|---|---|
#18+
Вы проверьте, что оно работает, а то мне особо не на чем было. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.06.2020, 21:15 |
|
|
start [/forum/topic.php?fid=53&msg=39965335&tid=1994664]: |
0ms |
get settings: |
11ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
39ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
46ms |
get tp. blocked users: |
1ms |
others: | 276ms |
total: | 407ms |
0 / 0 |